Egy évvel ezelőtt lemaradtam az egyik legjobb informatikai programról Kanadában. Elkezdtem létrehozni saját adattudományi mesterképzésemet online források felhasználásával. Rájöttem, hogy ehelyett mindent megtanulhatok az edX, a Coursera és az Udacity révén. És gyorsabban, hatékonyabban és a költségek töredékéért megtanulhatnám.
Most már majdnem kész vagyok. Számos adattudománnyal kapcsolatos tanfolyamot vettem igénybe, és még sok más részét auditáltam. Ismerem a lehetőségeket, és azt, hogy milyen képességekre van szükség a tanulók számára, akik adatelemzői vagy adattudós szerepre készülnek. Néhány hónappal ezelőtt elkezdtem egy áttekintésvezérelt útmutató készítését, amely az adattudomány minden egyes tantárgyának legjobb tanfolyamait ajánlja.
A sorozat első útmutatójához néhány kódolási osztályt ajánlottam a kezdő adattudós számára. Akkor statisztikai és valószínűségi osztályokról volt szó.
Most az adattudomány bemutatására.
(Ne aggódjon, ha nem biztos abban, hogy mit jelent az adattudományi kurzus bevezetése. Röviden elmagyarázom.)
Ehhez az útmutatóhoz több mint 10 órát próbáltam azonosítani a 2017 januárjától felajánlott minden online bevezetőt az adattudományi tanfolyamokhoz, kiemelt információkat gyűjtöttem tanterveiből és áttekintéseiből, és összeállítottam értékelésüket. Ehhez a feladathoz nem máshoz fordultam, mint a nyílt forráskódú Class Central közösséghez és annak adatbázisához, amely természetesen több ezer értékelést és értékelést tartalmaz.

2011 óta a Class Central alapítója, Dhawal Shah jobban figyelemmel kíséri az online tanfolyamokat, mint vitathatatlanul bárki más a világon. Dhawal személyesen segített nekem összeállítani az erőforrások listáját.
Hogyan választottuk meg a megfontolandó tanfolyamokat
Minden kurzusnak három kritériumnak kell megfelelnie:
- Meg kell tanítania az adattudomány folyamatát. Nemsokára erről.
- Igény szerint igényelhető, vagy néhány havonta felajánlva.
- Interaktív online tanfolyamnak kell lennie, tehát nincsenek könyvek vagy csak olvasható oktatóanyagok . Bár ezek életképes módszerek a tanulásra, ez az útmutató a tanfolyamokra összpontosít.
Úgy gondoljuk, hogy minden figyelemre méltó tanfolyamot bejártunk, amely megfelel a fenti kritériumoknak. Mivel látszólag több száz tanfolyam létezik az Udemy-n, úgy döntöttünk, hogy csak a legértékeltebb és a legmagasabb besorolásúakat vesszük figyelembe. Mindig van rá esély, hogy mégis elmulasztottunk valamit. Tehát kérjük, tudassa velünk a megjegyzés rovatban, ha jó tanfolyamot hagytunk.
Hogyan értékeltük a tanfolyamokat
Összeállítottuk az átlagos besorolást és a Class Central és más áttekintő oldalak véleményeinek számát, hogy kiszámítsuk az egyes tanfolyamok súlyozott átlagát. Szöveges áttekintéseket olvastunk, és ezeket a visszajelzéseket használtuk a numerikus értékelések kiegészítésére.
Két tényező alapján készítettünk szubjektív tantervi bírálatokat:
1. Az adattudományi folyamat lefedettsége. A tanfolyam áthúzza vagy kihagyja bizonyos tantárgyakat? Túl sok részletességgel foglalkozik bizonyos témákkal? A következő szakaszban olvashatja el, hogy ez a folyamat mit tartalmaz.
2. Általános adattudományi eszközök használata. A tanfolyam népszerű programozási nyelvek használatával történik, mint például a Python és / vagy R? Ezek nem szükségesek, de a legtöbb esetben hasznosak, ezért enyhe előnyben részesítik ezeket a tanfolyamokat.

Mi az adattudományi folyamat?
Mi az adattudomány? Mit csinál egy adattudós? Ezek az alapvető kérdések, amelyekre az adattudományi kurzusnak meg kell válaszolnia. Joe Blitzstein és Hanspeter Pfister Harvard professzorok alábbi infografikája egy tipikus adattudományi folyamatot vázol fel , amely segít megválaszolni ezeket a kérdéseket.

Az adattudományi kurzus bevezetésével az a célunk, hogy megismerjük az adattudomány folyamatát. Nem akarjuk a folyamat egyes aspektusainak túlzott mélyreható lefedését, ezért a cím „intro to” része.
Minden szempontból az ideális tanfolyam a folyamat keretein belül elmagyarázza a legfontosabb fogalmakat, bevezeti az általános eszközöket és néhány példát (lehetőleg gyakorlati).
Csak bevezetést keresünk. Ez az útmutató ezért nem tartalmaz teljes körű szakterületeket vagy programokat, mint például a Johns Hopkins Egyetem Coursera adattudományi specializációja vagy az Udacity's Data Analyst Nanodegree. A kurzusok ezen összeállításai elkerülik ennek a sorozatnak a célját: megtalálni az egyes tantárgyak számára a legjobb egyéni tanfolyamokat, amelyek tartalmazzák az adattudományi oktatást. A cikksorozat utolsó három útmutatója részletesen kitér az adattudomány folyamatának minden aspektusára.
Alapvető kódolás, statisztika és valószínűségi tapasztalat szükséges
Az alább felsorolt tanfolyamok többsége alapvető programozást, statisztikát és valószínűségi tapasztalatot igényel. Ez a követelmény érthető, tekintettel arra, hogy az új tartalom ésszerűen fejlett, és hogy ezek a tantárgyak gyakran több tanfolyamot is szentelnek nekik.
Ezt a tapasztalatot a Data Science Karrier Útmutató első két cikkében (programozás, statisztika) szereplő ajánlásaink révén sajátíthatjuk el.
A legjobb bevezető az adattudományi tanfolyamra a következő:
- Adattudomány AZ ™: Valós életű adattudományi gyakorlatok is benne vannak (Kirill Eremenko / Udemy)
Kirill Eremenko Data Science AZ ™ az Udemy-n az egyértelmű nyertes a több mint 20 képzett kurzus adattudományi folyamatának szélességében és lefedettségében. 4,5 csillagos súlyozott átlagértéke meghaladja a 3071 értékelést, ami a vizsgáltak közül a legmagasabb minősítésű és legtöbbet értékelt tanfolyamok közé sorolja.
Vázolja a teljes folyamatot, és valós példákat mutat be. 21 órás tartalom esetén jó hosszúságú. A bírálók imádják az oktató kézbesítését és a tartalom szervezését. Az ár az Udemy-kedvezmények függvényében változik, amelyek gyakran előfordulnak, így akár 10 dollárért is vásárolhat hozzáférést.
Bár nem ellenőrzi a „közös adattudományi eszközök használata” jelölőnégyzetet , a nem Python / R eszközválasztásokat (gretl, Tableau, Excel) hatékonyan használják a kontextusban. Eremenko a következőket említi a gretl választás magyarázatakor (a gretl egy statisztikai szoftvercsomag), bár az összes általa használt eszközre vonatkozik (kiemelés az enyém):
A gretl-ben ugyanazt a modellezést tudjuk elvégezni, mint az R-ben és a Pythonban, de nem kell kódolnunk. Ez itt a nagy baj. Néhányan közületek már nagyon jól ismerhetik R-t, de mások talán egyáltalán nem. A célom az, hogy megmutassam, hogyan lehet robusztus modellt felépíteni, és olyan keretet adok Önnek, amelyet bármelyik választott eszközben alkalmazhat . A gretl segít elkerülni a kódolásunk elakadását.Az egyik prominens recenzens a következőket vette észre:
Kirill a legjobb tanár, akit online találtam. Valódi életpéldákat használ, és elmagyarázza a gyakori problémákat, hogy jobban megismerje a tanfolyamot. Sok betekintést nyújt abba is, hogy mit jelent adattudósnak lenni, az elégtelen adatokkal végzett munkától egészen a munkájának a C-osztály vezetőségének történő bemutatásáig. Nagyon ajánlom ezt a tanfolyamot kezdő hallgatóknak köztes adatelemzőknek!
Remek Python-központú bevezetés
- Bevezetés az adatelemzésbe (Udacity)
Az Udacity Intro to Data Analysis egy viszonylag új ajánlat, amely az Udacity népszerű Data Analyst Nanodegree része. A Python használatával világosan és koherensen lefedi az adattudomány folyamatát, bár a modellezési szempontból ez kevéssé hiányzik. A becsült idővonal 36 óra (heti hat óra hat héten keresztül), bár tapasztalataim szerint rövidebb. Két értékelésen felül 5 csillagos súlyozott átlagértékkel rendelkezik. Ingyen van.
A videók jól előállítottak, az oktató (Caroline Buckey) világos és személyre szabott. Sok programozási vetélkedő érvényesíti a videókban tanult fogalmakat. A hallgatók magabiztosan távoznak az új és / vagy továbbfejlesztett NumPy és Pandas készségeikről (ezek a népszerű Python könyvtárak). A végleges projekt - amelyet a Nanodegree osztályoz és felülvizsgál, de nem az ingyenes egyéni tanfolyamon - szép kiegészítő lehet egy portfólióhoz.

Lenyűgöző ajánlat, felülvizsgálati adatok nélkül
- Adattudományi alapismeretek (Big Data University)
A Data Science Fundamentals egy négyfolyamatos sorozat, amelyet az IBM Big Data University biztosít. Tartalmaz tanfolyamokat Data Science 101, Data Science Methodology, Data Science Hands-on with Open Source Tools és R 101 tanfolyamokkal.
Ez magában foglalja a teljes adattudományi folyamatot, és bemutatja a Python, R és számos más nyílt forráskódú eszközt. A tanfolyamoknak óriási termelési értéke van. A becslések szerint 13–18 óra erőfeszítéseket kell tennie, attól függően, hogy a végén elvégzi-e az „R 101” tanfolyamot, amelyre ez az útmutató nem szükséges. Sajnos nincsenek áttekintési adatai azokról a főbb áttekintő webhelyekről, amelyeket ehhez az elemzéshez használtunk, ezért a fenti két lehetőségnél még nem javasoljuk. Ingyen van.

A verseny
Az 1. számú választottunk súlyozott átlagos értékelése 4,5 csillag volt az 5-ből, több mint 3068 értékelés. Nézzük meg a többi alternatívát, csökkenő besorolás szerint rendezve. Az alábbiakban számos R-központú kurzust talál, ha be van állítva az adott nyelv bevezetése.
- Python az adattudományhoz és a gépi tanuláshoz Bootcamp (Jose Portilla / Udemy): Teljes folyamatlefedés eszközigényes fókuszálással (Python). Kevesebb folyamatvezérelt és sokkal inkább a Python nagyon részletes bevezetése. Csodálatos tanfolyam, bár nem ideális az útmutató terjedelméhez. Ez, hasonlóan az alábbi Jose R-tanfolyamhoz, megduplázódhat mind a Python / R, mind az adattudomány bevezetőjeként. 21,5 óra tartalom. Ez egy 4,7 -csillagos súlyozott átlagos értékelése felett 1644 értékelés alapján. A költségek a gyakori Udemy-kedvezmények függvényében változnak.
- Adattudomány és gépi tanulás Bootcamp R-vel (Jose Portilla / Udemy): Teljes folyamat lefedettség szerszámigényes fókusszal (R). Kevesebb folyamatvezérelt és inkább nagyon részletes bevezető az R. Amazing tanfolyamhoz, bár nem ideális az útmutató terjedelméhez. Ez, hasonlóan a fenti Jose Python-tanfolyamhoz, megduplázódhat mind a Python / R, mind az adattudomány intróként. 18 óra tartalom. Ez egy 4,6 -csillagos súlyozott átlagos minősítés felett 847 vélemény. A költségek a gyakori Udemy-kedvezmények függvényében változnak.


- Adattudomány és gépi tanulás a Python-nal - kézzel! (Frank Kane / Udemy): A folyamat részleges lefedettsége. A statisztikákra és a gépi tanulásra összpontosít. Tisztességes időtartam (kilenc óra tartalom). Python-t használ. Ez egy 4,5 -csillagos súlyozott átlagos értékelése felett 3104 értékelés alapján. A költségek a gyakori Udemy-kedvezmények függvényében változnak.
- Bevezetés az adattudományba (Data Hawk Tech / Udemy): Teljes folyamat lefedettség, bár a lefedettség korlátozott. Elég rövid (három óra tartalom). Röviden kitér mind az R-re, mind a Python-ra. Ez egy 4,4 -csillagos súlyozott átlagos minősítés több mint 62 értékelés alapján. A költségek a gyakori Udemy-kedvezmények függvényében változnak.
- Alkalmazott adattudomány: Bevezetés (Syracuse University / Open Education by Blackboard): Teljes folyamatlefedettség, bár nem egyenletesen elosztva. Nagy hangsúlyt fektet az alapstatisztikákra és az R.-re. Túlságosan alkalmazott és nem elég folyamat-fókusz az útmutató céljaira. Az online tanfolyam tapasztalata szétszakadt. Ez egy 4,33 -csillagos súlyozott átlagos értékelése felett 6 értékelés. Ingyenes.
- Bevezetés az adattudományba (Nina Zumel és John Mount / Udemy): Csak részleges folyamatlefedettség, bár az adatok előkészítésének és modellezésének szempontjai nagyon mélyek. Oké hossza (hat óra tartalom). R.-t használ. 4,3 csillagos súlyozott átlagos besorolással rendelkezik, 101 értékelés felett. A költségek a gyakori Udemy-kedvezmények függvényében változnak.
- Applied Data Science with Python (V2 Maestros / Udemy): Teljes folyamat lefedettség, jó mélységű lefedettséggel a folyamat minden aspektusához. Tisztességes hossz (8,5 óra tartalom). Python-t használ. Ez egy 4,3 -csillagos súlyozott átlagos minősítés több mint 92 értékelés alapján. A költségek a gyakori Udemy-kedvezmények függvényében változnak.

- Szeretne adatkutató lenni? (V2 Maestros / Udemy): Teljes folyamat lefedettség, bár a lefedettség korlátozott. Elég rövid (3 óra tartalom). Korlátozott eszköz lefedettség. Ez egy 4,3 -csillagos súlyozott átlagos minősítés felett 790 vélemény. A költségek a gyakori Udemy-kedvezmények függvényében változnak.
- Adatok betekintéshez: Bevezetés az adatelemzésbe (University of Auckland / FutureLearn): A lefedettség szélessége nem világos. Azt állítja, hogy az adatok feltárására, felfedezésére és megjelenítésére összpontosít. Nem igényelhető. 24 órás tartalom (heti három óra nyolc héten keresztül). Ez egy 4 -csillagos súlyozott átlagos minősítés több mint 2 vélemény. Ingyenes fizetős igazolással.
- Adattudomány-orientáció (Microsoft / edX): Részleges folyamat lefedettség (hiányzik a modellezési szempont). Az Excel programot használja, ami értelme van, mivel ez egy Microsoft márkájú tanfolyam. 12–24 óra tartalom (heti két-négy óra hat hét alatt). Ez egy 3,95 -csillagos súlyozott átlagos minősítés több mint 40 értékelés alapján. Ingyenes, ellenőrzött tanúsítvánnyal, 25 dollárért.
- Data Science Essentials (Microsoft / edX): Teljes folyamat lefedettség, jó mélységű lefedettség minden szempontból. R, Python és Azure ML (Microsoft gépi tanulási platform). Számos 1 csillagos értékelés az eszköz megválasztására (Azure ML) és az oktató rossz kézbesítésére hivatkozva. 18–24 óra tartalom (heti három-négy óra hat hét alatt). Ez egy 3,81 -csillagos súlyozott átlagos minősítés több mint 67 értékelés alapján. Ingyenes, igazolt tanúsítvánnyal, 49 dollárért.

- Alkalmazott adattudomány R-vel (V2 Maestros / Udemy): A fenti V2 Maestros Python tanfolyamának R társa. Teljes folyamat lefedettség, jó mélységű lefedettség a folyamat minden aspektusához. Tisztességes időtartam (11 óra tartalom). R.-t használ. 3,8 csillagos súlyozott átlagos besorolással rendelkezik, 212 értékelés felett. A költségek a gyakori Udemy-kedvezmények függvényében változnak.
- Bevezetés az adattudományba (Udacity): Részleges folyamatleírások, bár jó mélységűek a tárgyalt témákhoz. Hiányzik a feltárási szempont, bár az Udacity nagyszerű, teljes körű tanfolyammal rendelkezik a feltáró adatok elemzéséről (EDA). Azt állítja, hogy 48 óra hosszú (heti hat óra nyolc hét alatt), de tapasztalataim szerint rövidebb. Egyes vélemények szerint a fejlett tartalom beállítása nem megfelelő. Rendezetlen. Python-t használ. Ez egy 3,61 -csillagos súlyozott átlagos minősítés több mint 18 értékelés alapján. Ingyenes.
- Bevezetés az adattudományba a Pythonban (University of Michigan / Coursera): Részleges folyamatlefedettség. Nincs modellezés és vizualizáció, bár az Applied Data Science with Python Specialization 2. és 3. tanfolyama lefedi ezeket a szempontokat. Mindhárom tanfolyam elvégzése túl mélyreható lenne az útmutató céljai szempontjából. Python-t használ. Négy hét hosszú. Ez egy 3,6 -csillagos súlyozott átlagos minősítés több mint 15 értékelés alapján. Ingyenes és fizetett lehetőségek állnak rendelkezésre.

- Adatvezérelt döntéshozatal (PwC / Coursera): Részleges lefedettség (nincs modellezés) üzleti fókusszal. Számos eszközt mutat be, köztük az R, a Python, az Excel, az SAS és a Tableau. Négy hét hosszú. Ez egy 3,5 -csillagos súlyozott átlagos minősítés több mint 2 vélemény. Ingyenes és fizetett lehetőségek állnak rendelkezésre.
- Összeomlástanfolyam az adattudományban (Johns Hopkins Egyetem / Coursera): A teljes folyamat rendkívül rövid áttekintése. Túl rövid a sorozat célja szempontjából. Két óra hosszan. Ez egy 3.4 -csillagos súlyozott átlagos minősítés több mint 19 értékelés alapján. Ingyenes és fizetett lehetőségek állnak rendelkezésre.
- A Data Scientist eszköztára (Johns Hopkins Egyetem / Coursera): Rendkívül rövid áttekintés a teljes folyamatról. Inkább a Johns Hopkins Egyetem adattudományi specializációjának felkészítő tanfolyama. Azt állítja, hogy 4–16 óra tartalommal rendelkezik (heti egy-négy óra négy hét alatt), bár egy véleményező megjegyezte, hogy két órán belül elkészülhet. Ez egy 3,22 -csillagos súlyozott átlagos minősítés több mint 182 vélemény. Ingyenes és fizetett lehetőségek állnak rendelkezésre.
- Adatkezelés és vizualizáció (Wesleyan University / Coursera): Részleges folyamat lefedettség (hiányzik a modellezés). Négy hét hosszú. Jó termelési érték. Python és SAS használatával. Ez egy 2,67 -csillagos súlyozott átlagos értékelése felett 6 értékelés. Ingyenes és fizetett lehetőségek állnak rendelkezésre.
A következő tanfolyamokról nem volt beszámoló 2017 januárjában.
- CS109 Data Science (Harvard University): Teljes folyamat lefedettség nagy mélységben (valószínűleg túl mélyreható a sorozat céljai szempontjából). Teljes 12 hetes egyetemi tanfolyam. A pályán való navigáció nehéz, mivel a tanfolyamot nem online fogyasztásra tervezték. A tényleges Harvard-előadásokat forgatják. A fenti adattudományi folyamat infographic ebből a kurzusból származik. Python-t használ. Nincsenek felülvizsgálati adatok. Ingyenes.

- Bevezetés a vállalati adatelemzésbe (University of Colorado Boulder / Coursera): Részleges folyamatlefedettség (nincsenek modellezési és vizualizációs szempontok), az üzleti tevékenységre összpontosítva. Az adattudományi folyamat előadásaikban „Információ-Akció Értékláncként” lepleződik. Négy hét hosszú. Számos eszközt ír le, bár csak az SQL-t fedi le bármilyen mélységben. Nincsenek felülvizsgálati adatok. Ingyenes és fizetett lehetőségek állnak rendelkezésre.
- Bevezetés az adattudományba (Lynda): Teljes folyamat lefedettség, bár korlátozott mélységű. Elég rövid (három óra tartalom). Bemutatja az R-t és a Pythont is. Nincsenek felülvizsgálati adatok. A költség a Lynda előfizetésétől függ.
Csomagolás
Ez a hatrészes sorozat harmadik része, amely a legjobb online tanfolyamokat tartalmazza, hogy elindulhasson az adattudomány területén. A programozást az első cikkben, a statisztikákat és a valószínűséget a második cikkben ismertettük. A sorozat többi része az adattudomány egyéb alapvető kompetenciáira terjed ki: az adatok vizualizálására és a gépi tanulásra.
Ha meg akarja tanulni az adattudományt, kezdje az egyik ilyen programozási órával
Ha meg akarja tanulni az adattudományt, vegyen részt néhány ilyen statisztikai osztályból
Az utolsó cikk összefoglaló lesz ezekről a cikkekről, valamint a legjobb online tanfolyamok más kulcsfontosságú témákról, mint például az adatkezelés, az adatbázisok és még a szoftvertervezés is.
Ha a Data Science online tanfolyamok teljes listáját keresi, megtalálja azokat a Class Central Data Science és Big Data subject oldalán.
Ha szívesen olvasta ezt, nézze meg a Class Central többi darabját:
Íme 250 Ivy League tanfolyam, amelyet ingyen online vehet igénybe online
250 MOOC Brown, Columbia, Cornell, Dartmouth, Harvard, Penn, Princeton és Yale.
Az adatok szerint az 50 legjobb ingyenes online egyetemi tanfolyam
Amikor 2011 novemberében elindítottam a Class Central szolgáltatást, körülbelül 18 ingyenes online tanfolyam volt, és szinte az összes…
Ha javaslataid vannak a hiányzó tanfolyamokra, tudasd velem a válaszokban!
Ha hasznosnak találta, kattintson a? így többen láthatják itt a Mediumon.
Ez egy rövid cikk az eredeti cikkemről, amelyet a Class Central-on tettem közzé, ahol további tanfolyamleírásokat, tanterveket és több áttekintést is mellékeltem.