Áttekintés: Udacity Data Analyst Nanodegree Program

Az Udacity Data Analyst Nanodegree programja az egyik első online adattudományi program volt az online oktatási forradalomban. Célja, hogy "biztosítsa az adattudományi karrier kialakításához szükséges pontos készségek elsajátítását". Teljesíti a célját? A rendelkezésre álló legjobb megoldás?

A programot 2016 őszén fejeztem be. A Class Central nyílt forráskódú felülvizsgálati sablonjának ihletet felhasználva itt találom az Udacity Data Analyst Nanodegree programjának áttekintését.

UPDATE: Az Data Analyst Nanodegree program új tartalommal és hallgatói szolgáltatásokkal frissült 2017 szeptemberében. Részletek itt. Azért is felvittek a fedélzetre, hogy segítsek újrateremteni ezt az új tartalmat. A felülvizsgálat többsége változatlan. A tényszerű frissítéseket dőlt betűvel jelölik.

Háttér-információ

Mi késztetett arra, hogy eldöntsem ezt a programot?

2016 elején elkezdtem létrehozni saját adattudományi mesterképzésemet online források felhasználásával. (Erről itt olvashat.) Néhány okból beiratkoztam a Data Analyst Nanodegree programba:

  • Útmutatót szerettem volna bevezetni az adattudományba.
  • Összetartó programot szerettem volna a különféle szolgáltatók egyéni tanfolyamai helyett.
  • Csillagértékeléseket kapott.
  • Korábban részt vettem néhány Udacity tanfolyamon, és rajongtam a tanítási stílusukért.

Mik voltak a céljaim?

Bár a program hídként szolgálhat a munkához (erről később), szerettem volna a programot bevezetni a fejlettebb anyagokhoz. Ez a „fejlettebb anyag” mind a tantárgyakra vonatkozik, amelyek a programban szerepelnek, mind azokra a tantárgyakra, amelyek nem.

Mi az Udacity Nanodegree program?

Az Udacity az egyik vezető online oktatási szolgáltató. Sebastian Thrun, a Stanford ex professzora és a Google X alapítója alapította a vállalatot, és az Udacity elnökeként és elnökeként az innovációra koncentrál. Vish Makhijani vezérigazgató.

A nanodegree programok az Udacity által biztosított online hitelesítő adatok. Ezek az Udacity tanfolyamok összeállításai (némelyik ingyenesen elérhető, mások nem), amelyekhez projektek kapcsolódnak, amelyeket az Udacity fizetett projektellenőrei felülvizsgálnak. Egy csomó hallgatói szolgáltatással is járnak.

A Slacket közösségi eszközként használják, ahol az Udacity hallgatók kölcsönhatásba léphetnek más hallgatókkal, valamint a program oktatóival és az Udacity személyzetével. A legtöbb programban a hallgatók mentorokat jelöltek ki, és privát chat csatornán keresztül kommunikálnak velük, amely mindig elérhető az Udacity tanteremben.

A Data Analyst Nanodegree program eredetileg 2014-ben jelent meg. Ez volt az Udacity második Nanodegree programja. Bár az évek során némi változáson ment keresztül, a program lényege sértetlen.

Kik az oktatók és milyen a hátterük?

Mivel a Data Analyst Nanodegree program az Udacity tanfolyamok összeállítása (megint egyesek ingyenesek, mások nem), számos oktató létezik. Az önéletrajzok gyakran tekintélyes szerepeket foglalnak magukban a nagy technológiai vállalatoknál és az Egyesült Államok felsőbb iskoláinak diplomáit.

Ők önmagukban nem „oktatók”, de az Udacity projekt-áttekintői, mentorai és hallgatói tapasztalatainak munkatársai (akik az oktatókkal együtt figyelik a Slacket) azok közé tartoznak, akikkel a legjobban kommunikálnak. Annyira, nagyon segítőkészek. Erről később.

Költség

A program két kifejezésre oszlik. Az első ciklus ára 499 USD. A második ciklus ára 699 USD. Ha jól ismeri az első ciklusban tanított készségeket, akkor kihagyhatja, csak a második ciklust teljesítheti, és így is megszerezheti a bizonyítványt.

Ajánlott előfeltételek

Az 1. kifejezésnél az Udacity azt javasolja, hogy a hallgatók ismerjék a leíró statisztikákat, és legyenek tapasztalataik a táblázatokban vagy az SQL-ben végzett adatok kezelésében.

A 2. ciklushoz a hallgatóknak tapasztalattal kell rendelkezniük az adatok elemzéséről a Python használatával, valamint meg kell érteniük az inferenciális statisztikákat és alkalmazásokat.

A programba belépő háttér / készségek

2016 májusában kezdtem el a programot, amikor néhány hónapos programozási tapasztalattal rendelkeztem, főleg C és Python nyelven. Ennek a tapasztalatnak a túlnyomó része az adattudományi mesterképzésem áthidaló moduljából származott, ahol a Harvard CS50: Bevezetés a számítástechnikába és az Udacity Intro to Programming Nanodegree programját vettem át.

Végeztem az egyetemi vegyészmérnöki programommal is, és 24 hónap kvantummal kapcsolatos munkatapasztalatom volt. Ez azt jelentette, hogy több statisztikai tanfolyamon vettem részt, és elégedett voltam az adatokkal.

A program

Szerkezet

A Data Analyst Nanodegree program két kifejezésre oszlik. Minden kifejezésnek három tanfolyama és négy projektje van (az extra projekt egy intro projekt, amely segít megszokni az Udacity tanulási környezetet). Mat Leonard, a program tantervének vezetője a frissítéskor a program egészében jelen van, amikor bemutatja az egyes kurzusokat, azok célját a programban és oktató (ka) t.

A tanfolyam tartalma videók, szöveg és vetélkedők kombinációjából áll. A videók általában 30 másodperctől öt percig terjednek, az Udacity stílusának megfelelően. Az automatikusan osztályozott vetélkedők gyakran követik ezeket a rövid videókat. Ezek a vetélkedők általában feleletválasztós, kitöltetlen vagy kis programozási feladatok. A CloudLabs megszerzése után ezeket a programozási feladatokat most a Jupyter Notebook és az SQL kódolási környezetekben hajtják végre az Udacity osztályteremben.

Ismét mindegyik szakasznak van egy osztályozott projektje. Ezek a projektek és az Udacity fizetett projektellenőreinek visszajelzései jelentik az értéket a hallgatók számára.

Tanmenet

A program kiadásom hét részből állt:

  • P1: Leíró és következtetési statisztika
  • P2: Bevezetés az adatelemzésbe (NumPy és pandák használatával)
  • P3: Adatcsere a MongoDB-vel (vagy SQL-szel)
  • P4: Feltáró adatok elemzése (R-vel)
  • P5: Bevezetés a gépi tanulásba
  • P6: Adatmegjelenítés a D3.js segítségével
  • P7: Tervezzen A / B tesztet

Az új program első kifejezésének neve Data Analysis with Python and SQL . A tanfolyamok és projektek a következőket tartalmazzák:

  • Intro projekt: Fedezze fel az időjárási trendeket. Az SQL és a táblázatok (vagy a Python / R, ha már ismerik) a hőmérsékleti adatok elemzésére és megjelenítésére szolgálnak.
  • Tanfolyam: Bevezetés a Pythonba. Projekt: Fedezze fel az USA Bikeshare adatait.
  • Tanfolyam: Bevezetés az adatelemzésbe, amely magában foglalja az adatelemzési folyamatot és az adatelemzéshez szükséges SQL-t. Projekt: Adatkészlet vizsgálata.
  • Tanfolyam: Gyakorlati statisztika. Projekt: Az A / B teszt eredményeinek elemzése.

A második kifejezést Advanced Data Analysis néven hívják . A tanfolyamok és projektek a következőket tartalmazzák:

  • Intro projekt: Teszteljen egy perceptuális jelenséget. Számítsa ki a leíró statisztikákat, és végezzen statisztikai tesztet egy adathalmazon, a Stroop-effektus nevű pszichológiai jelenség alapján.
  • Tanfolyam: Adatkezelés (Python-nal). Projekt: Az adatok bonyolítása és elemzése. Ezt a tanfolyamot és projektet hoztam létre. ?
  • Tanfolyam: Feltáró adatok elemzése (R-vel). Projekt: Adatok felfedezése és összegzése.
  • Tanfolyam: Adatok elmesélése (Tableau-val). Projekt: Készítsen Tableau Story-t.

A nagy változások, a részleteket részletesen leírva ebben a blogbejegyzésben:

  • A Python mostantól a programban van.
  • A gépi tanulás és az A / B tesztelés mostantól választható anyagként szerepel, és már nem követelmény a program elvégzéséhez. Indoklás: „Ennek a programnak az a célja, hogy felkészítsen az adatelemzői munkákra. Kutatásunk azt mutatja, hogy a gépi tanulás nem követelmény az adatelemzői pozíciók túlnyomó többségében. ” Az A / B tesztelés alapjait most az új gyakorlati statisztika tanfolyam tárgyalja, amely a hallgatóknak kitettséget kínál, amelyre a munkában szükségük lesz.
  • Új tanfolyamok és projektek. Pontosabban, bevezető az adatelemzéshez (amely magában foglalja a Python for Data Analysis és az SQL az adatelemzéshez), a gyakorlati statisztikákat (Sebastian Thrun tanítja) és az Data Wrangling-t.

Osztályozás

A projekteket a sikeres / nem megfelelő (hivatalosan „megfelel a specifikációknak” és „változtatásokat igényel”) alapján osztályozzák egyedi rubrikák szerint. A projektnek meg kell felelnie a rovat minden szakaszának. Ha az összes projekt megfelel a specifikációknak, akkor diplomát szerez. Ez azt jelenti, hogy az automatikusan osztályozott vetélkedők nem számítanak bele az osztályzatodba.

Ha egy projekt benyújtása változtatásokat igényel, akkor a projektellenőre visszajelzést ad Önnek. Miután végrehajtotta ezeket a módosításokat, újra elküldheti. Nincs beküldési korlát.

Tapasztalatom

Idővonal

Az Udacity becsült ütemterve a Data Analyst Nanodegree programhoz 378 óra volt, amikor elkezdtem, ami azt jelentette, hogy a diákok átlagosan 6–7 hónapot vettek igénybe. A Toggl (időkövető alkalmazás) szerint az egész program öt hónap alatt 369 órát vett igénybe. Ez az ütemterv komoly időt szánt arra, hogy projektjeimet portfólióminőségűvé tegyem, szemben azzal, hogy a minimumot állítsam elő a sikeres / nem megfelelő rubrikához.

A programot a 2017. őszi frissítésben sűrítették. Az új becsült idővonal 260 óra . Mindegyik kifejezés heti 10 órás ütemben halad 13 hét alatt, bár a hallgatók 19 hetet kapnak az egyes kifejezések teljesítésére.

Milyen volt a tanfolyam tartalma?

A program kiadásomhoz a P1 (Statisztika), P2 (Intro to Data Analysis), P4 (Exploratory Data Analysis), P5 (Machine Learning) és P7 (A / B Testing) kurzusok tartalma öt csillagot kap öt tőlem. A P3 (Data Wrangling) és a P6 három és fél csillagot kap.

A Facebook munkatársaival folytatott feltáró adatelemzési tartalom (P4) annyira megvilágító volt. A gépi tanulás tanfolyama a Sebastian Thrun és Katie Malone (P5) részvételével a legszórakoztatóbb volt minden online tanfolyamon. A Google alkalmazottaival (P7) végzett A / B tartalom olyan egyedülálló. Hat csillagot adnék ennek a három tanfolyamnak, ha lehet.

Az SQL és a Data Wrangling tartalom (P3) nem volt csodálatos. Ugyanez vonatkozik az adatmegjelenítési tartalomra (P6), bár ez valószínűleg azért volt így, mert a D3.js-t nagyon nehéz megtanítani a JavaScript kezdőknek. Ezek a vélemények nem ritkák, a Class Central e tanfolyamokra vonatkozó áttekintése szerint. Nézze meg őket itt és itt.

Ezt a „nem csodálatos” tartalmat a régi programból eltávolítottuk a 2017. őszi frissítésből. Megújult tartalom az adatok elemzéséhez, az SQL-hez, a statisztikákhoz, az adatok bonyolításához és az adatok megjelenítéséhez. A Gyakorlati statisztika tartalom a következtetési statisztikákra összpontosít, a leíró statisztika előfeltétele és a Data Foundations Nanodegree programban tanítják. Az adatmegjelenítési tanfolyamot most a Tableau-val tanítják a D3.js helyett.

Milyenek voltak a projektek?

Ismét a projektek azok, ahol az Udacity megkülönbözteti magát a többi online oktatási platformtól. Fektetnek a projektek felülvizsgálati folyamatába, és ez megtérül. A Data Analyst Nanodegree program sem volt kivétel.

Az összes projekt megerősíti a videókban tanult tartalmat. A projekt bírálói tudják a dolgukat. Elmondják, hol sikerült és hol vannak hibáid és / vagy kihagyásaid. Felügyelt tanulás. Működik.

A fórumok és a fórummentorok különösen hasznosak, ha elakad. Keressen a fórumokon, hátha a problémája általános (általában az). Nincs szerencse? Tegyen fel új kérdést maga. Van egy fórum mentor, Myles Callan, aki úgy tűnik, mindent tud mindenről, és néhány órán belül válaszol. Kétlem, hogy alszik.

Bár továbbra is léteznek és működnek fórumok, a Slack és az osztálytermi mentorok az ajánlott támogatási lehetőségek. A hallgatók kérdéseket tehetnek fel, és a válaszokat ugyanolyan vagy nagyobb szintű közvetlenséggel (órákon belül és gyakran hamarabb) kapják meg. A Slack közösséget az Udacity oktatói, valamint hallgatói tapasztalatú munkatársaik felügyelik, akik biztosítják, hogy a hallgatók kérdéseire, észrevételeire stb. Időben foglalkozzanak. A híres Myles Callan most mentor.

Ha kíváncsi vagy, hogy néznek ki ezek a projektek, nézd meg ezt a Github-tárat.

Mennyire volt nehéz?

A statisztikai tartalom könnyű volt számomra, mert több statisztikai tanfolyamot is elvégeztem undergradban. Ez valószínűleg a Nanodegree program minden témájára igaz lenne, ha előzetes tapasztalataid lennének abban.

A program nagy részét köztes nehézségként kategorizálnám. A sok vetélkedővel nem rendelkező előadás tartalma (bár gyakran van ilyen) szellő lehet, ami nem feltétlenül rossz. A projektek gyakorolják az agyadat. Mindegyik valószínűleg több mint húsz órát vesz igénybe, ha alapos akar lenni.

Az Exploratory Data Analysis projekt volt a legnagyobb kihívás. 3,5 beadvány kellett hozzá. Nézze meg ezt a Twitter szálat további részletekért.

Pályázhat-e azonnal az érettségi után?

Tudsz. A programnak fel kell szereznie Önt a belépő szintű adatelemző szerephez szükséges képességekkel, ha komolyan veszi. Eli Kastelein tökéletes példa erre. Az ő történetéről alább olvashat.

Hogyan építsünk karriert a technikában CS diploma nélkül

2014 tavaszán egy főiskolai hallgató újonnan lemorzsolódtam egy agár buszon, amely különösen sehova sem tartott. medium.com

Továbbhaladhat haladóbb tanfolyamokra is, mind a programban szereplő tantárgyak, mind más tantárgyak számára. Ezt választottam.

Végső gondolatok

Újra felvenném a programot, tudva azt, amit most tudok?

Valahol a program vége felé elkezdtem elkészíteni a Class Central Adattudományi Karrier Útmutatóját. Ez magában foglalta az adattudomány minden tantárgyának felajánlott online tanfolyamának kutatását.

Noha a Nanodegree program kurzusainak többségét élveztem (frissítés: új tanfolyamok váltották fel azokat a tanfolyamokat, amelyek nem tetszettek) , vannak más szolgáltatóktól származó tanfolyamok, amelyek jobb tantárgyakat kapnak. Például a statisztikák. Ha már az induláskor hozzáférhettem az útmutatómhoz, akkor fontolóra vettem az egyes tantárgyak számára külön-külön tanfolyamot. Az Udacity hallgatói szolgáltatásai és a projektek felülvizsgálata azonban annyira hatékony a tanuláshoz, hogy ettől függetlenül a Data Analyst Nanodegree programot venném.

Ha Ön az a fajta ember, aki 100% -ban egyedi online oktatási élményre vágyik, de ki akarja használni az Udacity projektjeinek és szolgáltatásainak előnyeit, kutatnia kell az egyes tantárgyak kedvenc tanfolyamait (ajánlom a Class Central használatát), majd be kell iratkoznia a Nanodegree programba a projekteket érdemes megfontolni.

Az alternatívák

Ez az öt alternatív program, amelyet fontolgattam, amikor beiratkoztam a Data Analyst Nanodegree programba:

  • A Johns Hopkins Egyetem adattudományi specializációja a Coursera-n
  • A Microsoft professzionális programtanúsítványa az adattudományban az edX-en
  • A Wesleyan Egyetem adatelemzési és értelmezési szakterülete a Coursera-n
  • A DataCamp Python és R sávjai
  • A Dataquest Data Analyst és Data Scientist útjai

Megjegyzés: A többi szolgáltatóval kapcsolatos megjegyzésekkel kapcsolatos Udacity-irányelv miatt eltávolítottam a programokkal kapcsolatos megjegyzéseimet.

Következtetés

Az Udacity Data Analyst Nanodegree programja megadja az alapismereteket, amelyekre szüksége van az adattudományi karrierhez. Érettségi után képes lesz megcélozni erősségeit és gyengeségeit, és szükség esetén kiegészíteni a tanulást. Ráadásul egy maroknyi portfólióra kész projekttel távozik.

Imádtam, ahogy mások is.

★★★★ ¾