Tanítsd meg magad az adattudománynak: az a tanulási út, amelyet analitikai munkához kaptam a Jet.com-nál

Hogyan lehet a nulla programozási készségből a technológiai vagy analitikai munkába állni?

Ha érdekli ezeknek a készségeknek a megtanulása, akár szórakozásból, akár karrierváltásból, mi a legjobb módja ennek?

A legjobb online tanfolyamok számtalan listája létezik, de hogyan lehet a saját tanulási útját kiképezni a teljes zajjal?

Én személy szerint soha nem gondoltam volna, hogy gyakorlati ismereteket tanulok a programozás, az adatelemzés, a gépi tanulás vagy általában a technológia területén. Pénzügyi szakként mindig azt hittem, hogy én leszek az „üzleti srác”. Valahogy mégis megtanítottam magamnak Python-t és SQL-t, és azon kaptam magam, hogy a Jet.com-on az analitika területén dolgozom, és mindennap ezeket a nyelveket használom.

Miért lehet a Python és az SQL?

A Python a leggyorsabban növekvő programozási nyelv odakint, és jó okkal. Őrülten sok könyvtárral rendelkezik, amelyeket felhasználhat gépi tanulási alkalmazásokhoz, adatelemzéshez, vizualizációhoz, webalkalmazásokhoz, API-integrációkhoz és még sok máshoz. Ráadásul ez az egyik könnyebben felvehető és megtanulható nyelv. Ami az SQL-t illeti, az adatbázisok az energiatechnológiai vállalatok, az SQL pedig lehetővé teszi az összegyűjtött adatok sokaságának jobb megértését, feltárását és felhasználását.

Az alábbiakban felvázolom az utat, amelyet ezen nyelvek elsajátításánál követtem, és amely elvezetett az elemzéshez. Hogy világos legyen, ez az út hihetetlenül kihívást jelentett; Számtalan estét töltöttem csalódott és zavart érzéssel. Sok este szerettem volna csak bedobni a törülközőt, és megelégedni azzal, hogy üzleti srác vagyok.

De a motiváció továbbra is kulcsfontosságú ahhoz, hogy áthidalja az akadályokat, amelyekkel elkerülhetetlenül szembe kell néznie. Akár adatelemző, akár adattudományi szerepkörbe szeretne lépni, vagy csak jobban szeretné megérteni a programozást és a technológiát annak szórakoztatása érdekében (ami szórakoztatóvá válik!), Meg kell találnia, hogyan lehet motivált maradni és fegyelmezett, ha valóban meg akarja tanulni ezeket a készségeket.

Számomra az, hogy szinte minden nap (kb. 90 perc és 2 óra) külön időt szántam a tanulásra vagy a gyakorlásra, miután hazaértem a munkából, lehetővé tette számomra a következetes szokások kialakulását és az otthoni koncepciók kalapálását, amelyeket zavarosnak találtam.

Itt van az az út, amin jártam; remélhetőleg ez segíthet a saját kezdésben.

A Core Alapítvány

  1. Tanulja meg a Pythont a kemény úton

Ez az egyik legjobb tanfolyam, amit valaha is felvettem. Önállóan irányítja és kihívást jelent, de a Zed elegendő részletességgel és útmutatással látja el a Python programozásának megkezdéséhez. Hozzáférhetővé teszi a programozást, és az anyag hétről hétre magabiztosságot nyújt, hogy valóban úgy érezd, mintha hatékonyan tanulhatnád a Pythont.

2. Módelemzés: Pandák

A Mode Analytics fantasztikus bevezetést nyújt a Pythonba, és oktatóanyagokat tartalmaz az egyik legerősebb adatstruktúráról: a Pandas DataFrame-ről. Ez tökéletes az adatelemzés alapjainak elsajátításához, ha a Python alapjait lenyomta.

3. Módelemzés: SQL

A másik Mode Analytics oktatóanyag az SQL-ről is fantasztikus. Itt megtanulhatja az összes kulcsfontosságú fogalmat és létrehozhat egy erős SQL alapot. Még saját SQL-szerkesztővel és adatokkal is rendelkeznek, amelyekkel játszhatsz.

A Mode Analytics-szel együtt a W3 iskolák segíthetnek megválaszolni minden SQL-kérdést, amely bármikor felmerül, miközben végigvezeti az oktatóanyagokat.

Merülés a gépi tanulásba

Mielőtt teljesen megértettem volna a Pythont, készítettem egy lövést, és jelentkeztem az Udacity önvezető autójának nanodegrejére. Tudtam, hogy teljesen a fejemen van, de arra gondoltam, miért ne próbálnám meg?

Könnyebb motiválni magad a Python és a gépi tanulás elsajátítására, amikor elvarázsolják a gyakorlati alkalmazások.

Körülbelül egy hónapom volt az óra megkezdése előtt, ezért minél több órát vettem körül az adattudomány és a gépi tanulás körül.

Itt voltak a legjobb ingyenes bevezető tanfolyamok , amelyek hihetetlenül hasznosak voltak:

  • Udacity Machine Learning Intro
  • Udacity Bevezetés a statisztikákba
  • Udacity Bevezetés az adattudományba

Igen, láthatja, hogy eléggé gondolok az Udacity-re.

Bár nem ingyenes, azt is nagyon ajánlom, hogy nézze meg a Grokking Deep Learning könyvet. Rendkívül világos és viszonylagos példákat mutat be a gépi tanulás alapjairól.

A Google által kifejlesztett TensorFlow egy nyílt forráskódú könyvtár a gépi tanuláshoz, amely Pythonban írható. Hihetetlenül erős, és érdemes megismerkedni vele.

Nézze meg az MNIST gyakorlatot, hogy fantasztikusan bevezesse a keretrendszert.

A Stanford CS231 osztályt is hasznos forrásnak találtam; széles körben lefedi a konvolúciós ideghálózatokat (amiket a kép- vagy arcfelismerő szoftverekhez használunk), ami szerintem hihetetlenül hasznos lenne az önvezető Nanodegree autó számára. Ha egyáltalán érdekel a gépi tanulás képekkel vagy videókkal való használata, akkor nem talál sokkal jobbat, mint ez a tanfolyam.

Végül, miután ezeket az erőforrásokat szilárd alapok építésére fordítottam, elkezdtem az Udacity Self Driving Car Nanodegree-t.

Nem fogok erről túl sokat beszélni, mivel itt és itt már remek írási lehetőségek vannak a tanfolyamon. Azt fogom mondani, hogy saját megdöbbenésemre, annak ellenére, hogy a legnagyobb kihívást jelentő tanfolyam volt, amit valaha végeztem, képes voltam megérteni a legtöbb tartalmat. Megfelelő alapismeretekkel felvértezve meglepődne azon, hogy mennyire mély megértése lehet egy összetett témának.

Folyamatos elemzés és számítástechnikai tanulás

Miután néhány hónapig intenzíven belemerültem a gépi tanulásba, hasznos volt egy lépést hátrálni és megerősíteni a gyakorlati elemzések és az adattudomány alapelveinek megértését.

Az adattudomány , a mély tanulás és a gépi tanulás a Pythonnal kezdtem , egy fantasztikus tanfolyam az Udemy-ről . A gépi tanulásról szólva teljes körűen lefedi az elemzés, az adattudomány és a statisztika alapelveit, különös tekintettel a különféle adatbányászati ​​technikákra és gyakorlati forgatókönyvekre azok alkalmazásához.

A Data Science for Business című könyv hihetetlenül jól elmagyarázza azt is, hogy egyes modellek hogyan és miért működnek, amikor problémákat oldanak meg egy adott kontextusban; elemzési keretet és gondolkodásmódot üt el benned, amely alkalmazható minden olyan helyzetben, amely az adatproblémák körül forog. Ez a legjobb erőforrás, amelyet megtaláltam, és összekapcsolja a különböző analitikus megközelítéseket az adott üzleti helyzetekkel és problémákkal.

Természetesen, ha érdekel az elemzési vagy az adattudományi karrier folytatása, akkor mindig csiszolnia kell a régi készségeket, vagy új készségeket kell hozzáadnia az eszköztárához. FreeCodeCamp és Hackernoontájékoztató cikkeket és oktatóanyagokat publikálhat az adattudományról és a szoftverfejlesztésről. Kedvenc cikkem nemrégiben egy jól megírt oktatóanyag volt a saját blockchain írásáról.

Szeretné tudni, hogy mégis hogyan lehet a legjobban tovább tanulni?

Építs valamit. Bármi. Fedezze fel az adatkészletet. Keressen egy gyakorlati problémát, amellyel Ön vagy vállalata szembesül, és próbálja meg megoldani.

Még akkor is, ha nincs hozzáférése kiváló minőségű adatokhoz a vállalatánál, rengeteg nyílt forráskódú adatkészlet található, amelyekkel játszhat és gyakorolhat. Fogadok, hogy ugyanannyit, ha nem többet is megtanul, a saját adatprojektjein dolgozni, mint bármely tanfolyamra járni vagy könyvet olvasni.

Végül rendkívül hasznos, ha olyan emberekkel találkozunk és tanulunk, akik rendelkeznek a megszerezni kívánt készségekkel. Nagyon ajánlom a Meetup használatát elemzési vagy szoftveres szakemberek csoportjának megtalálásához a környékén. Sok ilyen csoport ingyenes oktató vagy tanulmányi foglalkozással rendelkezik, és rengeteg őrülten okos emberrel fog találkozni, akik tippeket és trükköket adhatnak a tanulás felgyorsításához.

New York Cityben néhány csoport segített nekem hatalmasat:

  • Gépi Tanuló Társaság
  • Google Developer Group
  • NYAI
  • New York Data Science

Jó szórakozást tanulni, és tudassa velem, hogy megy a saját útja!

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

FRISSÍTÉS : Az Udacity most kiadott egy új Data Scientist Nanodegree programot. Végignéztem az anyagokat, és hihetetlenül hasznos forrásnak tűnik! A projektek magukban foglalják az IBM adatokkal rendelkező ajánlómotor felépítését és az ügyfelek szegmensekbe történő besorolását. Még nem vettem át, de nézze meg itt: Data Scientist Nanodegree program.