Hogyan lehet átvágni az AI hype-t, hogy gépi mérnök legyen

Biztos vagyok benne, hogy hallott a hihetetlen mesterséges intelligencia-alkalmazásokról - a világ legjobb Go játékosait legyőzni képes programoktól az önvezető autókig.

A probléma az, hogy a legtöbb ember belekerül az AI hype-ba, keveri a technikai és a filozófiai beszélgetéseket.

Ha át akarja vágni az AI hype-ot, és gyakorlatilag megvalósított adatmodellekkel dolgozik, akkor vonatozzon egy adatmérnök vagy gépi tanulási mérnök pozíció felé.

Ne keressen érdekes AI alkalmazásokat az AI cikkekben. Keresse meg őket az adatmérnöki vagy a gépi tanulási oktatóanyagokban.

Ezeket a lépéseket tettem ennek a szórakoztató kis kaparónak a felépítésére, amelyet a nemi sokféleség elemzésére készítettem a különböző kódoló bootcampokban. Ez az az út, amelyen kutatást végeztem a Springboard új AI / ML online bootcamp-jához, munkabiztonsággal.

Itt van egy lépésenkénti útmutató a gépi tanulási térbe való bejutáshoz, mindegyikhez hozzárendelve egy kritikus erőforráskészletet.

1. Kezdje el finomítani a Python és a szoftverfejlesztési gyakorlatokat

Kezdje azzal, hogy átfogja a Python-ot, a legtöbb gépi tanulási mérnök által választott nyelvet.

A praktikus szkriptnyelv a legtöbb adatmérnök és adatkutató számára a választott eszköz. A legtöbb eszköz az Python-ban épült, vagy API-hozzáféréssel rendelkezik a Python egyszerű elérése érdekében.

Szerencsére a Python szintaxisa viszonylag könnyen felvehető. A nyelv rengeteg dokumentációt és képzési forrást tartalmaz. Tartalmaz mindenféle programozási paradigma támogatását a funkcionális programozástól az objektum-orientált programozásig.

Az egyik dolog, amit kissé nehéz felvenni, a kód rendezéséhez és aktiválásához szükséges fül és szóköz. A Pythonban a szóköz nagyon fontos.

Gépi tanulási mérnökként egy csapatban dolgozna összetett, gyakran misszió szempontjából kritikus alkalmazások felépítésén. Szóval, itt az alkalom frissíteni a szoftvertervezéssel kapcsolatos legjobb gyakorlatokat is.

Tanulja meg az olyan együttműködési eszközök használatát, mint a Github. Gyakoroljon alapos egységteszteket írni a kódhoz olyan tesztelési keretrendszerek segítségével, mint az orr. Tesztelje az API-kat olyan eszközökkel, mint a Postman. Használjon CI-rendszereket, például a Jenkins-t, hogy megbizonyosodjon arról, hogy a kód nem törik össze. Fejlesszen ki jó kódellenőrzési készségeket, hogy a jövőbeni műszaki kollégáival jobban együttműködhessen.

Egy dolgot kell olvasni : Mi a legjobb Python IDE az adattudomány számára? Készítsen egy gyors átolvasást, hogy megérthesse, milyen eszközkészleten kíván dolgozni a Python adatkészleteken való megvalósításához.

Magam használom a Jupyter Notebookot, mivel előre telepítve van a legtöbb fontos adattudományi könyvtárral, amelyet használni fog. Egy egyszerű, tiszta interaktív felülettel rendelkezik, amely lehetővé teszi a kód menet közbeni szerkesztését.

A Jupyter Notebook olyan kiterjesztésekkel is rendelkezik, amelyek lehetővé teszik az eredmények könnyebb megosztását a világ egészével. A létrehozott fájlokkal a Githubon is nagyon könnyű dolgozni.

Egy tennivaló : A Pandas Cookbook lehetővé teszi a Pandas keretrendszer, az egyik legerősebb adatkezelési könyvtár élő példáinak kiaknázását. Gyorsan kidolgozhat egy példát arra, hogyan lehet rajta keresztül játszani egy adatkészlettel.

2. Vizsgálja meg a gépi tanulás kereteit és elméletét

Miután játszott a Pythonnal és gyakorolt ​​vele, itt az ideje elkezdeni a gépi tanulás elméletét vizsgálni.

Megtudhatja, milyen algoritmusokat használjon. A gépi tanulás elméletének alapszintű ismerete lehetővé teszi a modellek egyszerű megvalósítását.

Egy dolog, amit el kell olvasni : A gépi tanulást biztosító újoncok tíz legjobb algoritmusának bemutatása segít az alapok megismerésében. Megtudhatja, hogy nincs „ingyenes ebéd”. Nincs olyan algoritmus, amely optimális eredményt adna az egyes beállításokhoz, ezért be kell merülnie az egyes algoritmusokba.

Egy tennivaló : Játsszon együtt az interaktív Ingyenes gépi tanulással a Python tanfolyamon - fejlessze a Python készségeit és kezdje el végrehajtani az algoritmusokat.

3. Kezdje el az adatkészleteket és kísérletezzen

Az öved alatt vannak az eszközök és az elmélet. Gondolkodnia kellene olyan kis mini projektek elvégzésén, amelyek segíthetnek a készségek finomításában.

Egy dolog, amit el kell olvasni : Vessen egy pillantást az 19 ingyenes nyilvános adatkészletre az első Data Science Project számára, és kezdje el megvizsgálni, hol találhat különböző adathalmazokat az interneten, amelyekkel játszhat.

Egy tennivaló : A Kaggle Datasets lehetővé teszi, hogy rengeteg nyilvánosan elérhető adatkészlettel dolgozzon. Ami klassz ebben a gyűjteményben, láthatja, hogy bizonyos adatkészletek mennyire népszerűek. Megtekintheti azt is, hogy milyen más projektek épültek ugyanazzal az adatkészlettel.

4. Skálázza az adatkészségét a Hadoop vagy a Spark segítségével

Most, hogy kisebb adatállományokon gyakorol, meg kell tanulnia, hogyan kell működni a Hadoop vagy a Spark alkalmazással. Az adatmérnökök streaming, valós idejű termelési szintű adatokkal dolgoznak terabájtos, néha petabájtos skálán. Tanuljon fel egy nagy adatkeretrendszeren keresztül.

Egy dolgot kell elolvasni : Ez a rövid cikk Hogyan halmozódnak fel a Hadoop és a Spark? segít végigjárni mind a Hadoopot, mind a Sparkot, és hogyan hasonlítanak egymásra és kontrasztolják egymást.

Egy tennivaló : Ha azonnal el akar kezdeni dolgozni egy nagy adatkerettel, a Databricksen tárolt Spark Jupyter jegyzetfüzetek oktató szintű bevezetést kínálnak a keretrendszerhez, és gyakorlati alkalmazásra késztetik a termelési szintű kód példákkal.

5. Dolgozzon olyan mély tanulási kerettel, mint a TensorFlow

Készen áll a gépi tanulási algoritmusok felfedezésére és a különféle nagyadat-eszközökkel való munkára.

Itt az ideje, hogy olyan erős tanulást vegyen át, amelyre az új fejlemények kerültek. Tanulja meg a TensorFlow keretrendszert, és akkor a gépi tanulási munka élvonalában lehet.

Egy dolgot el kell olvasni : Olvassa el, mi az a TensorFlow? és megérteni, hogy mi történik a motorháztető alatt, amikor erről az erőteljes mély tanulási keretrendszerről van szó.

Egy tennivaló : A TensorFlow és a mély tanulás PhD nélkül a Google által létrehozott interaktív tanfolyam, amely a diákba helyezett elméletet ötvözi a gyakorlati laboratóriumok kóddal.

6. Kezdjen el nagy termelési szintű adathalmazokkal dolgozni

Most, hogy mély tanulási keretrendszerrel dolgozott, elkezdheti a munkát nagy termelési szintű adatkészletek kialakításán.

Gépi tanulási mérnökként összetett mérnöki döntéseket hoz nagy mennyiségű adat kezelésével és a rendszerek telepítésével kapcsolatban.

Ez magában foglalná az API-kból történő adatgyűjtést és a webes kaparást, az SQL + NoSQL adatbázisokat, és amikor használná őket, akkor olyan csővezeték-keretrendszereket használnánk, mint a Luigi vagy az Airflow.

Az alkalmazások telepítésekor konténeralapú rendszereket, például a Docker méretezhetőségét és megbízhatóságát, valamint olyan eszközöket használhat, mint például a Lombik, API-k létrehozásához az alkalmazásához.

Egy dolog, amit el kell olvasni : A 7 módszer a nagy adatfájlok kezelésére a gépi tanuláshoz egy szép elméleti gyakorlat arról, hogy miként kezeli a nagy adathalmazokat, és hasznos taktikaként használható taktikákként használható.

Egy tennivaló : A nyilvánosan elérhető nagy adathalmazok listája azokról a helyekről, ahol nagyon nagy adatkészleteket szerezhet - készen áll arra, hogy gyakorolhassa újdonságait.

7. Gyakoroljon, gyakoroljon, gyakoroljon, építsen a portfólió, majd a munka felé

Végül eljutott egy olyan ponthoz, ahol működő gépi tanulási modelleket készíthet. A gépi tanulási karrier előrehaladásának következő lépése az, hogy munkát talál egy olyan vállalatnál, amely ezeket a nagy adathalmazokat birtokolja, így készségeit mindennap alkalmazhatja egy élvonalbeli gépi tanulási problémára.

Egy dolog, amit el kell olvasni : 41 alapvető gépi tanulási interjúkérdés (válaszokkal) segítenek a gépi tanulási interjú elkészítéséhez szükséges ismeretek gyakorlásában.

Egy tennivaló : Menjen ki, és találjon olyan találkozókat, amelyek a gépi tanulásnak vagy az adattervezésnek vannak elkötelezve a Meetup-on - ez egy nagyszerű módja annak, hogy találkozhasson a téren tartózkodó társaival és a potenciális alkalmazottakkal.

Remélhetőleg ez a bemutató segített átvészelni a mesterséges intelligencia körüli hype-ot valami praktikus és testreszabott módon, amelyet használhat. Ha úgy érzi, hogy még valamire szüksége van, a Springboard cég, amellyel dolgozom, az AI és a gépi tanulásnak szentelt karrier pálya bootcampot kínál, munkahelyi garanciával és 1: 1 mentorálással a gépi tanulás szakértőitől.