Szeretné tudni, hogyan működik a mély tanulás? Itt egy gyors útmutató mindenkinek.

A mesterséges intelligencia (AI) és a gépi tanulás (ML) jelenleg a legforróbb témák közé tartozik.

Az „AI” kifejezést minden nap lazán dobálják. Hallja a törekvő fejlesztőket, akik azt mondják, hogy meg akarják tanulni az AI-t. Azt is hallja, hogy a vezetők azt mondják, hogy az AI-t a szolgáltatásaikban szeretnék megvalósítani. De gyakran ezek közül az emberek közül sokan nem értik, hogy mi az AI.

Miután elolvasta ezt a cikket, meg fogja érteni az AI és az ML alapjait. Ennél is fontosabb megérteni, hogy működik a Deep Learning, a legnépszerűbb ML típus.

Ez az útmutató mindenki számára készült, így nem lesz benne fejlett matematika.

Háttér

Az első lépés a mély tanulás működésének megértése felé a fontos kifejezések közötti különbségek megértése.

Mesterséges intelligencia vs gépi tanulás

A mesterséges intelligencia az emberi intelligencia replikációja a számítógépekben.

Amikor az AI kutatás először elkezdődött, a kutatók megpróbálták megismételni az emberi intelligenciát bizonyos feladatokhoz - például játékhoz.

Rengeteg olyan szabályt vezettek be, amelyeket a számítógépnek tiszteletben kellett tartania. A számítógépnek külön listája volt a lehetséges műveletekről, és ezek alapján hozott döntéseket.

A gépi tanulás a gép azon képességére utal, hogy nagy adatkészletek használatával tanuljon a szigorúan kódolt szabályok helyett.

Az ML lehetővé teszi a számítógépek számára, hogy önállóan tanuljanak. Ez a fajta tanulás kihasználja a modern számítógépek feldolgozási erejét, amelyek könnyen képesek feldolgozni a nagy adathalmazokat.

Felügyelt tanulás vs felügyelet nélküli tanulás

A felügyelt tanulás olyan címkézett adatkészletek használatát foglalja magában, amelyek inputokkal és várható kimenetekkel rendelkeznek.

Amikor mesterséges intelligenciát képez felügyelt tanulás segítségével, megad egy inputot és elmondja a várható kimenetet.

Ha az AI által generált kimenet hibás, akkor kiigazítja számításait. Ezt a folyamatot az adatkészleten keresztül iteratív módon végzik, amíg az AI már nem hibázik.

A felügyelt tanulás egyik példája az időjárás-előrejelző AI. Megtanulja megjósolni az időjárást történelmi adatok felhasználásával. Az edzési adatok tartalmazzák a bemeneteket (nyomás, páratartalom, szélsebesség) és a kimeneteket (hőmérséklet).

A felügyelet nélküli tanulás a gépi tanulás feladata, ha nincsenek meghatározott struktúrájú adathalmazok.

Amikor egy mesterséges intelligenciát képez fel felügyelet nélküli tanulás segítségével, akkor hagyja, hogy az intelligens intelligencia osztályozza az adatokat.

A felügyelet nélküli tanulásra példa az e-kereskedelmi webhely viselkedését előrejelző AI. Nem fogja megismerni a bemenetek és kimenetek címkézett adatkészletének használatát.

Ehelyett létrehozza a bemeneti adatok saját osztályozását. Megmondja, hogy mely felhasználók vásárolják a legvalószínűbben a különböző termékeket.

Hogyan működik a mély tanulás?

Most felkészült arra, hogy megértse, mi a mély tanulás és hogyan működik.

A mély tanulás egy gépi tanulási módszer. Ez lehetővé teszi számunkra, hogy egy mesterséges intelligenciát képezzünk a kimenetek előrejelzésére, adott bemeneti halmaz esetén. A mesterséges intelligencia kiképzésére felügyelt és felügyelet nélküli tanulás egyaránt használható.

Megtanuljuk, hogyan működik a mély tanulás egy hipotetikus repülőjegy-becslési szolgáltatás kiépítésével . Felügyelt tanulási módszerrel fogjuk kiképezni.

Azt akarjuk, hogy repülőjegy-árbecslőnk megjósolja az árat a következő bemenetek felhasználásával (az egyszerűség kedvéért kizárjuk a visszatérő jegyeket):

  • Eredeti repülőtér
  • Rendeltetési repülőtér
  • Indulási időpont
  • Légitársaság

Ideghálózatok

Nézzünk bele a mi agyunk agyába.

Az állatokhoz hasonlóan AI becslésünk agyában is vannak neuronok. Körök képviselik őket. Ezek az idegsejtek összekapcsolódnak.

Az idegsejtek három különböző típusú rétegre vannak csoportosítva:

  1. Bemeneti réteg
  2. Rejtett réteg (ek)
  3. Kimeneti réteg

Az input réteg fogadja a bemeneti adatokat. Esetünkben négy neuron van az input rétegben: Origin Airport, Destination Airport, Indulás dátuma és Airline. Az input réteg továbbítja a bemeneteket az első rejtett rétegnek.

A rejtett rétegek matematikai számításokat végeznek a bemeneteinken. A neurális hálózatok létrehozásának egyik kihívása a rejtett rétegek számának, valamint az egyes rétegek neuronjainak meghatározása.

A mély tanulás „ mélye ” arra utal, hogy egynél több rejtett réteg van.

A kimeneti réteg a kimeneti adatokat adja vissza. Esetünkben megjósolja az árat.

Tehát hogyan számítja ki az árjóslatot?

Itt kezdődik a mély tanulás varázsa .

Az idegsejtek közötti minden kapcsolat súlyhoz kapcsolódik . Ez a súly diktálja az input érték fontosságát. A kezdeti súlyokat véletlenszerűen állítják be.

A repülőjegy árának megjóslásakor az indulási dátum az egyik nehezebb tényező. Ezért az idegsejtek indulási dátumának nagy súlya lesz.

Minden idegsejtnek van egy aktivációs funkciója. Ezeket a funkciókat matematikai érvelés nélkül nehéz megérteni.

Egyszerűen fogalmazva, egyik célja az idegsejt kimenetének "szabványosítása".

Miután egy bemeneti adatkészlet áthaladt az ideghálózat összes rétegén, a kimeneti adatokat a kimeneti rétegen keresztül adja vissza.

Semmi bonyolult, igaz?

A neurális hálózat képzése

Az AI tanítása a mély tanulás legnehezebb része. Miért?

  1. Nagy adatkészletre van szüksége .
  2. Szüksége van egy nagy mennyiségű számítási teljesítményt .

A repülőjegyár-becslésünkhöz meg kell találnunk a jegyárak korábbi adatait. És a lehetséges repülőterek nagy száma és az indulási dátum kombinációk miatt nagyon nagy listára van szükségünk a jegyárakról.

Az AI kiképzéséhez meg kell adnunk neki az adatsorunkból származó bemeneteket, és össze kell hasonlítanunk a kimeneteit az adatsor kimeneteivel. Mivel az AI még mindig nem képzett, kimenetei hibásak lesznek.

Miután végigjártuk a teljes adatsort, létrehozhatunk egy olyan funkciót, amely megmutatja, mennyire tévesek voltak az AI kimenetei a valós kimeneteknél. Ezt a függvényt költségfunkciónak hívják.

Ideális esetben azt akarjuk, hogy a költségfüggvényünk nulla legyen. Ekkor az AI kimeneteink megegyeznek az adatkészlet kimeneteivel.

Hogyan csökkenthetjük a költségfüggvényt?

Megváltoztatjuk a neuronok közötti súlyt. Véletlenszerűen változtathatnánk őket, amíg alacsony a költségfüggvényünk, de ez nem túl hatékony.

Ehelyett a Gradient Descent nevű technikát fogjuk használni.

A gradiens süllyedés olyan technika, amely lehetővé teszi számunkra, hogy megtaláljuk a függvény minimumát. Esetünkben keressük a minimális költségfüggvényt.

Ez úgy működik, hogy a súlyokat minden egyes adatsor-ismétlés után kis lépésekben változtatja . A költségfüggvény deriváltjának (vagy gradiensének) kiszámításával egy bizonyos súlykészleten láthatjuk, hogy a minimum melyik irányba mutat.

A költségfüggvény minimalizálása érdekében sokszor meg kell ismételnie az adatkészletet. Ezért van szüksége nagy mennyiségű számítási erőre.

A súlyok gradiens ereszkedéssel történő frissítése automatikusan megtörténik . Ez a mély tanulás varázsa!

Miután kiképeztük a repülőjegyár-becslő AI-t, felhasználhatjuk a jövőbeli árak előrejelzésére.

Hol tudok többet megtudni?

Számos más típusú neurális hálózat létezik: konvolúciós neurális hálózatok a számítógépes látáshoz és visszatérő neurális hálózatok a természetes nyelv feldolgozásához.

Ha meg szeretné tanulni a mély tanulás technikai aspektusát, javasoljuk, hogy vegyen részt egy online tanfolyamon.

Jelenleg a mély tanulás egyik legjobb tanfolyama Andrew Ng mély tanulási specializációja. Ha nem érdekli az igazolás megszerzése, akkor nem kell fizetnie a tanfolyamért. Ehelyett ingyen ellenőrizheti.

Ha bármilyen kérdése van, vagy további technikai magyarázatot szeretne kapni a koncepciókról, kérjük, tegye fel alább!

Összefoglalva…

  • A Deep Learning egy neurális hálózatot használ az állatok intelligenciájának utánzásához.
  • Az ideghálózatban három típusú neuronréteg van: az InputRéteg, rejtett réteg (ek) és kimeneti réteg.
  • Az idegsejtek közötti kapcsolatok súlyhoz kapcsolódnak, meghatározva az input érték fontosságát.
  • A neuronok aktiválási funkciót alkalmaznak az adatokon, hogy „szabványosítsák” az idegsejtből kimenő kimenetet.
  • A neurális hálózat kiképzéséhez nagy adatkészletre van szükség.
  • Az adatkészleten keresztüli ismétlés és a kimenetek összehasonlítása költségfüggvényt eredményez, amely jelzi, hogy az AI mennyire van kikapcsolva a valós kimenetektől.
  • Az adatsoron keresztüli minden egyes iteráció után az idegsejtek közötti súlyt a Gradient Descent segítségével állítjuk be a költségfüggvény csökkentése érdekében.

Ha tetszett ez a cikk, kérem, adjon néhány tapsot, hogy minél többen lássák. Köszönöm!

Megnézheti tapasztalataimat is arról, hogyan szereztem szakmai gyakorlatomat a Shopify-ban!

További frissítésekért kövessen a Twitteren.