Weka oktatóanyag - GUI-alapú gépi tanulás Java-val

Manapság az olyan programozási nyelvek, mint a Python és az R, kétségtelenül az egyik legigényesebb nyelv az adattudományban és a gépi tanulásban.

De vajon lehetséges-e általános gépi tanulási és adattudományi feladatok végrehajtása is anélkül, hogy szükségszerűen jártas lenne a kódolásban?

Persze hogy az! A Weka egy grafikus felhasználói felületen alapuló, nyílt forráskódú csomag. Használható általános Data Science feladatok elvégzésére, csak a grafikus felület használatával.

Alapok

A Weka könnyen telepíthető bármilyen platformra az alábbi linken található utasítások betartásával. Az egyetlen előfeltétel a Java 8.0 telepítése a helyi gépre.

A Weka telepítése után számos szabványos adatfeldolgozási és következtetési technika áll rendelkezésre, például:

  • Adatok előzetes feldolgozása : amint betöltötte az adatkészletet, a Weka lehetővé teszi, hogy gyorsan felfedezze annak attribútumait és példányait. Ezenkívül különféle szűrési technikák állnak rendelkezésre annak érdekében, hogy például kategorikus adatokat konvertáljanak numerikusakká, vagy funkcióválasztást hajtsanak végre az adatkészlet dimenzióinak csökkentése érdekében (pl. Az edzésidők és a teljesítmény gyorsítása érdekében).
  • Osztályozási és regressziós algoritmusok:különböző algoritmusok gyűjteménye, például Gauss Naiv Bayes, döntési fák, K-legközelebbi szomszéd, Ensembles technikák és különféle lineáris regressziós változatok.
  • Klaszterezés: ez a technika felhasználható az adatok fő kategóriáinak felügyelet nélküli azonosítására. Néhány példa a Weka gyűjteményben elérhető algoritmusok közül a K-Means fürtözés és az elvárás maximalizálása.
  • Társulások felfedezése : szabályok felfedezése adatkészletünkben a különböző jellemzők közötti minták és összefüggések könnyebb azonosítása érdekében.
  • Adatmegjelenítés:integrált adatmegjelenítési technikák készlete a funkciók közötti összefüggések gyors vizualizálására és olyan megtanult gépi tanulási minták megjelenítésére, mint a döntési fák és a K-eszközök klaszterezése.

A Weka másik érdekes tulajdonsága az új csomagok telepítésének képessége azok létrehozása közben.

Egy további telepíthető csomag egyik példája az AutoML. Az AutoML valójában különösen hasznos lehet a kezdők számára, akiknek nehéz lehet meghatározni, hogy a Machine Learning modell melyik lehet a legjobb egy adott feladathoz.

A Weka AutoML csomag használatával könnyedén tesztelheti a különböző Machine Learning modelleket menet közben. Ez lehetővé teszi a hiperparaméterek automatikus hangolását a teljesítmény növelése érdekében.

Végül a szakértő felhasználók számára a Weka parancssori felületet is kínál a Java kód használatához. Ez különösen hasznos lehet, különösen akkor, ha nagy mennyiségű adattal dolgozik.

Példa

Most egy egyszerű példát mutatunk be, hogy bemutassuk, hogyan lehet kezdeni a Wekával.

Először is a Weka Explorer megnyitásával és az adatkészlet (ebben a példában az Iris Dataset) megnyitásával kezdhetjük elemzésünket.

Kattintson az Osztályozás fülre, válassza a Naive Bayes osztályozót, majd kattintson a Start gombra. Látni fogja, hogy gyorsan elérhetjük a 96% -os besorolási pontosságot anélkül, hogy bármilyen kódot kellene írnunk!

Következtetés

Abban az esetben, ha további információkra kíváncsi a Weka használatának megkezdéséről, a Google Developers ezen YouTube-sorozata remek kiindulópont.

Keress meg

Ha naprakészen akarja tartani legfrissebb cikkeimet és projektjeimet, kövessen a Medium oldalon, és iratkozzon fel a levelezőlistámra. Ezek a kapcsolattartási adataim:

  • Linkedin
  • Személyes blog
  • Személyes weboldal
  • Közepes profil
  • GitHub
  • Kaggle

Címlapfotó erről a cikkről.