Hatalmas eszközök a MongoDB adatmegjelenítéshez

Számos rendelkezésre álló vizualizációs eszközzel nehéz megtalálni a megfelelőt a MongoDB adatokhoz, amely out-of-the-box funkcióval rendelkezik.

Ma szeretnék elmondani az ilyen vizualizációs eszközök felfedezésével kapcsolatos tapasztalataimról.

Célom egy MongoDB adatbázis adatainak elemzése volt. Olyan munkafolyamatot akartam kidolgozni az adatelemzéshez, amely ötvözi az adatbázis-kezelés elemzését, az adatok összesítését és az adatok megjelenítését.

Itt vannak a választott eszközök:

  • Iránytűegy GUI alkalmazás a MongoDB adatok és a gyűjtemények sémájának mélyreható elemzéséhez és vizualizálásához. Valós idejű képet nyújt az adatokról. Az intuitív kezelőfelület segített az adatok jelentésére összpontosítani.
  • A Flexmonster Pivot Table a fejlett webes jelentések és elemzések eszköze. Míg a Compass önálló alkalmazás, rájöttem, hogy a Flexmonster közvetlenül integrálódik a webes projektbe. Sikerült beágyaznom az Angular 4 alkalmazásomba, és adatelemzésre használtam.

A megjelenítési folyamat első része egy kapcsolat létrehozása egy MongoDB adatbázishoz az Iránytűvel. Ezután felfedezheti, hogy a Compass milyen funkciókat kínál, és milyen elemzéseket végezhet az eszköz használatával.

A második részt a MongoDB további elemzésének szenteltem. Az adatokat betöltjük egy forgatótáblába, és feltárjuk az ez által kínált lehetőségeket.

Mint egy adatforrás kutatás , az általam kiválasztott adathalmaz 120 éves olimpiai történelemben és az eredmények.

Ennek az adatkészletnek tipikus JSON szerkezete van, amely eltér a MongoDB által megkövetelt formátumtól. Ennek importálásához a MongoDB-be a következő parancsot hajtottam végre a CLI-ben:

mongoimport - db  - collection athletes - type json - file athletes.json  - jsonArray

Az adatok iránytűvel történő megértése

Eleinte megemlítek néhány adatbázis-kezelési funkciót.

Az Compass képes hisztogramokat létrehozni az adatfrekvencia ábrázolására. Ez segített elemezni a dokumentumok, az adattípusok és az értékek eloszlását az egyes mezőkben a gyűjteményen belül.

Mindenekelőtt a Compass alkalmazás segítségével csatlakoztam a localhoston futó MongoDB példányhoz.

A „sportolók” gyűjtemény főoldalán ellenőriztem a gyűjtemény adatait, interaktív módban szerkesztettem az adatokat, és kipróbáltam az egyszerű és összetett lekérdezéseket.

Séma megjelenítő eszközsegített megérteni az adataimat.

Itt ellenőriztem a mezők adattípusainak statisztikáit: a mezőhöz használt adattípusok százalékos arányát a gyűjtemény összes dokumentumában.

Megállapítottam, hogy egyes mezőknél vegyes adattípusok vannak. Az én példámban numerikus típusú "Magasság" vana dokumentumok 80% -ában, de az esetek 20% -ában sztringtípus jelenik meg.

Számomra ez azt jelentette, hogy van hiányosság az adatkészletemben. A magasság eltérően tárolódik a sportolók között.

Összegzés az Iránytűvel

Milyen funkciók teszik a MongoDB-t és az Iránytűt olyan népszerűvé az olyan elemzők körében, akik gyakran dolgoznak félig strukturált és strukturálatlan adatokkal?

A MongoDB azért hasznos a valós idejű elemzésekhez, mert támogatja az összesítő folyamatokat. Ez magában foglalhatja a válogatást és a szűrést, valamint az adatok csoportosítását.

Míg az Iránytű valós idejű lekérdezésépítést támogat az összesítéshez.

Az adatok bizonyos részeire összpontosítva a dokumentumokat az „Életkor” mező alapján szűrtem.

Csak azoknak a sportolóknak a megjelenítésére, akik 22 évesnél fiatalabbak, kiválasztottam a hisztogramon a szükséges területet, hogy elkészítsem a lekérdezést az „Age” mezőben. Ennek eredményeként a megfelelő dokumentumokat visszaküldtük.

Ugyanígy szűrtem az értéktartomány alapján is. Ezután az adatokat kor szerint növekvő sorrendbe rendeztem:

De az aggregációs folyamat szakaszainak felépítéséhez és az adatok csoportosításához ki kellett használnom a MongoDB lekérdezési nyelv ismereteit. Könnyebb volt a forgástáblában elvégezni.

Az adatok elemzése a Flexmonster Pivot táblázat segítségével

Webprojektjeim során az Angulart használom. Tehát követtem egy Angular oktatóanyagot a pivot tábla beágyazásához. Az adatok megszerzéséhez az adatbázisomból ezt az oktatóanyagot használtam.

Az alkalmazásomból csatlakoztam a MongoDB-hez, és lehívtam az adatokat a sportolókról. Az adatokat tömörítettük, majd a pivot táblába továbbítottuk vizualizáció céljából.

Miután feltöltettem a sportolókra vonatkozó mintaadatokat a forgatótáblába, elemezni akartam a sportolók körében a minimális és a maximális életkort. Ezenkívül szerettem volna meghatározni a történelem legjobb csapatait a teljes éremmennyiség alapján.

Az adatelemzés megkezdéséhez kijelöltem az oszlopok és sorok mezőit.

Az „Érem” mező használatához kiválasztottam mérésekre, és a következő eredményeket értem el:

  1. Szűrte a rekordokat érték szerint, hogy az első 5 csapat jelenjen meg a legtöbb éremmel
  2. A jelentésemhez feltételes formázást alkalmaztam, hogy kiemeljem azokat a csapatokat, amelyek több mint 185 éremmel rendelkeznek.

3. Ezután kiválasztottam az „Életkor” elemzést és elemeztem a sportolók maximális életkorát:

4. Ezután rátértem a pivot-diagramokra és vizuálisabban elemeztem az adatokat, hogy megismerjem a nyári szezon legjobb csapatait:

Következtetés

Tehát ma megosztottam a Compass és a Flexmonster Pivot Table használatával kapcsolatos tapasztalataimat. Véleményem szerint mindkét eszköz képes segíteni egy kreatív vizuális történet elkészítésében, és intelligens módon elemezni az adatokat.

Remélem, hasznosnak találta a tapasztalataimról szóló olvasmányokat, és most jó úton jár a sikeres MongoDB adatelemzéshez.

Örömmel hallok bármilyen visszajelzést erről az áttekintésről. Kérem, mondja meg véleményét a megjegyzésekben. Milyen eszközöket tudna ajánlani a MongoDB adatmegjelenítéséhez ? Jól kezelik és feldolgozzák az adatait?