Ezek a legjobb ingyenes nyílt adatforrások, amelyeket bárki használhat

Mi az a nyílt adat?

Egyszerűbben kifejezve: az Open Data azt a fajta adatot jelenti, amely mindenki számára és mindenki számára hozzáférhető, hozzáférés, módosítás, újrafelhasználás és megosztás céljából.

Az Open Data különböző „nyílt mozgalmakból” származik, például nyílt forráskódú, nyílt hardveres, nyílt kormányzati, nyílt tudományos stb.

A kormányok, a független szervezetek és az ügynökségek felajánlották, hogy kinyissák az adatok árterét, hogy egyre több nyílt adatot hozzanak létre a szabad és könnyű hozzáférés érdekében.

Miért fontos a nyílt adat?

A nyílt adatok azért fontosak, mert a világ egyre inkább adatközpontúvá vált. De ha vannak korlátozások az adatokhoz való hozzáférésre és felhasználásra, az adatközpontú üzleti és kormányzási elképzelés nem valósul meg.

Ezért a nyílt adatnak megvan a maga egyedi helye. Lehetővé teheti a globális problémák és az egyetemes kérdések teljesebb megértését. Nagy lendületet adhat a vállalkozásoknak. Nagy lendületet jelenthet a gépi tanuláshoz. Segíthet a globális problémák, például a betegségek, a bűnözés vagy az éhínség elleni küzdelemben. A nyílt adatok felhatalmazhatják az állampolgárokat, és ezáltal megerősíthetik a demokráciát. Korszerűsítheti a társadalom és a kormányok által felépített folyamatokat és rendszereket. Segíthet átalakítani a világ megértését és a világgal való kapcsolatunkat.

Tehát itt van a 15 fantasztikus nyílt adatforrás listám:

1. A Világbank nyílt adatai

A Világbank nyílt adatai a világ legátfogóbb adatainak tárházaként szolgálnak a világ különböző országaiban zajló eseményekről, és ez a nyílt adatok alapvető forrása. Hozzáférést biztosít más adatkészletekhez is, amelyeket az adatkatalógus említ.

A Világbank nyílt adatai hatalmasak, mivel 3000 adatkészlettel és 14000 mutatóval rendelkezik, amelyek felölelik a mikroadatokat, az idősor statisztikákat és a térbeli adatokat.

A kívánt adatokhoz való hozzáférés és felfedezése szintén meglehetősen egyszerű. Mindössze annyit kell tennie, hogy megadja a mutató nevét, országát vagy témáját, és ez megnyitja az Ön számára az Open Data kincsesházát. Ez lehetővé teszi az adatok letöltését különböző formátumokban, például CSV, Excel és XML formátumban.

Ha újságíró vagy akadémikus vagy, elbűvölsz a rendelkezésedre álló eszközök tömbjében. Elérheti elemzését és vizualizációs eszközeit, amelyek megerősíthetik a kutatását. Ez elősegítheti a globális problémák mélyebb és jobb megértését.

Hozzáférhet az API-hoz, amely segít létrehozni a szükséges adatmegjelenítéseket, élő kombinációkat más adatforrásokkal és még sok más ilyen funkciót.

Ezért nem meglepő, hogy a Világbank nyílt adatai vezetik az Open Data források bármelyik listáját!

2. WHO (Egészségügyi Világszervezet) - Nyílt adattár

A WHO nyílt adatok tárháza az, hogy a WHO hogyan követi nyomon 194 tagállamának egészségügyi specifikus statisztikáit.

Az adattár szisztematikusan rendezi az adatokat. Különböző igények szerint érhető el. Például a halálozás vagy a betegségek terhe, hozzáférhetünk olyan adatokhoz, amelyek legalább 100 kategóriába sorolhatók, például a millenniumi fejlesztési célok (gyermekétkeztetés, gyermekegészségügy, anyai és reproduktív egészség, immunizálás, HIV / AIDS, tuberkulózis, malária, elhanyagolt betegségek, víz és szennyvízkezelés), nem fertőző betegségek és kockázati tényezők, járványra hajlamos betegségek, egészségügyi rendszerek, környezeti egészség, erőszak és sérülések, méltányosság stb.

Saját igényeinek megfelelően áttekintheti az adatkészleteket témák, kategória, mutató és ország szerint.

A jó dolog az, hogy az Excel formátumban bármilyen szükséges adat letölthető. Az adatok portáljának használatával figyelemmel kísérheti és elemezheti is az adatokat.

Az Egészségügyi Világszervezet adat- és statisztikai tartalmának API-ja is elérhető.

3. Google Public Data Explorer

A 2010-ben elindított Google Public Data Explorer segítségével hatalmas mennyiségű közérdekű adatkészletet fedezhet fel. Megjelenítheti és közölheti az adatokat a saját felhasználása céljából.

Ez elérhetővé teszi a különböző ügynökségek és források adatait. Például hozzáférhet a Világbank, az Egyesült Államok Munkaügyi Statisztikai Irodája és az Egyesült Államok Irodája, az OECD, az IMF és mások adataihoz.

A különböző érdekelt felek többféle célból férnek hozzá ezekhez az adatokhoz. Akár hallgató, akár újságíró vagy politikai döntéshozó vagy akadémikus, használhatja ezt az eszközt a nyilvános adatok vizualizálásának létrehozásához.

Az adatok megjelenítésének különféle módjait telepítheti, például vonaldiagramokat, oszlopdiagramokat, térképeket és buborékdiagramokat a Data Explorer segítségével.

A legjobb az, hogy ezeket a megjelenítéseket meglehetősen dinamikusnak találná. Ez azt jelenti, hogy látni fogja őket az idő múlásával. Változtathat témákat, összpontosíthat különböző bejegyzésekre és módosíthatja a méretarányt.

Könnyen megosztható is. Amint elkészíti a diagramot, beágyazhatja a webhelyére vagy a blogjába, vagy egyszerűen megoszthatja a linket barátaival.

4. Nyílt adatok nyilvántartása az AWS-en (RODA)

Ez egy nyilvános adatkészleteket tartalmazó adattár. Az adatok az AWS forrásokból érhetők el.

Ami a RODA-t illeti, felfedezheti és megoszthatja a nyilvánosan elérhető adatokat.

A RODA-ban kulcsszavakat és címkéket használhat általános adattípusokhoz, például genomi, műholdas képekhez és szállításhoz, hogy bármilyen keresett adatot keressen. Mindez egy egyszerű webes felületen lehetséges.

Minden adatkészletnél részletes oldalakat, használati példákat, licencinformációkat és oktatóanyagokat vagy alkalmazásokat talál, amelyek ezeket az adatokat használják.

Számítási és adatelemzési termékek széles körének felhasználásával elemezheti a nyílt adatokat, és felépítheti a kívánt szolgáltatásokat.

Bár az adatok, amelyekhez hozzáfér, AWS-erőforrásokon keresztül érhetők el, szem előtt kell tartani, hogy azokat nem az AWS biztosítja. Ezek az adatok különböző ügynökségekhez, kormányzati szervezetekhez, kutatókhoz, vállalkozásokhoz és magánszemélyekhez tartoznak.

5. Az Európai Unió nyílt adatportálja

Hozzáférhet az EU-intézmények, ügynökségek és egyéb szervezetek által közzétett nyílt adatokhoz egyetlen platformon, nevezetesen az Európai Unió nyílt adatportálján.

Az EU nyílt adatportálja az EU szakpolitikai területeire vonatkozó létfontosságú nyílt adatoknak ad otthont. Ezek a szakpolitikai területek magukban foglalják a gazdaságot, a foglalkoztatást, a tudományt, a környezetvédelmet és az oktatást.

Körülbelül 70 uniós intézmény, szervezet vagy szervezeti egység, például az Eurostat, az Európai Környezetvédelmi Ügynökség, a Közös Kutatóközpont, valamint az Európai Bizottság más főigazgatóságai és az EU ügynökségei tették nyilvánosságra adatkészleteiket és engedélyezték a hozzáférést. Ezek az adatkészletek dátumig meghaladták az 11700 számot.

A portál megkönnyíti a hozzáférést. Könnyen kereshet, felfedezhet, linkelhet, letölthet és újrafelhasználhatja az adatokat a közös metaadatok katalógusán keresztül. Megteheti saját céljaira. Lehet kereskedelmi vagy nem kereskedelmi célú.

A metaadat-katalógusban kereshet egy interaktív keresőmotor (Adatok fül) és SPARQL-lekérdezések (Csatolt adatok fül) segítségével.

A katalógus használatával hozzáférést nyerhet az uniós intézmények, ügynökségek és szervezetek különböző webhelyein tárolt adatokhoz.

6. Öt harmincnyolc

Remek oldal az adatközpontú újságíráshoz és a történetek elmeséléséhez.

Különböző adatforrásokat kínál számos ágazathoz, például a politikához, a sporthoz, a tudományhoz, a gazdasághoz stb. Letöltheti az adatokat is.

Amikor hozzáfér az adatokhoz, egy rövid magyarázattal találkozik az egyes adatkészletekről a források tekintetében. Azt is meg fogja tudni, hogy mit jelent és hogyan kell használni.

Annak érdekében, hogy ezeket az adatokat felhasználóbaráttá tegye, az adatkészleteket a lehető legegyszerűbb, nem saját formátumban biztosítja, például CSV fájlokat. Mondanom sem kell, hogy ezek a formátumok könnyen hozzáférhetők és feldolgozhatók emberek és gépek mellett.

Ezen adatkészletek segítségével történeteket és vizualizációkat hozhat létre saját igényeinek és preferenciáinak megfelelően.

7. Amerikai Népszámlálási Iroda

Az US Census Bureau a szövetségi kormány legnagyobb statisztikai ügynöksége. Megbízható tényeket és adatokat tárol és szolgáltat Amerika népeivel, helyeivel és gazdaságával kapcsolatban.

A Népszámlálási Iroda nemes küldetését, hogy szolgáltatásait kiterjessze, a legmegbízhatóbb minőségi adatok szolgáltatójának tekinti.

Legyen szó szövetségi, állami, helyi vagy törzsi kormányról, mindegyik különféle célokra használja fel a népszámlálási adatokat. Ezek a kormányok ezeket az adatokat felhasználják az új lakások és az állami létesítmények helyének meghatározására. Kihasználják a közösségek, államok és az USA demográfiai jellemzőinek vizsgálatakor is.

Ezeket az adatokat felhasználják a közlekedési rendszerek és az utak tervezésénél is. A kvóták eldöntéséről, valamint a rendőrség és a tűzoltóságok létrehozásáról ez az adat jól jön. Amikor a kormányok helyi választási területeket hoznak létre, iskolákat, közműveket stb., Felhasználják ezeket az adatokat. Gyakorlat, hogy évtizedenként egyszer állítsák össze a népességi információkat, és ezek az adatok nagyon hasznosak ennek megvalósításához.

Különféle eszközök léteznek, például az American Fact Finder, a Census Data Explorer és a Quick Facts, amelyek hasznosak abban az esetben, ha adatokat akar keresni, testre szabni és vizualizálni.

Például a Gyors Tények csak statisztikákat tartalmaz az összes államról, megyéről, városról, sőt az 5000 vagy annál nagyobb lakosságú városokról.

Hasonlóképpen, az American Fact Finder segíthet olyan népszerű tények felfedezésében, mint a népesség, a jövedelem stb.

A jó dolog az, hogy a Census Data Explorer segítségével kereshet, kölcsönhatásba léphet az adatokkal, megismerheti a népszerű statisztikákat és megtekintheti a kapcsolódó diagramokat. Ezenkívül vizuális eszközzel is testre szabhatja az adatokat egy interaktív térképélményben.

8. Data.gov

A Data.gov az amerikai kormány nyitott adatainak kincse. Csak nemrégiben született döntés arról, hogy az összes kormányzati adatot ingyen bocsátják rendelkezésre.

Indításakor csak 47 volt. Jelenleg 180 000 adatkészlet van.

A Data.gov miért nagyszerű erőforrás, mert megtalálhatók olyan adatok, eszközök és erőforrások, amelyeket különféle célokra telepíthet. Végezheti kutatását, fejlesztheti webes és mobil alkalmazásait, és akár megtervezheti az adatok megjelenítését is.

Csak annyit kell tennie, hogy beírja a kulcsszavakat a keresőmezőbe, és böngészhet a típusok, címkék, formátumok, csoportok, szervezettípusok, szervezetek és kategóriák között. Ez megkönnyíti a szükséges adatokhoz vagy adatkészletekhez való könnyű hozzáférést.

A Data.gov a Project Open Data Schema programot követi - a Data.gov minden megjelenített adatkészletéhez szükséges mezők (Cím, Leírás, Címkék, Utolsó frissítés, Kiadó, Kapcsolattartó neve stb.) Halmaza.

9. DBpedia

Mint tudják, a Wikipédia remek információforrás. A DBpedia célja, hogy strukturált tartalmat szerezzen a Wikipédia által létrehozott értékes információkból.

A DBpedia segítségével szemantikailag kereshet és felfedezheti a Wikipedia erőforrás kapcsolatait és tulajdonságait. Ez magában foglalja a linkeket más kapcsolódó adatkészletekhez is.

Körülbelül 4,58 millió entitás van a DBpedia adatkészletben. 4,22 millió embert sorolnak az ontológiába, köztük 1 445 000 ember, 735 000 hely, 123 000 zenei album, 87 000 film, 19 000 videojáték, 241 000 szervezet, 251 000 faj és 6000 betegség.

Körülbelül 125 nyelven vannak címkék és kivonatok ezekhez az entitásokhoz. 25,2 millió link van a képekhez. Külső weboldalakra 29,8 millió hivatkozás található.

A DBpedia használatához mindössze annyit kell tennie, hogy SPARQL-lekérdezéseket ír le a végpont ellen, vagy letölti a kiírásaikat.

A DBpedia számos vállalkozásnak, például az Apple-nek (a Siri-n keresztül), a Google-nak (a Freebase és a Google Knowledge Graph-on keresztül) és az IBM-nek (Watson-on keresztül), és különösen a mesterséges intelligenciával kapcsolatos tekintélyes projektjeiknek profitált.

10. freeCodeCamp nyílt adatok

Ez egy nyílt forráskódú közösség. Miért fontos, mert ez lehetővé teszi a kódolást, a pro bono projektek létrehozását a nonprofit szervezetek után és a fejlesztői munka megragadását.

Ennek megvalósítása érdekében a freeCodeCamp.org közösség minden hónapban hatalmas mennyiségű adatot tesz elérhetővé. Nyílt adatokká változtatták.

Különféle dolgokat talál ebben az adattárban. Megtalálható az adatkészletek, a projektek azonos és akár demóinak elemzése a freeCodeCamp adatai alapján. Megtalálhat linkeket a freeCodeCamp adatait tartalmazó külső projektekre is.

Segíthet a sokféle projektben és feladatban, amelyekre gondolhat. Legyen szó webanalitikáról, közösségi média elemzésről, közösségi háló elemzésről, oktatáselemzésről, adatmegjelenítésről, adatközpontú webfejlesztésről vagy botokról, a közösség által kínált adatok rendkívül hasznosak és hatékonyak lehetnek.

11. Yelp Open Datasets

A Yelp adatkészlet alapvetően csak a saját vállalkozásaink, a vélemények és a felhasználói adatok személyes, oktatási és tudományos célokra való felhasználásának részhalmaza.

A Yelp Open Datasets 5996 996 véleményt, 188 593 vállalkozást, 280 991 képet és 10 nagyvárosi területet tartalmaz.

Különböző célokra használhatja őket. Mivel JSON fájlként érhetők el, felhasználhatja őket arra, hogy megtanítsa a diákokat az adatbázisokra. Használhatja őket az NLP elsajátításához vagy a gyártási adatok mintájához, miközben megérti a mobilalkalmazások tervezését.

Ebben az adatkészletben minden fájl megtalálható egyetlen objektumtípusból, soronként egy JSON-objektumból.

12. UNICEF adatkészlet

Mivel az UNICEF sokféle kritikus kérdéssel foglalkozik, releváns adatokat gyűjtött az oktatásról, a gyermekmunkáról, a gyermek fogyatékosságáról, a gyermekhalandóságról, az anyai halálozásról, a víz- és szennyvízkezelésről, az alacsony születési súlyról, a terhesgondozásról, a tüdőgyulladásról, a maláriáról, a jódhiányról rendellenesség, női nemi szerv megcsonkítása / vágása és serdülők.

Az UNICEF az IATI nyilvántartásában közzétett nyílt adatkészleteit: //www.iatiregistry.org/publisher/unicef ​​közvetlenül az UNICEF operációs rendszeréből (VISION) és más adatrendszerekből vették ki, és tükrözik az UNICEF egyes irodáinak bemeneteit.

A jó dolog az, hogy van egy rendszeres frissítés, amikor ezekről az adatkészletekről van szó. Az adatokat minden hónapban frissítik annak érdekében, hogy átfogóbbak, megbízhatóbbak és pontosabbak legyenek.

Szabadon és egyszerűen hozzáférhet ezekhez az adatokhoz. Ehhez letöltheti ezeket az adatokat CSV formátumban. Megtekintheti a mintaadatokat letöltés előtt is.

Bár bárki felfedezheti és megjelenítheti az UNICEF adatkészleteit, három fő kiadó létezik:

Az UNICEF TÁMOGATÁSI ÁTLÁTHATÓSÁGI PORTÁLJA: Sokkal könnyebben hozzáférhet az adatkészletekhez, ha ezt a portált használja. Részleteket tartalmaz minden országról, ahol az UNICEF működik.

Kiadói d-portál: Jelenleg a BETA-ban található. Ezzel a portállal felfedezheti az IATI adatait.

Kereshet a fejlesztési tevékenységekkel, a költségvetésekkel stb. Kapcsolatos információkban. Országosan felfedezheti ezeket az információkat.

Kiadói adatplatform: Ezen a platformon könnyen hozzáférhet az IATI nyilvántartáson keresztül elérhető adatok statisztikáihoz, diagramjaihoz és mutatóihoz. Ha rákattint a fejlécekre, akkor a táblán számos rendezhető is, amelyet a platformon lát. A platformokon számos adatkészlet megtalálható géppel olvasható JSON formátumban is.

13. Kaggle

A Kaggle nagyszerű, mert elősegíti a különböző adatkészlet-publikációs formátumok használatát. Ami viszont jobb, hogy határozottan javasolja, hogy az adatkészlet-kiadók hozzáférhető, nem saját formátumban osszák meg adataikat.

A platform támogatja a nyílt és hozzáférhető adatformátumokat. Nemcsak a hozzáférés szempontjából fontos, hanem az is, hogy mit szeretne csinálni ezekkel az adatokkal. Ezért a Kaggle Dataset egyértelműen meghatározza az adatmegosztás során ajánlott fájlformátumokat.

A Kaggle-adatkészletek egyedülállója, hogy nem csak adattárról van szó. Minden adatkészlet egy olyan közösséget jelent, amely lehetővé teszi az adatok megvitatását, a nyilvános kódok és technikák megismerését, valamint a saját projektjeinek a Kernelekben történő megfogalmazását.

A CSV, JSON, SQLite, Archive, Big Query stb. Olyan fájltípusok, amelyeket a Kaggle támogat. Különféle erőforrásokat találhat annak érdekében, hogy elkezdhesse munkáját a nyílt adatprojekten.

A legjobb az, hogy a Kaggle lehetővé teszi az adatkészletek privát vagy nyilvános közzétételét és megosztását.

14. LODUM

Ez a Münsteri Egyetem Open Data kezdeményezése. Ez a kezdeményezés lehetővé teszi, hogy bárki hozzáférhessen az egyetemről szóló bármilyen nyilvános információhoz géppel olvasható formátumban. Könnyedén hozzáférhet és újból felhasználhatja az igényeinek megfelelően.

A tudományos műtárgyak nyílt és összekapcsolt adatokként kódolt adatait a projekt keretében elérhetővé teszik.

A kapcsolt adatok segítségével lehetőség van adatok, ontológiák és különféle metaadat-szabványok megosztására és felhasználására. Valójában előreláthatóan ez lesz a metaadatok és maga az interneten történő adatszolgáltatás elfogadott szabványa.

A LODUM csapata közösen kezdeményezte a LinkedUniversities.org és a LinkedScience.org webhelyeket.

Az adatok elemzéséhez használhatja a SPARQL szerkesztőt vagy az R SPARQL csomagot.

A SPARQL csomag lehetővé teszi a kapcsolódást egy SPARQL végponthoz HTTP-n keresztül, SELECT lekérdezés vagy frissítési lekérdezés (LOAD, INSERT, DELETE) feltöltését.

15. UCI Machine Learning Repository

Átfogó adattárként szolgál azokról az adatbázisokról, tartományelméletekről és adatgenerátorokról, amelyeket a gépi tanulási közösség használ a gépi tanulási algoritmusok empirikus elemzésére.

Ebben az adattárban jelenleg 463 adatkészlet található a gépi tanulási közösség szolgáltatásaként.

Az Irvine Kaliforniai Egyetem Gépi Tanulás és Intelligens Rendszerek Központja házigazdája és fenntartója. David Aha eredetileg az UC Irvine végzős hallgatójaként hozta létre.

Azóta a hallgatók, oktatók és kutatók a világ minden tájáról használják, mint a gépi tanulás adatkészleteinek megbízható forrását.

Működik az, hogy minden egyes adatkészletnek külön weboldala van, amely felsorolja az összes ismert részletet, beleértve az azokat vizsgáló releváns publikációkat is. Ezeket az adatsorokat ASCII fájlként töltheti le, gyakran a hasznos CSV formátumban.

Az adatkészletek részleteit olyan szempontok szerint foglalják össze, mint az attribútumtípusok, a példányok száma, az attribútumok száma és a közzétett év, amelyek rendezhetők és kereshetők.

Nyílt adatportálok és keresőmotorok:

Bár rengeteg adatkészlet jelent meg számos ügynökség által évente, nagyon kevés adatállomány válik elismerté és létrehozottá.

Az ok, amiért nagyon kevés ilyen adatkészlet hasznos erőforrásként szolgál, az, hogy kihívást jelent az adatok fejlesztése, kezelése és átadása olyan módon, hogy az emberek és szervezetek hasznosnak és könnyen használhatónak találják őket.

Az alábbiakban azonban talál néhány további fontos nyílt adatportált és platformot, amelyek lehetővé teszik a felhasználók számára a nyílt adatokhoz való könnyű hozzáférést, a hatások tanulmányozását és értékes betekintést.

  1. Google adatkészlet keresés
  2. Dataverse
  3. Open Data Kit
  4. Ckan
  5. Open Data Monitor
  6. Plenar.io
  7. Open Data Impact Map

Következtetés

A nyílt adatok a nap sorrendje. A világ fokozatosan elindult a nyílt rendszerek felé, és a nyílt adatok ezzel helyesen szinkronban vannak.

A nyílt adatokat kihasználó vállalkozások és szervezetek versenyelőnyt szereznek, és képesek lesznek uralni a jövőt.