A matematika és a programozás együtt járnak. Ha programozó vagy, akkor valamikor matematikát kell használnod.
Az adattudomány, a gépi tanulás, a mesterséges intelligencia és a kriptovaluták mind összetett matematikai elveken alapulnak.
A matematikai függvények használatának azonban nem kell összetettnek lennie! A Python mindent elvonatkoztat, így miután megértette a fogalmakat, nem kell megértenie a megvalósítás teljes részleteit.
Mathnak nem kell ijesztőnek lennie
Nagyon sok matematikai funkcióval találkozhat. Ha adatokkal vagy elemzéssel dolgozik, fontos, hogy megértsen néhány matematikai alapelvet és funkciót.
Az egyik ilyen funkciót meg kell értenie a mean
függvény.
Ne riadjon vissza a névtől - mean
a Python függvényében nincs semmi jelentősége (szójáték) .
Ez a bejegyzés önálló, de remélem, van némi tapasztalata a Python-nal való együttműködésben, és hogy tudja, mi a Python-lista. Ha nem, olvassa el ezt a cikket, mielőtt továbblépne.
Ha végzett, gyere vissza, és csatlakozz hozzám, hogy mélyen belemerülhess a mean
funkcióba.
Statisztika
Tehát meg akarja ismerni a mean
funkciót. Nagyszerű! De mielőtt ezt a funkciót megvizsgálnánk, fontos megvizsgálni azt a tudományágat, amelyből származik: a statisztikákat.

A fenti képen grafikont látunk. A grafikon egy képi ábrázolás, amely megmutatja az egyik változó viszonyát a másikhoz.
A grafikonok azért hasznosak, mert lehetővé teszik az adatok rendszerezését, hogy gyorsan láthassuk az adatok közötti trendeket és összefüggéseket. A grafikon csak egy eszköz, amelyet felhasználhatunk az adatok vizualizálására és elemzésére.
A statisztika a matematika olyan ága, amely lehetővé teszi számunkra, hogy szisztematikus módon osztályozzuk, elemezzük és értelmezzük az adatokat. Ez azért fontos, mert a statisztikákkal kész eszközök gyűjteménye van ezeknek a dolgoknak a végrehajtására.
Képzelje el, ha minden alkalommal újra ki kell találnia egy fűrészt, amikor egy darab fát kell vágnia. Sok embert hívnánk fűrésznek más néven, annak ellenére, hogy ugyanazt csinálják. A probléma elkerülése érdekében olyan nevet adtunk a fűrésznek, amellyel mindenki hivatkozhat rá.
Ugyanez történik a statisztikákban is - vannak olyan jól ismert eszközeink, amelyeket mindenki ismer. Az egyik ilyen eszköz az átlag.
Mód, Medián és Átlag
Bár az átlag tökéletesen képes önállóan állni, általában egy trió részeként tanítják, amely magában foglalja a módot, a mediánt és az átlagot.
Nézzünk meg egy számcsoportot, hogy megértsük, mi történik itt. Képzelje el, hogy az alábbi számok vannak:
1, 2, 3, 3, 4, 6, 9
Tegyük fel, hogy ki akartuk fejezni, melyik szám fordul elő a legtöbbször. 3 lenne, és ennek a tulajdonságnak a neve mode. A mód az a szám, amely a leggyakoribb egy általunk vizsgált halmazban.
A rendezett halmaz közepén levő számot mediánnak nevezzük. A numerikus halmaz mediánjának megtalálásához rendezze a számokat a legkisebbtől a legnagyobbig, majd nézze meg a középen lévő számot. A fenti számkészlet már el van rendezve a legkisebbtől a legnagyobbig, így a mediánszám is 3.
Végül az átlag egy másik módja a halmaz átlagának hivatkozására. Az átlag megtalálásához egyszerűen összeadja az összes számot, és ossza el a halmaz összes elemének számával. A fenti számok esetén, ha mindet összeadjuk, akkor 28-at kapunk. A halmaz összes elemének száma 7, tehát átlagunk 4.
Miért van szükségünk az átlagra?
Tehát ezen a ponton elgondolkodhat azon, hogy miért kellene mégis megtalálnunk egy szám átlagát.
A helyzet az, hogy még maga a statisztika is több csoportra oszlik. Ahogy vannak olyan eszközei, amelyeket fa, más fémek kezelésére használnak, a statisztikák egyes eszközei osztályokba vannak csoportosítva, mivel hasonló célra használják őket.
A statisztikák egyik ilyen csoportját összefoglaló statisztikának nevezzük. Az egyik dolog, amire a statisztikákat használják, az adatok leírása, az összefoglaló statisztikák pedig az e célra használt eszközök gyűjteménye. Az eszközosztály egyik eleme az átlag.
Az átlag azért fontos, mert segít elemezni az úgynevezett eloszlást. A statisztikákban az eloszlás egy olyan módszer, amelyet arra használunk, hogy megvizsgáljuk azt a változót, amelyről információt akarunk kapni. Egy disztribúció segítségével megvizsgáljuk ennek a változónak az értékeit és annak gyakoriságát.
Ha adatokat gyűjtünk, akkor az eloszlás egyik általános típusát a normális eloszlásnak nevezzük, amely haranggörbe formájában jelenik meg:

Vagyis a változónak lesz egy közös értéke, amely felé hajlik, valamint egy kiindulási és egy végpont.
Ami azt jelenti, hogy lehetővé teszi számunkra, hogy egy ilyen eloszlást vegyünk, és megnézzük a változó központi tendenciáját, amely pont az a pont, amikor a változó értékei klaszterezni kezdenek.
Így elmondhatjuk, hogy az átlag leírja az eloszlás központi tendenciáját.
Az átlag kiszámítása a Pythonban
Manuálisan kiszámolhatjuk az átlagot, ha van egy kis numerikus adatsorunk, akkor néhány értékkel dolgozhatunk. Ha azonban több száz vagy ezer érték van egy adathalmazban, lehetetlenné válik a kézi kiszámítása.
Mivel a Python egy "akkumulátorral együtt" nyelv, ezt megtehetjük, ha mean
a statisztikai modul funkcióját használjuk a Pythonon belül.
Használjuk a mean
függvényt, hogy kiszámítsuk a bejegyzésben korábban szereplő numerikus adatsor átlagát:
# 1. import the statistics module import statistics # 2. list containing our numerical data set numerical_data_set = [1, 2, 3, 3, 4, 6, 9] # 3. calculate the mean calc_mean = statistics.mean(numerical_data_set) # 4. print our calculated mean print("Mean is: ", calc_mean)
Kódunk egy 4 lépéses sorrendből áll, amelynek segítségével kiszámíthatjuk az átlagot:
- Importáljuk az átlagos függvényünket tartalmazó statisztikai modult
- Létrehozunk egy Python listát, amely tartalmazza a numerikus adatsort, amelynek az átlagát szeretnénk kiszámítani
- Kiszámoljuk az átlagot, és az eredményt egy változóban tároljuk,
calc_mean
- Kiszámítjuk a kiszámított átlagot, hogy vizuális visszajelzést kapjunk
Amikor futtatjuk a kódot, a következő kimenetet kapjuk:

A program ugyanazt az értéket adja ki, mint a kézi számítások. Ha nagy adathalmazokkal dolgozunk, ez a funkció képes lesz méretezni, hogy kezelje bármit, amit csak eldobhatunk.
Csomagolás
Ebben a bejegyzésben mean
a Python funkcióját néztük meg . A statisztikák egészének megvitatásával kezdtük, majd mélyen belemerültünk az átlagba.
Now that you have a solid understanding of statistics and the mean
function in Python, you can use it in your own programs.
If you liked this article, then you may also be curious about learning about data structures and algorithms. If you want a simple, clear, step by step guide to learning about data structures and algorithms without having to write a single line of code, then you can check out the book Codeless Data Structures and Algorithms.
Read the book here:
Kód nélküli adatszerkezetek és algoritmusok - Ismerje meg a DSA-t egyetlen kódsor megírása nélkül | Armstrong Subero | Apress Ez a könyv új, teljesen kód nélküli nézőpontot kínál az algoritmusok és adatstruktúrák számára. Tudjon meg többet az adatszerkezeti algoritmusokról (DSA) anélkül, hogy bármikor meg kellene nyitnia a kódszerkesztőt, fordítót kellene használnia, vagy meg kellene néznie az integrált fejlesztői környezetet (IDE). Bejelentkezés fiókKönyvespolc Bejelentkezés Apress Access