
Bevezetés
Ez a cikk az átlagos négyzetes hiba statisztikai módszerével foglalkozik , és leírom ennek a módszernek a regressziós egyeneshez való viszonyát .
A példa a derékszögű tengely pontjaiból áll. Meghatározunk egy matematikai függvényt, amely megadja a derékszögű tengely minden pontja között a legjobban haladó egyeneset.
Így megtudhatjuk a két módszer közötti kapcsolatot és azt, hogy kapcsolatuk eredménye hogyan néz ki.
Általános magyarázat
Ez a Wikipedia definíciója:
A statisztikákban egy becslés (egy nem figyelt mennyiség becslésére szolgáló eljárás) átlagos négyzethibája (MSE) méri a hibák négyzetének átlagát - vagyis a becsült értékek és a becsült értékek közötti átlagos négyzetbeli különbséget. Az MSE egy kockázati függvény, amely megfelel a négyzetes hibavesztés várható értékének. Az a tény, hogy az MSE szinte mindig szigorúan pozitív (és nem nulla), a véletlenszerűségnek vagy annak köszönhető, hogy a becslő nem számol olyan információkkal, amelyek pontosabb becslést eredményezhetnek.A cikk felépítése
- Érezd át az ötletet, a grafikon vizualizálását, az átlagos négyzethibaegyenletet.
- A matematikai rész, amely algebrai manipulációkat és két változó függvény származékát tartalmazza a minimum megtalálásához. Ez a szakasz azoknak szól, akik meg akarják érteni, hogyan kapjuk meg később a matematikai képleteket, kihagyhatod, ha ez nem érdekel.
- A kapott matematikai képletek és az egyes változók szerepe a képletben.
- Példák
Érezd át az ötletet
Tegyük fel, hogy hét pontunk van, és az a célunk, hogy találjunk egy vonalat, amely minimalizálja a különbözõ pontok négyzetnyi távolságát.
Próbáljuk megérteni ezt.
Veszek egy példát, és meghúzok egy vonalat a pontok között. Természetesen a rajzom nem a legjobb, de csak bemutató célokra szolgál.

Lehet, hogy felteszi magának a kérdést, mi ez a grafikon?
- a lila pontok a grafikon pontjai. Minden pontnak van egy x-koordinátája és egy y-koordinátája.
- A kék vonal az előrejelzési vonalunk. Ez egy olyan vonal, amely az összes ponton áthalad és a legjobban illeszkedik hozzájuk. Ez a vonal tartalmazza a megjósolt pontokat.
- Az egyes lila pontok és a jóslási vonalak közötti piros vonal a hiba. Minden hiba a pont és a megjósolt pont közötti távolság.
Emlékeznie kell erre az egyenletre az iskolai napjaiból , y = Mx + B , ahol M az egyenes meredeksége és B az egyenes metszete.
Meg akarjuk találni az M-t (meredekség) és a B-t (y-metszés), amelyek minimalizálják a négyzet hibáját!
Definiáljunk egy matematikai egyenletet, amely megadja az összes négyzetre eső átlagos négyzet hibát.

Elemezzük, mit is jelent valójában ez az egyenlet.
- A matematikában a furcsának tűnő karaktert összegzésnek (görög szigma) nevezzük. Ez egy számsorozat összege, i = 1-től n-ig. Képzeljük el ezt pontok tömbjeként, ahol végigmegyünk az összes ponton, az elsőtől (i = 1) az utolsóig (i = n).
- Minden pontra felvesszük a pont y-koordinátáját és az y'-koordinátát. Az y koordináta a lila pontunk. Az y pont az általunk létrehozott vonalon ül. Kivonjuk az y koordináta értékét az y'-koordináta értékből, és kiszámoljuk az eredmény négyzetét.
- A harmadik rész az összes (y-y ') ² érték összegének felvétele és elosztása n-vel, amely az átlagot adja.
Célunk, hogy minimalizáljuk ezt az átlagot, amely a legjobb vonalat nyújtja számunkra, amely az összes ponton keresztül megy.
A koncepciótól a matematikai egyenletekig
Ez a rész azoknak szól, akik meg akarják érteni, hogyan jutottunk el a matematikai egyenletekhez . Ha akarja, ugorhat a következő részre.
Mint tudják, a vonalegyenlet y = mx + b, ahol m a meredekség és b az y metszete.
Vegyük a grafikon minden egyes pontját, és elvégezzük a számítást (y-y ') ².
De mi az y ', és hogyan számoljuk ki? Nincs meg az adatok részeként.
De tudjuk, hogy az y 'kiszámításához az y = mx + b egyenletünket kell felhasználnunk, és az x-et be kell tennünk az egyenletbe.
Innen kapjuk a következő egyenletet:

Írjuk át ezt a kifejezést annak egyszerűsítése érdekében.

Kezdjük azzal, hogy kinyitjuk az egyenlet összes zárójelét. Kiszíneztem az egyenletek közötti különbséget, hogy könnyebben megértsem.

Most alkalmazzunk egy újabb manipulációt. Minden részt kiveszünk és összerakunk. Fogjuk az összes y-t és (-2ymx) -et stb., És mindegyiket egymás mellé tesszük.

Ezen a ponton kezdünk rendetlenek lenni, ezért vegyük az y, xy, x, x² összes négyzetértékének átlagát.
Határozzunk meg mindegyikhez egy új karaktert, amely az összes négyzetérték átlagát fogja képviselni.
Lássunk egy példát, vegyük az összes y értéket, és osszuk el n-vel, mivel ez az átlag, és nevezzük y-nek (HeadLine).

Ha az egyenlet mindkét oldalát megszorozzuk n-vel, akkor ezt kapjuk:

Ami a következő egyenletre vezet minket:

Ha megnézzük, mit kaptunk, láthatjuk, hogy van 3D felületünk. Úgy néz ki, mint egy pohár, amely élesen felfelé emelkedik.
Meg akarjuk találni M és B, amelyek minimalizálják a funkciót. M és M részleges származékot készítünk.
Mivel minimális pontot keresünk, a részleges deriváltakat vesszük, és összehasonlítjuk a 0-val.


Vegyük a kapott két egyenletet, elkülönítve a b változót mindkettőtől, majd vonjuk ki a felső egyenletet az alsó egyenletből.

Vegyük ki az első egyenletet a második egyenletből

Szabaduljunk meg az egyenletben szereplő nevezőktől.

És megyünk, ez az egyenlet az M megtalálásához, vegyük ezt és írjuk fel a B egyenletet.

A lejtés és az y metszés egyenletei
Adjuk meg azokat a matematikai egyenleteket, amelyek segítenek megtalálni a szükséges meredekséget és y-metszést.

Tehát valószínűleg magában gondolkodik, mi a fene ezek a furcsa egyenletek?
Valójában egyszerűen érthetőek, ezért beszéljünk róluk egy kicsit.




Most, hogy megértettük az egyenleteinket, itt az ideje, hogy mindent összegyűjtsünk, és mutassunk néhány példát.
Példák
Nagy köszönet a Khan Akadémiának a példákért.
1. példa
Vegyünk 3 pontot, (1,2), (2,1), (4,3).

Keressük meg M és B -t az y = mx + b egyenlethez.




Miután kiszámítottuk az M és B egyenletünk megfelelő részeit, tegyük ezeket az értékeket az egyenletekbe, és kapjuk meg a meredekséget és az y metszetet.


Vegyük ezeket az eredményeket, és állítsuk be az y = mx + b egyenletbe.

Most húzzuk meg a vonalat, és nézzük meg, hogy a vonal hogyan halad át a vonalakon úgy, hogy minimalizálja a négyzet távolságokat.

2. példa
Vegyünk 4 pontot, (-2, -3), (-1, -1), (1,2), (4,3).

Keressük meg M és B -t az y = mx + b egyenlethez.




Ugyanúgy, mint korábban, tegyük ezeket az értékeket az egyenleteinkbe, hogy M és B


Vegyük ezeket az eredményeket, és állítsuk be az y = mx + b egyenletbe.

Most húzzuk meg a vonalat, és nézzük meg, hogy a vonal hogyan halad át a vonalakon úgy, hogy minimalizálja a négyzet távolságokat.

Összefoglalva
Mint láthatja, az egész ötlet egyszerű. Csak meg kell értenünk a fő részeket és a velük való együttműködést.
A képletekkel megkeresheti a vonalat egy másik grafikonon, és elvégezhet egy egyszerű számítást, és megkaphatja az eredményeket a meredekségre és az y metszetre.
Ez minden, egyszerű? ?
Minden megjegyzést és visszajelzést szívesen fogadunk - ha szükséges, kijavítom a cikket.
Lépjen kapcsolatba velem közvetlenül a LinkedIn-en - kattintson ide.