Miért nem jelent összefüggést az összefüggés - A statisztikák e közmondásának jelentése

Emlékezhet erre az egyszerű mantrára a statisztikai osztályából:

"Az összefüggés nem jelent ok-okozati összefüggést."

Tehát talán úgy gondolja, hogy tudja, mit jelent ez a kifejezés.

Például, ha nagyon keményen tanult a statisztikában, jó osztályzatot kapott, majd bejutott az egyetemre, akkor ez azt jelenti, hogy azért került be az egyetemre, mert belépett a statisztikai osztályba.

Bár ez a fokozat, a megtanult készségekkel együtt, valószínűleg segített, nem hagyhatja figyelmen kívül a többi tényezőt - és valószínűleg nem állíthatja, hogy a Statisztika fokozata okozza az egyetemre történő felvételt.

Először az első dolgokat - miért tévesztjük az összefüggést az oksági összefüggéssel?

Könnyű azt gondolni, hogy csak azért, mert két dolog tűnik összefüggőnek, egyiknek kell lennie a másik okának. De ez ostoba és néha veszélyes feltételezés lehet.

Tegyük fel például, hogy megpróbálja kitalálni, mi teszi az embereket kevésbé morcossá. Olyan vizsgálatot hajt végre, amely megállapítja, hogy amikor az emberek éjszaka legalább x órát alszanak, kevésbé morcosak.

De figyelembe vett-e itt minden tényezőt? Talán ők is jobban kezdtek dolgozni a jó pihenés következtében, és ez megváltoztatta a hangulatukat.

Nem minden példa olyan jóindulatú - és némelyik egyenesen értelmetlen.

Annak szemléltetésére, hogy mennyire megtévesztő lehet feltételezni, hogy a korreláció ok-okozati összefüggéseket von maga után, nézze meg a következő grafikont Tyler Vigen hamis összefüggései alapján:

Bár történetesen szoros összefüggés van e két tényező között, kétlem, hogy hatékonyan állíthatná, hogy egyik okozta a másikat. Talán ez kihívás lesz az emberek számára, hogy megpróbálják bizonyítani.

Itt van egy másik gyöngyszem Tyler gyűjteményéből:

Nézd meg azt a gyönyörű összefüggést. De nehezen vitathatnád, hogy csak azért, mert valaki több sajtot evett, valószínűbb, hogy végzetesen belegabalyodik az ágyneműjébe.

Mi a korreláció a statisztikában?

A szótár szerint a korreláció két vagy több dolog (vagy változó) közötti kölcsönös kapcsolat vagy kapcsolat - különösen olyan, amely nem csupán a véletlen alapján várható.

Használjuk egy mondatban: Úgy tűnik, hogy a saját termesztésű paradicsomom hatalmas mérete korrelál az ezen a nyáron tapasztalt extra esővel.

Most azt feltételezem, hogy mivel a szokásosnál kicsit jobban esett az eső, a paradicsom növényeim diófélék voltak és szörny paradicsomot termeltek.

De vajon ez az egyetlen tényező? Mi a helyzet a tápanyagban gazdag komposzttal, amelyet az emelt ágyamban használtam? Mi a helyzet az óvodában vásárolt növények minőségével? Mi a helyzet a gondos metszéssel és gondozásommal?

Mint láthatja, bár van összefüggés a nagy paradicsomom és az esős nyarunk között, ez nem feltétlenül utal ok-okozati összefüggésre.

Mi az okozati összefüggés a statisztikákban?

Ideje egy másik meghatározásnak. Az okozat a szótár szerint az a cselekedet vagy ügynökség, amely hatást vált ki.

Tegyük egy kicsit konkrétabbá. Az okozati viszony azt jelenti, hogy két esemény között van kapcsolat, ahol az egyik esemény hatással van a másikra. A statisztikákban, amikor egy esemény - vagy változó - értéke egy másik esemény vagy változó miatt emelkedik vagy csökken, akkor azt mondhatjuk, hogy okozati összefüggés volt. A miatt B történt.

Mit szólnál ehhez a példához? Talán szabadúszó egy magazin számára, amely szó szerint fizet. Minél hosszabb a történet (és minél több szót tartalmaz), annál többet fizet.

Tehát közvetlen összefüggés van annak között, hogy hány szót írsz és mennyit fizetsz. De van ok-okozati összefüggés is (mivel többet írtál, többet fizettek neked).

Miért olyan könnyű ezt elrontani?

Miért olyan könnyű azt gondolni, hogy a korreláció ok-okozati összefüggéseket von maga után ? Nos, ha két dolog összefüggésnek tűnik, hajlamosak vagyunk társítani őket, és feltételezzük, hogy hatással vannak egymásra. Ha hideg az idő, az emberek több időt töltenek bent. Az ünnepek körül a bevásárlóközpontok tele vannak. Ha ibuprofent szed, elmúlik a fejfájása.

Bár ezek a körülmények bizonyosan összefüggenek - és egyesek akár okságra is utalhatnak -, nem feltétlenül állják meg a tudományos elemzést.

Néhány oka van annak, hogy tévesen következtethetünk az összefüggésre a korrelációból.

Mi az a zavaró változó?

Először is előfordulhat, hogy a keverékben van egy zavaró változó . Ez egy olyan változó, amely egyaránt befolyásolja a párkapcsolat független és függő változóit - és ezáltal összezavarja a kapcsolat természetének meghatározására való képességét.

Például, ha egy új család beköltözik egy szomszédságba, és a bűnözés fokozódik, az adott terület lakói feltételezhetik, hogy ez az új család miatt van. De mi lenne, ha ezzel egy időben a közelben fogva tartási központ nyílna? Ez a valószínűbb oka a megnövekedett bűnözésnek.

Mi a fordított okozati összefüggés?

Másodszor, lehet, hogy fordított oksággal foglalkozik . Ez akkor történik, amikor ahelyett, hogy helyesen feltételezné, hogy A okozza B-t, összekevered őket, és feltételezzük, hogy B okozza A-t.

Lehet, hogy nehéz elképzelni, hogyan történik ez, de gondolkodjon el a napelemek működéséről. Több energiát termelnek, ha a nap hosszabb ideig van az égen.

De a nap nincs tovább az égen, mert a panelek nagyobb energiát termelnek. A panelek nagyobb energiát termelnek, mert a nap hosszabb ideig süt.

Mi az egybeesés?

Harmadszor, nem szabad megfeledkeznünk az egybeesés erejéről . Ha egyszerre két dolog történik, akkor csábító az ok-okozati összefüggések megismerése. De csakúgy, mint a fenti ostoba grafikon, az árkádokkal és a CS fokozatokkal, sok csak véletlen.

Végül - miért érdekel minket?

Talán azt próbálja kitalálni, hogy egy bizonyos új gyógyszer jobban érzi-e a betegeket. Vagy szeretné tudni, mi készteti az embereket egy bizonyos termék megvásárlására.

Bármi legyen is a motiváció, gyakran nagyon hasznos kitalálni, hogy A okozza-e a B-t, valamint hogyan és miért.

De mint láttuk, ez nem olyan egyszerű. A lehető legtöbb tényezőt ellenőriznie kell, csökkentenie kell a változók és egybeesések összekeverésének valószínűségét, és az adatokat a relevánsra kell kicsinálnia.

Nem fogunk belemenni a mélyebb filozófiai kérdésbe, hogy miként állapíthatjuk meg az ok-okozati összefüggést kétségtelenül. Ez máskor.

Legalábbis most már tudja, hogy - bár két esemény vagy változó összefüggésnek tűnhet - ez még nem jelenti azt, hogy az egyiknek közvetlen oksági hatása lenne a másikra.