Todennäköisyyttä tyhmälle
Olet Mikko Saaren Elämä ja mielipiteet -blogissa. Tämä kirjoitus on julkaistu 3.01.2006, klo 12:39.
Edellinen kirjoitus: Gradu vaiheessa
Seuraava kirjoitus: Blondivitsi
Jos haluat lukea lisää kirjoituksiani samasta aiheesta, tämä kirjoitus kuuluu kategoriaan Sekalaista.
Katso myös:- Kestovaippoja kaupan
- Mikrolainausta
- Vahvistinongelma
- Verenluovutus
- Ahneesta sukupolvesta vielä
- Nina Lincoln
- Vaalien jälkeen
- Kirjoja vaihdetaan, sohva annetaan
- Kuuma parisuhdejuoru linnanjuhlista!
- Rokkia kaupan
Selittäkääpä joku minulle yksi juttu todennäköisyyslaskennasta: kuinka lasketaan todennäköisyys sille, että joku tietty tapahtuma tapahtuu n:n yrityksen aikana?
Esimerkiksi siis tilanne, jossa pussissa on yksi punainen ja yhdeksän valkoista palloa. Mikä on todennäköisyys nostaa punainen pallo, jos nostaa n kertaa ja pallot palautetaan joka kerta pussiin?
Osaan laskea sen takaperin, eli laskemalla todennäköisyyden nostaa valkoinen pallo (9/10) ja siitä sitten kertomalla jokaista yritystä kohden. Esimerkiksi kahdella nostolla todennäköisyys on 19% (0,9 * 0,9 = 0,81). Näin ollen todennäköisyys siis kasvaa ja lähestyy yhtä, mutta ei saavuta sitä koskaan (eikä kuulukaan tietysti saavuttaa).
Asia siis selvä, mutta jotenkin hämää, kun en keksi miten samaan tulokseen pääsee "suoraan". Vai pääseekö edes?
Kommentit ja TrackBackit
Tämän merkinnän TrackBack URL on:
http://www.melankolia.net/mt/mt-tb.cgi/3759
J. kirjoitti 3.01.2006, klo 14:07:
lasse kirjoitti 3.01.2006, klo 15:47:
Matikkaa on viimeksi tullut luettua lukiossa, mutta muistanpa vähän myöhemmin laskelleeni joihinkin lautapeleihin vastaavia todennäköisyyksiä logaritmien avulla.
Tämä ei nyt ole suoraan tuo mitä hait, mutta yällä kaavalla saa laskettua sen, kuinka monta yritystä tarvitaan, että päästään tiettyyn prosenttiin.
n = log(1 - x) * (1 - p)
Missä x on tapahtuman todennäköisyys (prosentteina) ja p on haluttu todennäköisyys (prosentteina).
TK kirjoitti 3.01.2006, klo 19:56:
Hitusen verran logiikkaa lukeneena kyseenalaistaisin koko kysymyksenasettelun.
Eiväthän ne pallot "tiedä" kuinka monta aiempaa nostoa on tehty tai kuinka monta tullaan myöhemmin tekemään.
Eli aiemmat (tai tulevat) nostot eivät vaikuta millään tavalla parhaillaan tehtävään nostoon. Todennäköisyys punaisen pallon nostamiseen yhdellä tai tuhannella nostolla on aina sama, yksi kymmenestä.
Todennäköisyys määräytyy vain pussissa nostoa suoritettaessa olevien eriväristen pallojen lukumäärän mukaan.
Asian havainnollistamiseksi kuvitellaan kaksi tilannetta:
A) Pussissa on yksi punainen ja yhdeksän valkoista palloa. Tehdään kaksi nostoa joiden välillä nostettu pallo pannaan takaisin.
B) Pussissa on kaksi punaista ja 18 valkoista palloa. Tehdään yksi nosto.
Jos merkinnässä kaavailtu kertolasku pitäisi paikkansa, todennäköisyys punaisen pallon nostamiseen olisi vaihtoehdossa A suurempi kuin vaihtoehdossa B. Näin ei kuitenkaan ole, vaan todennäköisyys punaisen pallon nostamiseen on tilanteissa A ja B yhtä suuri, 10%.
TK kirjoitti 3.01.2006, klo 20:30:
Sama asia paremmin selitettynä:
http://en.wikipedia.org/wiki/Gambler's_fallacy
Tommy kirjoitti 3.01.2006, klo 20:53:
Ensin sun pitää etsiä kaikki mahdolliset kombinaatiot, jossa tapahtuma esiintyy ja näiden kombinaatioiden todennäköisyydet. Sen jälkeen ne vain summataan.
Tämän takia tuo "millä todennäköisyydellä vähintään yhdellä nostolla tulee punainen pallo, kun yritetään" on helppo laskea tavallaan väärinpäin, koska negaatiossa kombinaatioita on huomattavan paljon vähemmän (eli tasan yksi).
Mikko Saari kirjoitti 3.01.2006, klo 21:33:
Jepjep, ymmärrän kyllä uhkapelurin harhan, eikä niillä palloilla todellakaan ole muistia. Jokaisella yksittäisellä nostolla on siis aina sama todennäköisyys. Mutta tässä olikin tarkoitus ajatella kokonaisuutta.
Otetaanpa esimerkki lotosta (koska sitä tässä alunperin ajattelin; palloesimerkki oli sikäli vähän tyhmä). Yksittäisen rivin todennäköisyys on se yksi 15 miljoonasta tai mitä se nyt on. Vaan entäs jos lottoaa kahdesti?
Tai vaikka lastenhankinta. Todennäköisyys saada jompaakumpaa sukupuolta oleva lapsi on se (suunnilleen) 50%. Silti todennäköisyys sille, että perheen molemmat lapset olisivat samaa sukupuolta on 25%, vaikka yhden pojan jälkeen toisen pojan mahdollisuus on edelleen 50%.
Eli siis kun niitä pallonnostoja toistetaan, todennäköisyys saada punainen pallo tavallaan kasvaa. Ei siinä yksittäisessä nostossa, vaan verrattuna pienempään määrään nostoja. No niin! Näin pitkään piti kirjoittaa, ennen kuin pääsin asiaan kiinni.
TK kirjoitti 3.01.2006, klo 22:17:
Edelleen olen sitä mieltä, että todennäköisyys ei kasva - mitään "kokonaisuutta" ei ole olemassakaan.
Jos osallistut kahdella eri rivillä *saman viikon* lottoarvontaan, voiton todennäköisyys kaksinkertaistuu. Jos osallistut kahteen peräkkäiseen lottoarvontaan yhdellä rivillä per arvonta, ei todennäköisyys muutu miksikään.
Tätä "todennäköisyys sille, että perheen molemmat lapset olisivat samaa sukupuolta on 25%" en ymmärrä alkuunkaan.
Tässähän ovat vaihtoehdot kaksilapsiselle perheelle (T = tyttö, P = poika):
TP
TT
PT
PP
Eli todennäköisyys sille, että perheen molemmat lapset olisivat samaa sukupuolta on 50% (tapaukset TT, PP).
Jos kysytään mikä on todennäköisyys sille, että molemmat lapset ovat poikia, on vastaus tietysti 25% (tapaus PP).
Pitää olla tarkka siitä, mitä kysytään. Oletetaan, että perheeseen syntyy poika ja toinen on tulossa. Jos kysymys kuuluu "mikä on todennäköisyys sille että molemmat lapset ovat poikia" on vastaus siis 25%.
Mutta jos kysymys kuuluu "mikä on todennäköisyys sille, että seuraava lapsi on poika" on vastaus 50%. Kummassakaan tapauksessa ensiksi syntyneen sukupuoli ei vaikuta toiseksi syntyvän sukupuoleen.
Takaisin pallojen pariin: Kun nostoja jatketaan todennäköisyys saada punainen pallo kasvaa vain, jos valkoisten pallojen määrä vähenee tai punaisten määrä nousee. Niin epäintuitiiviselta kuin se voi tuntuakin.
Eli kuten Wikipedia sanoo: "If two events A and B are independent, then the conditional probability of A given B is the same as the "unconditional" (or "marginal") probability of A"
TK kirjoitti 3.01.2006, klo 22:30:
Vielä lottoarvonnasta: kuten sanottua, jos osallistut kahdella rivillä samaan arvontaan, voiton todennäköisyys kasvaa. On olennaista huomata, että tämä ei ole analoginen alkuperäisen esimerkin kanssa.
Tilannetta voisi verrata siihen, että pussista nostetaan yksi pallo, jota ei laiteta takaisin pussiin. Silloinhan todennäköisyys saada toisella nostolla punainen pallo on suurempi, koska pussissa on vähemmän palloja.
Sen vuoksi tapahtumat eivät ole tilastollisesti riippumattomia, ja vaikuttavat toistensa todennäköisyyteen.
Lottorivejä on olemassa rajattu määrä. Jos lottoat tarpeeksi monta riviä yhteen arvontaan, voitat taatusti päävoitoiton.
Jos nostat pussista kymmenen palloa (laittamatta yhtään takaisin), saat 100% varmuudella punaisen pallon.
Mutta jos lottoat yhden rivin per viikko (tai laitat nostamasi pallon takaisin pussiin), todennäköisyys pysyy samana, viikosta tai nostosta toiseen.
Mikko Saari kirjoitti 4.01.2006, klo 07:28:
Ah, sattui lipsahdus. Siis tarkoitin, että todennäköisyys sille, että molemmat lapset ovat esim. poikia, on se 25%.
Edelleen ymmärrän kyllä, että yksittäisen yrityksen todennäköisyys ei kasva. Verrataan kuitenkin tilannetta A tilanteeseen B:
A) Lototaan kerran yhdellä rivillä. Todennäköisyys voittaa on 1/15 000 000.
B) Lototaan 15 000 000 kertaa yhdellä rivillä. Todennäköisyys, että näiden kertojen aikana voitto osuu kohdalle on suurempi kuin 1/15 000 000.
Tätä haen. Tämä on se kokonaisuus, josta on kyse. Jos tehdään sata nostoa kymmenen pallon pussista, on hyvin epätodennäköistä olla nostamatta sitä punaista palloa edes kerran, vaikka todennäköisyys jokaisella nostolla onkin vain se 1/10.
Tuomas kirjoitti 4.01.2006, klo 09:07:
Mihin perustuu tuo "Todennäköisyys, että näiden kertojen aikana voitto osuu kohdalle on suurempi"? Intuitioon? Matematiikkaan tai todennäköisyyslaskentaan se ei voi perustua.
Uhkaa mennä jankkaamiseksi, joten kannattaa varmaan lopetella, mutta kyllä voiton todennäköisyys tilanteissa A ja B on aivan yhtä suuri: 1/15 000 000.
Kyse on ihan klassisesta uhkapelaajan harhasta.
"In any case, if I get heads four times in a row, the probability of getting a heads on the next flip is still 50/50, just as it was on the previous flips. The fact that the previous flips all came up heads does not make it more likely that the next flip will come up tails. The first example above is an instance of this sort of Gambler's Fallacy."
http://www.cuyamaca.net/bruce.thompson/Fallacies/gamblers.asp
Mikko Saari kirjoitti 4.01.2006, klo 09:18:
Jepjep, ei etene, joten tämä olkoon viimeinen:
Kyse ei ole yksittäisen yrityksen todennäköisyydestä (joka ei koskaan muutu), vaan siitä, että koko sen sarjan aikana joku yrityksistä onnistuu. Siis todennäköisyys saada sen koko sarjan aikana edes yksi osuma.
Otetaanpas sitä matematiikkaa. Todennäköisyys olla voittamatta lotossa on 15380936/15380937. Jos pelataan kaksi kierrosta, todennäköisyys ettei kummallakaan tule voittoa on tuo potenssiin kaksi. Todennäköisyys, että voitto tulee, on vastakkainen tämän tapahtuman todennäköisyydelle.
Lottoamalla miljoona kertaa yhdellä rivillä, todennäköisyys olla voittamatta on 0,999999935^1 000 000, eli 93,7%. Todennäköisyys, että miljoonalla kierroksella tulee voitto on siis 6,3%.
Sama niillä sadalla nostolla pallopussista. Itse asiassa jo seitsemällä nostolla todennäköisyys onnistua kerran on parempi kuin 50%. Jokaisen yksittäisen noston todennäköisyys on edelleen 1/10, mutta jos nostetaan seitsemän kertaa peräkkäin, todennäköisyys että joku seitsemästä nostosta onnistuu, on 52,2%.
Marko H. Tamminen kirjoitti 4.01.2006, klo 10:26:
Kyllä Mikko on tässä ihan oikeassa, en tiedä onko tässä kommunikaatiokatkos vai ihan puhtaasti väärin ymmärretty tuo uhkapelaajan harha vai mistä kiikastaa.
Ja helpointa tuo on laskea ihan vaan toteamalla että P(punainen) = 1 - P(kaikki valkoisia) ja siitä sitten lasketaan tuon P(kaikki valkoisia) todennäköisyys, koskapa se on niin suunnattoman helppoa, kuten Tommy jo kirjoittikin.
Todennäköisyyslaskenta rupeaa menemään varsin mielenkiintoiseksi siinä vaiheessa kun otetaan ehdollisuudet ja kombinaatiot mukaan, mutta onneksi lautapeleissä on yleensä sen verran muiden pelaajien tuomaa kaaosta, että kukaan ei tuohon ryhdykään. Analyysihalvausta on joissain peleissä jo nyt ihan tarpeeksi...
Ja sitten on tietysti syntymäpäiväparadoksi.. Sekin varsin hauska ilmiö ja hämmentää yleensä helposti jo vähän todennäköisyyksiä tuntevankin ihmisen!
TK kirjoitti 4.01.2006, klo 14:33:
Lienee varmaan syytä lopettaa kommentointi, mutta vielä kerran pitää kysyä mihin tuo "todennäköisyys ettei kummallakaan tule voittoa on tuo potenssiin kaksi" perustuu?
Ehkä tämä selventää asiaa:
Todennäköisyys että kolikkoa heittämällä tulee joko kruuna tai klaava on 100%. Todennäköisyys saada yhdellä rivillä lotossa täysosuma on 1/15 000 000.
Jos henkilö A ensin heittää kolikkoa ja sitten pelaa yhden lottorivin, onko hänellä parempi mahdollisuus saada loton täysosuma kuin henkilöllä B joka ei heitä kolikkoa, vaan pelaa vain yhden lottorivin?
Vastaus on ilmiselvästi ei. Tapahtumien todennäköisyydet eivät vaikuta toisiinsa. Mitään potenssia, kertolaskua tai yhteenlaskua ei voi suorittaa, koska kyse on erillisistä tapahtumista.
Aivan sama pätee silloin, jos henkilö pelaa tällä viikolla yhden lottorivin ja ensi viikolla toisen. Todennäköisyys päävoiton saamiseen ei kasva. Mitään kokonaisuutta tai "sarjaa" ei ole, vaan kyse on erillisistä tapahtumista.
Ihmismielellä toki on taipumusta yhdistää asioita, jotka eivät todellisuudessa liity toisiinsa millään tavalla: "löysin aamulla nelilehtisen apilan, nyt minulla on entistä parempi mahdollisuus voittaa ruletissa".
Marko H. Tamminen kirjoitti 4.01.2006, klo 15:29:
Uhh, mitenhän tämän nyt sitten selittäisi...
Kolikonheitossa mahdollisuus saada kruuna on 50%, eikö totta?
Oletko sitä mieltä, että heitettäessä 10 kertaa, tuo todennäköisyys saada kruuna (edes kerran) on edelleen 50%?
Koitapa huviksesi, että onko näin. Esim. teet 10 tuollaista 10 toiston sarjaa ja käykö edes osapuilleen niin, että vain 50% (eli 5kpl) kerroista saat sen kruunan yhdellä noista 10 heitosta?
Uskallanpa väittää, että saat joka kerta vähintään yhden kruunan. Todennäköisyys sille, että sitä kruunaa ei tule ei ole suinkaan 50% vaan (1/2)^10 joka on 1/1024, eli alle yhden promillen.
Jos on kaksi erillistä 50% todennäköisyydellä toteutuvaa tapahtumaa, niin todennäköisyys, että kumpikaan ei toteudu on 25%. Nimenomaan siksi, että ne ovat erillisiä mitenkään toisiinsa liittymättömiä, kuten esim. lotto, ruletti, kolikonheitto jne.
Tommy kirjoitti 4.01.2006, klo 16:31:
Aah, todennäköisyyslaskennasta syntyy aina yhtä herkullisia vääntöjä.
Ongelmanahan tässä on, että alkuperäinen lause on epätäsmällisesti muotoiltu:
"Mikä on todennäköisyys nostaa punainen pallo, jos nostaa n kertaa ja pallot palautetaan joka kerta pussiin?"
Kun sen pitäisi olla:
"Mikä on todennäköisyys nostaa vähintään kerran punainen pallo, jos nostaa n kertaa ja pallot palautetaan joka kerta pussiin?"
Ekaan "oikein" vastaus on varmaan se 1/10, mitä Tuomas on yrittänyt myydä, vaikka Mikko tarkoitti alusta lähtien selvästikin jälkimmäistä lausetta.
No mullahan on taustana lyhyt matikka, mutta juuri noin me laskimme todennäköisyyksiä tunnilla. Muistan vieläkin (mikä on ihan hyvä suoritus, ottaen huomioon että ko. kurssi oli lukion ensimmäisellä luokalla), kuinka hoin itselleni että "ja kerrotaan, tai plussataan", mutta se ei taida liittyä tähän.
Eli en tiedä parempaakaan keinoa laskea tilanteen todennäköisyyttä.