miercuri, iulie 22, 2009

Capcane în logica statistică

Să analizăm următoarea problemă: O mamă are doi copii. Dacă unul din ei este băiat, care este probabilitatea ca şi celălalt să fie tot băiat?

La prima vedere pare o problemă banală şi răspunsul pare la fel de clar: 50%, adica 0,5. Apoi gândul îl duce pe cititor la faptul că sunt mai multe femei decât bărbaţi, deci şansele sa fie băiat ar fi un pic mai mici. Nu acesta este răspunsul. Diferenţa dintre numărul bărbaţilor şi al femeilor vine mai mult din diferenţa speranţei de viaţă dintre sexe (mai nou bărbaţii recuperează terenul în India, unde părinţii preferă să aibă băieţi pentru a nu mai plăti zestre). Deci putem considera liniştiţi că dacă o mamă are un copil, şansele ca el să fie băiat sunt 50%.

Atunci prin ce diferă problema de mai sus? Prin ce este relevant faptul că sunt doi copii? Ce legătura are celălalt copil cu faptul ca unul din ei este băiat? Are! Diferenţa constă în faptul că folosind sintagma "unul din ei" nu am specificat clar care. Dacă am fi spus "primul" "cel mic", "cel cu ochi albaştri", "frumosul" ori orice altă variantă ce ar fi făcut o referinţă clară, datele problemei se schimbau. Atunci răspunsul ar fi fost 50%. În cazul nostru însă "unul din ei" se traduce în logica matematică aplicată cazului nostru prin "ori primul este băiat ori al doilea este băiat", adică nu reduce problema la un singur copil, independent de celălalt. Şi atunci problema noastră se rezolvă în felul următor:

Plecăm de la ipoteza ca o mamă are doi copii. Asta înseamnă variantele bb, bf, fb, ff, fiecare cu probabilitate de 25%. Ţinem cont de faptul ca cel puţin unul din ei este băiat, adica elimininăm varianta ff. Probabilitatea reprezintă raportul dintre numărul de cazuri favorabile şi numărul total de cazuri. La noi din cele 3 variante, într-una singură avem bb, aşadar acest raport este 1/3. Răspunsul la problema noastră este 1/3 = 0,(3) = aproximativ 33,33%.

7 comentarii:

Anonim spunea...

Nu ai dreptate. Cele doua nasteri sunt statistic evenimente independente. Faptul ca primul copil e baiat nu schimba cu nimic sansele celui de al doilea sa fie baiat cu sansa de 50%. Asta e exact aceeasi capcana in care cad cei care joaca ruleta: daca a fost negru de 5 ori la rand, sansa la urmatoare runda sa fie rosu nu e mai mare de 50%.

zunais spunea...

Ele sunt evenimente independente, dar, cum după cum am explicat în postare, nu am spus că PRIMUL este băiat ci UNUL DIN EI este băiat. Această menţiune, aparent minoră, face diferenţa. Ea nu mai poate fi folosită pentru a elimina complet primul eveniment, ci îl leagă de al doilea, trebuind tratat ansamblul celor două evenimente pentru a obţine rezolvarea corectă.

Anonim spunea...

Zuni, enuntul de care te legi are o exprimare ambigua. Seamana cu memorabila fraza de la BAC "imparatul avea o gradina si in fund un copac".

Roxana spunea...

mi se pare doar o sofisticarie de limbaj care nu are de-a face cu fondul problemei: faptul ca cele doua lucruri nu sunt corelabile in termeni de calcul real al sansei. si daca are 100 de copii si 99 din ei sunt baieti, nu conteaza ordinea, cu ce schimba asta datele problemei pentru al 100-lea? poate logica matematica 'pura' sa spuna ce vrea :-)

Anonim spunea...

"Poate ar fi si mai intuitiv" dar tocmai ai cazut singur in capcana pe care ai vrut s-o ocolesti la inceput (capcana celor de la ruleta). In cazul monedelor, daca primele 99 ies intr-un anume fel, a 100a are 50% sanse sa iasa cu banul, si 50% sa iasa cu marca :)

zunais spunea...

Da, ai dreptate aici, reiau comentariul corectat:

Pentru a fi mai uşor de înţeles să presupunem că alegem la întâmplare 100 de mame care au doi copii şi că din acestea le eliminăm pe cele care n-au niciun băiat. Vor rămâne 75. Din cele 75, 25 vor avea doi băieţi. Concluzia - 25 din 75 adică 1/3.
Să luăm şi cazul când mama eroină are 100 de copii. Sunt 2 la puterea 100 cazuri totale. Aplicând condiţia ca 99 din ei să fie băieţi, rămân doar 101 cazuri posibile (toţi sunt băieţi sau prima este fată sau a doua este fată sau...a 100a este fată). Din cele 101 cazuri, doar unul ar fi favorabil, în care toţi sunt băieţi. Rezultatul deci va fi 1/101, adică ceva mai puţin de 1%.

Poate ar fi şi mai intuitiv dacă ne-am gândi nu la copii ci la monede care sunt amestecate într-o cutie. Ai 100 de monede puse într-o cutie, pe care le amesteci şi apoi notezi de câte ori atunci când sunt minim 99 de monede cu stemă va fi şi a o suta tot cu stemă. Şansele sunt 1/101, nu 1/2. Din cele 2^100 variante iniţiale, într-una singură avem fix 100 steme, în 100 variante avem fix 99 steme, în 4950 variante avem fix 98 steme, etc.

Mihai Biharia spunea...

Mai Ioane, postul tau imi aduce aminte de ce spunea Nietzche : "Gloata, sa o ia dracul si statistica" .Nu se poate face statistica decat daca colectivul statistic este mare.Ori tu folosesti ca si colectiv statistic copii virtuali. Macar alege o mama eroina :) Sau experimenteaza :)