Viziunea noastră asupra lumii și acțiunile care decurg din aceasta sunt adesea ghidate de o teoremă simplă, concepută în secret cu mai bine de 150 de ani în urmă de un discret matematician și teolog englez, Thomas Bayes, și publicată abia după moartea sa.

Teorema lui Bayes a fost folosită pentru a sparge codul nazist Enigma în timpul celui de-Al Doilea Război Mondial și, în prezent, gestionează incertitudinea în știință, tehnologie, medicină și multe alte domenii.

Așadar, cum funcționează teorema lui Bayes ?

Teorema lui Bayes

Intuiția lui Thomas Bayes a fost remarcabil de simplă. Probabilitatea ca o ipoteză să fie adevărată depinde de două criterii:

  • cât de plauzibilă este, pe baza cunoștințelor actuale (probabilitatea „a priori”)

  • cât de bine se potrivește cu noile dovezi.

Cu toate acestea, timp de 100 de ani după moartea sa, oamenii de știință și-au evaluat, de regulă, ipotezele doar în raport cu noile dovezi. Aceasta este abordarea tradițională de testare a ipotezelor (sau frecventistă), pe care majoritatea dintre noi o învață la școală.

Diferența dintre abordările bayesiană și frecventistă devine evidentă mai ales atunci când o explicație implauzibilă se potrivește perfect cu o dovadă nouă.

Să inventez o ipoteză: „Luna este făcută din brânză”.

Privesc spre cer și adun dovezi relevante, observând că Luna are o culoare gălbuie, asemănătoare brânzei. În cadrul testării tradiționale a ipotezelor, aș concluziona că noile dovezi sunt compatibile cu ipoteza mea radicală, crescându-mi astfel încrederea în ea.

Dar, folosind teorema lui Bayes, aș fi mai prudent. Deși ipoteza mea se potrivește cu noile dovezi, ideea este absurdă încă de la început, contrazicând tot ceea ce știm despre cosmologie și mineralogie.

Prin urmare, probabilitatea totală ca Luna să fie făcută din brânză, care rezultă din combinarea ambilor termeni, rămâne foarte mică.

Desigur, acesta este un exemplu extrem. Niciun om de știință respectabil nu ar testa o asemenea ipoteză absurdă.

Totuși, cercetătorii din întreaga lume evaluează permanent un număr imens de ipoteze, iar unele dintre acestea sunt inevitabil destul de fanteziste.

De exemplu, un studiu din 2010 a sugerat inițial că persoanele cu opinii politice moderate au ochi care pot literalmente vedea mai multe nuanțe de gri.

Această concluzie a fost ulterior respinsă în urma unor teste suplimentare, efectuate deoarece cercetătorii au recunoscut că ipoteza era implauzibilă încă de la început. Cu toate acestea, este aproape sigur că alte studii similare au fost acceptate fără o analiză critică suficientă.

Abordarea bayesiană în viața de zi cu zi

Folosim cunoștințele anterioare din experiențele și amintirile noastre, precum și dovezile noi provenite din simțuri, pentru a atribui probabilități lucrurilor obișnuite și pentru a ne organiza viața.

Luați un exemplu simplu, precum răspunsul la telefonul de serviciu, pe care îl țineți de obicei fie pe biroul de la muncă, fie pe încărcător atunci când sunteți acasă.

Sunteți acasă, în grădină, și îl auziți sunând în interior. Noile date sunt compatibile cu faptul că telefonul se află oriunde în casă, însă mergeți direct la încărcător.

Ați combinat cunoștințele anterioare despre telefon (de obicei se află fie pe birou, fie pe încărcător) cu noile dovezi (este undeva în casă) pentru a-i determina poziția.

Dacă telefonul nu este pe încărcător, folosiți cunoștințele despre locurile în care l-ați mai lăsat pentru a restrânge căutarea.

Ignorați majoritatea locurilor din casă (frigiderul, sertarul cu șosete) ca fiind extrem de improbabile a priori și vă concentrați asupra celor mai probabile până când găsiți telefonul. Folosiți, astfel, teorema lui Bayes pentru a-l găsi.

Credință și dovezi

O caracteristică a inferenței bayesiene este că convingerile inițiale sunt cele mai importante atunci când datele sunt slabe. Aplicăm acest principiu intuitiv.

De exemplu, dacă jucați darts într-un pub și un străin din apropiere spune că este jucător profesionist, este posibil să credeți inițial că glumește.

Nu știți aproape nimic despre acea persoană, dar șansele de a întâlni un jucător profesionist sunt mici. Organizația DartPlayers Australia a arătat că există doar aproximativ 15 în Australia.

Dacă acel străin aruncă o săgeată și nimerește centrul țintei, s-ar putea să nu vă convingă. Ar putea fi doar o lovitură norocoasă.

Dar dacă aceeași persoană nimerește centrul de zece ori la rând, veți fi înclinat să acceptați afirmația sa. Convingerea inițială este depășită pe măsură ce dovezile se acumulează. Din nou, teorema lui Bayes în acțiune.

Teoria care le guvernează pe toate

Raționamentul bayesian stă astăzi la baza unor domenii vaste ale cunoașterii umane, de la screeningul pentru cancer la schimbările climatice, genetică, politici monetare și inteligență artificială.

Evaluarea riscurilor și asigurările sunt domenii în care acest tip de raționament este fundamental. De fiecare dată când un ciclon sau o inundație lovește o regiune, primele de asigurare cresc brusc. De ce?

Riscul este extrem de dificil de cuantificat, iar condițiile actuale pot oferi puține informații despre dezastrele viitoare. Asiguratorii estimează riscul atât pe baza situației curente, cât și a istoricului.

De fiecare dată când are loc un dezastru natural, ei își actualizează informațiile anterioare despre acea regiune într-un sens mai nefavorabil. Anticipează o probabilitate mai mare de despăgubiri viitoare și, în consecință, cresc primele.

Inferența bayesiană joacă un rol important și în diagnosticul medical. Un simptom (dovada nouă) poate avea mai multe cauze posibile (ipoteze), însă diferitele boli au probabilități inițiale diferite pentru fiecare pacient.

O problemă majoră a instrumentelor medicale online, precum webMD, este că nu iau în considerare corect aceste probabilități inițiale. Ele știu foarte puțin despre istoricul personal al pacientului, astfel că pot sugera o gamă foarte largă de afecțiuni.

O consultație la un medic care cunoaște istoricul dumneavoastră medical duce, de regulă, la un diagnostic mai restrâns și mai realist. Din nou, teorema lui Bayes.

Alan Turing și Enigma

Abordările bayesiene ne permit să extragem informații precise din date vagi și să găsim soluții înguste într-un univers uriaș de posibilități.

Ele au fost esențiale pentru modul în care matematicianul britanic Alan Turing a reușit să spargă codul mașinii de condificare Enigma. Acest lucru a grăbit victoria Aliaților în Al Doilea Război Mondial cu cel puțin doi ani și a salvat milioane de vieți.

Pentru a descifra mesajele germane criptate, căutarea printre aproape infinitul de traduceri posibile era imposibilă, mai ales că, în fapt, codul se schimba zilnic prin diferite setări ale rotoarelor mașinii Enigma.

Intuiția bayesiană a lui Turing a fost că anumite mesaje erau mult mai probabile decât altele.

Aceste soluții probabile se bazau pe mesaje anterior descifrate, precum și pe așteptări logice.

De exemplu, mesajele de pe submarinele U-boat conțineau probabil referiri la vreme sau la navele aliate.

Informațiile anterioare solide oferite de aceste soluții probabile au redus drastic numărul de variante ce trebuiau analizate, permițând mașinii de decriptare a lui Turing să spargă codul suficient de rapid pentru a ține pasul cu schimbările zilnice.

Bayes și evoluția

De ce există un interes atât de mare pentru metodologia bayesiană? În domeniul nostru, biologia evoluționistă, la fel ca în mare parte din știință, metodele bayesiene devin din ce în ce mai centrale.

De la predicția efectelor schimbărilor climatice până la înțelegerea răspândirii bolilor infecțioase, biologii caută, de regulă, câteva soluții plauzibile într-un spațiu uriaș de posibilități.

În cercetările noastre, care vizează în principal reconstruirea istoriei și evoluției vieții, aceste metode ne pot ajuta să identificăm arborele evolutiv corect dintre literalmente miliarde de configurații posibile.

Atât în muncă, cât și în viața de zi cu zi, metodele bayesiene ne ajută să găsim acele rare „ace în carul cu fân”.

Partea întunecată a inferenței bayesiene

Desigur, pot apărea probleme atunci când probabilitățile inițiale sunt aplicate greșit.

În instanțele de judecată, acest lucru poate duce la erori judiciare grave (de exemplu, eroarea procurorului*).

Într-un caz celebru din Marea Britanie, Sally Clark a fost condamnată pe nedrept în 1999 pentru uciderea celor doi copii ai săi.

Procurorii au susținut că probabilitatea ca doi copii să moară din cauze naturale (probabilitatea inițială că ea este nevinovată pentru ambele acuzații) era extrem de mică, de unu la 73 de milioane, ceea ce ar indica vinovăția ei.

Însă nu au luat în calcul faptul că și probabilitatea ca o mamă să-și ucidă ambii copii (probabilitatea inițială că este vinovată) este, de asemenea, extrem de mică. Astfel, probabilitățile relative ca ea să fie complet nevinovată sau o dublă criminală erau mai apropiate decât s-a susținut inițial.

Clark a fost ulterior achitată în apel, judecătorii criticând utilizarea statisticii în procesul inițial.

Acest caz arată cât de grave pot fi consecințele unei înțelegeri defectuoase a teoremei lui Bayes. Pe de altă parte, metodele bayesiene, atunci când sunt utilizate corect și cu ipoteze inițiale bine justificate, pot oferi perspective care altfel ar fi imposibil de obținut.


Traducere după Bayes' theorem de Mike Lee,  Professor in Evolutionary Biology (jointly appointed with South Australian Museum), Flinders University și Benedict King,  PhD candidate in vertebrate palaeontology, Flinders University.


* Eroarea procurorului este o confuzie gravă între două probabilități diferite: probabilitatea de a observa o anumită dovadă dacă inculpatul este nevinovat și probabilitatea ca inculpatul să fie nevinovat dat fiind că avem acea dovadă

Acestea nu sunt același lucru, dar sunt adesea tratate ca și cum ar fi.

Eroarea apare atunci când se face un raționament de tipul: „Probabilitatea ca această dovadă să apară dacă inculpatul este nevinovat este foarte mică, deci inculpatul este aproape sigur vinovat”. Aceasta este o concluzie falsă.

Corect ar trebui evaluată probabilitatea inversă: „Care este probabilitatea ca inculpatul să fie nevinovat, ținând cont de această dovadă?”

Acest lucru depinde nu doar de dovadă, ci și de: cât de frecvent apare acea situație în general și cât de probabil este scenariul alternativ (vinovăția).

Să presupunem că doar 1 din 1.000.000 de oameni are o anumită combinație rară de caracteristici (dovada), iar inculpatul are această combinație. Un procuror ar putea spune: „Șansa ca un om nevinovat să aibă aceste caracteristici este de 1 la un milion, deci este aproape sigur vinovat”.

Greșeala este că ignoră faptul că într-o populație mare, pot exista mai mulți oameni cu acea combinație, iar probabilitatea ca inculpatul să fie vinovat trebuie comparată cu probabilitatea ca oricine altcineva să se potrivească acelei dovezi.

Într-un caz faimos (cazul Sally Clark, menționat mai sus) s-a spus că probabilitatea ca doi copii să moară natural este extrem de mică, de aici s-a tras concluzia că mama trebuie să-i fi ucis, dar nu s-a analizat corect cât de rar este, de fapt, ca o mamă să-și ucidă ambii copii și nu a existat o comparație reală între cele două scenarii.

Rezultatul: o condamnare eronată.

Eroarea procurorului înseamnă, așadar, a confunda „cât de improbabilă este dovada dacă ești nevinovat” cu „cât de improbabil este să fii nevinovat”. Este o eroare subtilă, dar cu consecințe foarte serioase, mai ales în justiție.

Write comments...
symbols left.
Ești vizitator ( Sign Up ? )
ori postează ca „vizitator”
Loading comment... The comment will be refreshed after 00:00.

Be the first to comment.

Dacă apreciezi articolele SCIENTIA, sprijină site-ul cu o donație!