Măsurarea numărului pi cu Monte Carlo

Question

Măsurarea numărului pi cu Monte Carlo

3.8k vizualizari

Presupun că știți deja că numărul π poate fi măsurat printr-o metodă statistică astfel: desenăm o țintă sub forma unui cerc înscris într-un pătrat și aruncăm cu săgeți spre țintă în așa fel încît în interiorul pătratului distribuția înțepăturilor să fie uniformă. Atunci raportul dintre numărul de înțepături care au intrat în cerc și numărul total de înțepături din pătrat este aproximativ egal cu π/4, de unde îl putem calcula pe π. Cînd spun „aproximativ” mă refer la faptul că dacă numărul total de înțepături e mic, atunci fluctuațiile statistice sînt mari și deci precizia cu care îl măsurăm pe π e proastă.

Întrebarea este: de cîte ori trebuie să aruncăm cu săgeata pentru ca eroarea cu care îl măsurăm pe π să fie sub 0,1 cu o confidență de 90%?

Confidența de 90% este o probabilitate, și anume probabilitatea ca, dacă repetăm de foarte multe ori seria de aruncări, la 90% dintre serii valoarea găsită a lui π va avea o eroare mai mică decît limita stabilită.

Uniformitatea de care vorbeam e perfectă și întregul experiment decurge exact ca în enunț. Astfel, singura problemă e de ordin matematic, nu fizic.

a intrebat AdiJapan Expert (12.9k puncte) Dec 8, 2015 in categoria Matematica

Ma intreb daca putem lasa toata treaba in seama unui program de computer, si cum anume ar trebui sa facem acest lucru.

In primul rand, pentru a simula distributia uniforma a intepaturilor, trebuie sa generam aleatoriu, cu functii de randomizare, coordonatele unei lovituri in interiorul patratului.

Sa presupunem ca scriem programul de asa natura incat sa se opreasca automat atunci cand se ajunge la o precizie dorita a lui pi, retinand numarul de aruncari necesare.

Odata pus la punct un asemenea program, il rulam de foarte multe ori si retinem de fiecare data numarul de aruncari necesare pentru a atinge valoarea lui pi cu precizia dorita.

Dar cum anume se transpune in scenariul asta computerizat confidenta de 90%?

Un exemplu de program, in python, am gasit in clipul de mai jos:

a comentat goguv Senior (8.1k puncte) Dec 14, 2015

În situația de față programul acela de simulare a țintei e bun doar ca exercițiu. Pentru a calcula numărul de iterații după care eroarea de măsurare să fie mai mică de o anumită limită cu o anumită probabilitate ar necesita enorm de multe calcule și ar dura îngrozitor de mult. În plus, ar fi inexact, pentru că însuși calculul s-ar baza pe o statistică. Există o cale mai simplă în care toate calculele se fac fără numere aleatoare. Această metodă mi-a permis să aflu că numărul de aruncări cerut de problemă este exact 706. Dar tocmai în asta constă problema, așa că pentru moment nu dau mai multe detalii despre cum am făcut calculul. Deocamdată avem soluția lui zec, care dă o estimare destul de bună a răspunsului.

a comentat AdiJapan Expert (12.9k puncte) Dec 14, 2015

Fara numere aleatoare, o idee care imi vine in minte ar fi impartirea patratului in patrate mai mici, de dimensiuni egale (de pilda plecand de la 25 pe 25, fiecare latura, si crescand numarul de diviziuni ale laturilor patratului mare). Fiecare patratel astfel rezultat va avea asociata o probabilitate egala cu celelalte patratele de a "gazdui" o sageata.

Numarand patratelele mici astfel rezultate care sunt in interiorul cercului si raportand la numarul total de patratele se poate aproxima valoarea lui pi/4. De la o valoarea incolo a numarului total de patratele se va ajunge la o valoare a lui pi de precizia dorita. Acum ar trebui sa ma apuc sa fac si desenele, si calculele, si sa vad ce fac cu patratelele care intersecteaza cercul...

a comentat goguv Senior (8.1k puncte) Dec 14, 2015

Nu nu nu! Știm deja că probabilitatea ca o săgeată să intre în cerc este pi/4. Acum nu mai e nevoie nici de pătrat, nici de cerc, nici de săgeți. Avem un proces a cărui probabilitate de succes este p = pi/4. În momentul acesta, dacă vreți neapărat o reprezentare vizuală a procesului, putem presupune că avem un segment de lungime 1 pe care fixăm un reper la poziția p. Segmentul îl bombardăm cu puncte distribuite uniform aleator. Cele care cad la stînga lui p le numim succese, iar cele de la dreapta le numim eșecuri. Iar asta e tot pentru că doriți o imagine vizuală. Dar esența e că avem un proces cu o probabilitate p constantă de succes.

Acum problema e ce se întîmplă dacă repetăm procesul de n ori. De cîte ori numărul de succese va fi un anumit k aflat între 0 și n? Acest calcul se poate face prin formule, fără a mai genera numere aleatoare. Iar ideea problemei este să vedem cît de mare trebuie să fie acel n pentru care numărul de succese k are 90% probabilitate de a cădea într-un anumit interval din jurul lui p*n (interval dat de eroarea maximă stabilită pentru pi).

De-asta spuneam că programul acela de simulare e bun doar ca exercițiu, dar că nu ajută prea mult la rezolvarea problemei. Este o etapă care în final se dovedește utilă doar la înțelegerea fenomenului, nu și la calcule.

a comentat AdiJapan Expert (12.9k puncte) Dec 15, 2015

Revin cu o intrebare, intrucat m-am mai documentat pe internet pe tema data si am nimerit peste notiuni de statitica si probabilitati pe care nu le stapanesc.

Intreb si pentru ca explicatia lui zec, desi probabil contine raspunsul la intrebarea mea, e prea tehnica pentru mine.

Exista o relatie intre abaterea (deviatia) standard - sigma - si confidenta de care vorbiti?

Eu am nimerit peste pagini web care abordeaza problema dvs., si se ajunge de obicei la calcul de sigma. Din putinul pe care l-am citit ca notiuni de statistica, inteleg ca asociem 1 sigma unei confidente de 68%, 2 sigma lui 95%, respectiv 3 sigma lui 99%.

Confund cumva conceptul de confidenta cu altceva? Iar daca nu, cu ce as asocia acest 90% despre care vorbiti?

a comentat goguv Senior (8.1k puncte) Dec 16, 2015

Da, noțiunea deviației standard e cea relevantă la problema asta. Dar ca să nu folosesc în enunț noțiuni pe care lumea poate nu le cunoaște, am exprimat problema folosind numai noțiuni pe care le-am definit pe loc. De-asta am spus ce înseamnă confidența și tot de-asta contextul din jurul lui „fluctuațiile statistice” e ceva mai umflat decît ar avea nevoie cineva care se pricepe.

Mai mult, pentru a rezolva problema nu e nevoie să știți ce înseamnă deviația standard și nici să aveți cunoștințe de statistică, pentru că se pot face calcule ab initio, fără a folosi noțiuni sau teoreme stabilite de înaintași. În plus, cu deviația statistică se lucrează ușor la distribuțiile gaussiene, or aici distribuția e alta, binomială. Se pot face aproximații, e drept, și de altfel soluția lui zec folosește și ea aproximații. Dar problema mea poate primi și un răspuns exact, acel 706 pe care l-am pomenit deja.

a comentat AdiJapan Expert (12.9k puncte) Dec 17, 2015

O intrebare suplimentara...

Am vazut in mesajele dvs. anterioare ca folositi Matlab/Mathworks. V-am spus mai sus ca eu am incropit un program propriu, simplist, in C, pentru calculul acelei sume de densitati de probabilitate. Programul esueaza repede odata cu cresterea lui n in jur de valoarea 40. Esueaza in sensul ca se ajunge la overflow-uri, banuiesc ca atunci cand se evalueaza factorialele numerelor mari necesare in calculul combinarilor de n luate cate k.

Sunt convins ca exista metode mai performante de a implementa operatii matematice cu numere foarte mari ori foarte mici, dar nu am cunostintele necesare sa fac eu insumi asta.

Am descoperit, in schimb, ca in platforme precum Wolfram Alpha ori MathWorks exista functii predefinite (binopdf, de pilda, in MathWorks), capabile sa evalueze densitatile de probabilitate intr-o distributie binomiala pentru valori mari ale lui n si k.

Nu stiu in Wolfram, dar in MathWorks e clar ca se poate face si suma densitatilor de probabilitate care indeplinesc anumite criterii (pentru k intr-un anumit interval).

Intrebarea mea este daca dvs. asa ati facut calculele, cu MathWorks, ori ati reusit sa aduceti formalismul matematic la care am ajuns impreuna la ceva care simplifica simtitor calculele, facandu-le abordabile cu creion si hartie?

a comentat goguv Senior (8.1k puncte) Dec 21, 2015

Mai întîi vă mulțumesc, fiindcă nu știam de funcția binopdf din Matlab. Eu am folosit pentru calculul combinărilor funcția nchoosek(n,k) și am adăugat puterile lui p și 1-p de mînă.

www.mathworks.com/help/matlab/ref/nchoosek.html

Funcția nchoosek(n,k) merge pînă puțin mai sus decît formula cu factoriale, pentru că calculează combinările cu o formulă ușor diferită, în care sînt mai puține înmulțiri de făcut și s-ar putea să le facă într-o astfel de ordine încît rezultatele parțiale să explodeze cît mai tîrziu:

https://en.wikipedia.org/wiki/Combination

Acum dacă mă gîndesc bine ar mai fi o idee: calculele să fie făcute mai întîi ca o sumă de logaritmi (în loc de produs de numere) și la final să se aplice o exponențială. În acest caz rezultatul nu mai e exact, ci are precizia de 15–17 cifre obișnuită pentru numerele „reale” din calculator, cele în așa-zisa dublă precizie. Dar asta n-ar fi o problemă în cazul de față, pentru că oricum p-ul e știut doar cu precizie limitată. E doar o idee, încă n-am încercat dacă merge bine.

Suma probabilităților am făcut-o prin însumare simplă, cu calculatorul.

a comentat AdiJapan Expert (12.9k puncte) Dec 22, 2015

Mi-am instalat si eu Octave, un inlocuitor, din cate am citit, destul de performant al Matlab-ului si, pe deasupra, si gratuit.

Am incropit urmatorul programel:

p = 0.785;
n = 0;
k = 0;
sum = 0;

do

n++;
sum = 0;
jos = ceil (3.04*n/4);
sus = floor (3.24*n/4);

for k = jos:sus
sum = sum + binopdf (k,n,p);
endfor

until (sum >= 0.9)
n
k
jos
sus
sum

Am testat si pentru conditia s>=0.95, dar, atat pe varianta 0.9, cat si pe 0.95, am obtinut rezultate parca prea "rotunde", si anume:

n = 700
k = 567 (completare ulterioara: jos=532, sus=567)
sum = 0.90247

respectiv

n = 1000
k = 810 (completare ulterioara: jos=760, sus=810)
sum = 0.95045

As fi curios ce va calculeaza dvs. in Matlab acest cod (daca nu detectati erori majore de logica in el, desigur)...

Completare ulterioara:

Am incercat mai tarziu si cu confidenta de 0.91, intrigat de cifrele rotunde obtinute pentru n atunci cand am pus conditia cu 0.9, respectiv 0.95.

Am obtinut:

n = 742
k = 601
jos = 564
sus = 601
sum = 0.91063

a comentat goguv Senior (8.1k puncte) Dec 26, 2015

Felicitări. Programul pe care l-ați scris mi se pare corect. Nu-l pot rula în Matlab, că nu e scris în același limbaj, dar am rulat programul meu cu parametrii dumneavoastră și mi-a ieșit și mie la fel, n = 700 și n = 1000 pentru cele două confidențe. Faptul că ies numere rotunde probabil e doar o întîmplare (interesantă, e drept).

Nu v-a ieșit n = 706 ca mie pentru că ați folosit o valoare rotunjită a lui pi. Încercați să înlocuiți 0.785 cu pi/4 (probabil puteți scrie chiar „pi” în cod) și analog pentru 3.04 și 3.24.

O observație: ați căutat primul n care îl dă pe pi cu confidența impusă (ceea ce e ce trebuie pentru problemă), dar dacă veți afișa o listă cu confidențele care ies la n-uri mai mari decît cel găsit veți observa că acele confidențe nu cresc monoton, ci au fluctuații. Există un alt n după care toate confidențele sînt mai mari de 90%, dar între cele două n-uri e un interval în care confidențele sînt cînd mai mici, cînd mai mari decît cea impusă. Asta se întîmplă din jocul celor două valori ale lui k. Este, dacă vreți, un fel de zgomot digital.

a comentat AdiJapan Expert (12.9k puncte) Dec 27, 2015

Nu stiam ca Octave si Matlab implementeaza sintaxe diferite. Credeam ca creatorii Octave au dorit sa copieze intocmai functiunile din Matlab, dar inteleg, citind in plus, ca MathWorks e un mastodont. Nu prea ai cum sa te pui cu el din postura de entuziast creator de software Open Source.

Intr-adevar, folosind constanta pi am obtinut valorile de mai jos:

n = 706
jos = 537
sus = 572
sum = 0.90126

Una peste alta, multumesc pentru "experienta". Am avut ocazia sa patrund in cateva microuniversuri ce-mi erau anterior complet straine.

Later edit:

Daca sunteti cumva curios, iata la adresa de mai jos implementarea din Octave a lui binopdf (nu stiu sigur daca este chiar ultima versiune, dar, oricum, codul sursa al versiunii curente este simplu de accesat). Eu unul mai am de citit multa programare pana la a intelege toata sintaxa de aici:

http://code.metager.de/source/xref/gnu/octave/scripts/statistics/distributions/binopdf.m

a comentat goguv Senior (8.1k puncte) Dec 28, 2015

1 Raspuns

zec · Answer 1 · 2015-12-12T19:44:16+0000

trebuie remarcat ca avem o lege de ditributie de tip Bernoulli(binomiala).Este schema clasica a bilei revenite cu sansa p sa iasa si q sa nu iasa.Sansa unei sageti aruncate sa atinga zona cercului este de p=pi/4 si sa nu iasa este q=1-pi/4.Dispersia unei distrubutii de acest tip este npq unde n reprezinta numarul de incercari si media M(X) este np.VOm aplica teorema lui Cebisev si anume

P(|X-M(X)|<a)>=1-D²(X)/a^2 unde D²(X) este dispersia variabilei X.

Teorema lui Cebisev afirma in fapt ca avem probabilitatea de cel putin

1-D²(X)/a^2 pentru care variabila X ia valori in intervalul (M(X)-a,M(X)+a)

O sa continui cum trebuie folosita teorema in aceasta situatie.Revin.

Acuma calculam evaluarea 1-D²(X)/a^2=1-4kpq/(k^2/10^2t)=

=1-4*(10^2t)pq/k punand conditia >=0,9 trebuie ca 4*(10^2t)pq/k <=1/10 de unde k>=4*10^2t+1pq..Pentru calcul pq=0,168547.. daca vrem o eroare de o sutime obtinem k>=67419 de unde n=269676.Valorile sunt destul de mari totusi.

Categorii

Măsurarea numărului pi cu Monte Carlo

Te rugam sa te autentifici sau sa te inregistrezi pentru a adauga un comentariu.

Te rugam sa te autentifici sau sa te inregistrezi pentru a raspunde la aceasta intrebare.

1 Raspuns

Te rugam sa te autentifici sau sa te inregistrezi pentru a adauga un comentariu.