Pentru a vă înregistra, vă rugăm să trimiteți un email către administratorul site-ului.
Pune o întrebare

3.6k intrebari

6.8k raspunsuri

15.5k comentarii

2.5k utilizatori

1 plus 0 minusuri
2.4k vizualizari
Deasupra unui semafor pentru pietoni este instalată o cameră de luat vederi, conectată la un calculator. Un program analizează imaginile și, printre alte statistici, ne dă și următoarele informații despre cît au așteptat pietonii la semafor.

- Au fost contorizați 10000 pietoni, dintre care:
- 5212 au așteptat între 0 s și 5 s.
- 1020 au așteptat între 5 s și 10 s.
- 1002 au așteptat între 10 s și 15 s.
- 986 au așteptat între 15 s și 20 s.
- 991 au așteptat între 20 s și 25 s.
- 789 au așteptat între 25 s și 30 s.
- 0 au așteptat mai mult de 30 s.

Presupunem că pietonii ajung la semafor în mod cu totul aleator (distribuție uniformă în timp), că nici un pieton nu traversează pe roșu și că aceia care trebuie să aștepte traversează exact cînd se face semaforul verde.

Puteți deduce cîte secunde durează culoarea verde a semaforului și cîte secunde durează culoarea roșie?
Expert (12.9k puncte) in categoria Matematica
0 0
Presupun ca tred este cel mult 30s, aspect sugerat de contorul 0. Un om care este la un semafor cu tred = 30s si tgreen necunoscut are un timp mediu de asteptare w = (tred/(tred+tgreen)) × tred/2.  Asta pe de o parte. Pe de cealalta, timpul mediu de asteptare il calculez dupa distributia precizata : w1 = ( 5212 × 2.5 + 1020 × 7.5  +  ... 789 × 27.5) / 10.000 =~  9.4s. Egalind w cu w1 si punind tred= 30s obtin tgreen = 50s. Nu-mi dau seama unde gresesc pentru ca am mari indoieli asupra rezultatului.
0 0
Felicitări pentru tentativă. :-)

Da, și eu am îndoieli asupra rezultatului.
0 0
Rezultatul este important, dar esentiala pentru mine este metoda de-a ajunge la el. Egalarea celor doi timpi medii de asteptare cred ca poate duce si la numerele precise dorite, gresind astfel eu la exprimarea sau calculul numeric al timpilor.
0 0
Așa e, metoda e esențială. Ați putea începe prin a căuta niște formule care să dea numărul – mai exact fracțiunea – pietonilor din fiecare interval, în cazul unei distribuții perfect uniforme. Nu aleatoare ca în enunț, ci exact uniformă. De fluctuațiile unei distribuții aleatoare și de efectele ei ne putem ocupa mai tîrziu.

1 Raspuns

1 plus 0 minusuri
 
Cel mai bun raspuns
Putem estima cu toată încrederea că durata culorii roșii e de 30 s, devreme ce, din 10000 de pietoni, niciunul nu a așteptat mai mult de atât.

Pietonii sunt de două categorii:

A. Cei care ajung la punctul de traversare și găsesc semaforul roșu, așteptând deci un interval de timp, fie el oricât de scurt dar nenul, în intervalul (0s, 30s].

B. Cei care în momentul ajungerii în punctul de traversare găsesc semaforul verde, indiferent dacă la o fracțiune de secundă după ce pun piciorul pe carosabil semaforul se face roșu în urma lor. E traversează fără să fie nevoiți să se oprească niciun moment la semafor, adică timpul lor de așteptare e de 0.

În grupul de 5212 sunt pietoni din ambele categorii, A și B adică unii vor aștepta în intervalul de timp (0 s, 5 s] iar alții așteaptă 0 s.

Determinăm rata medie a sosirilor la semafor pe intervale de câte 5 s, lăsând de-o parte grupul de 5212 deoarece aici sunt amestecați și din categoria A și din B. Rata medie a acestor sosiri e dată de media aritmetică a persoanelor care așteaptă la semafor în intervalele de câte 5 s din enunț: (1020 + 1002 + 986 + 991 + 789)/5 = 957,6. Deci numărul mediu al pietonilor care ajung la semafor este de 957,6 la fiecare 5 s.

 

Revenind la cei 5212, înseamnă că 957,6 din ei sosesc în medie în intervalul de 5 s înainte ca semaforul sa se facă verde, făcând parte din categoria A, iar restul de 5212 - 957,6 = 4254,4 sosesc în intervalul în care găsesc semaforul verde, ei formând categoria B.

 

De aici, 4254,4 : 957,6 = 4,44, adică avem 4,44 intervale de 5 s în care semaforul e verde. Rezultă 4,44 * 5 = 22,2 s este intervalul in care semaforul e verde.
Senior (6.6k puncte)
0 0
Pînă acum e cel mai bun răspuns. :-) Dat fiind că e singurul...

Ați gîndit bine, inclusiv categorisirea pietonilor, împărțirea primului interval în cele două categorii și proporționalitatea de la final care v-a permis să aflați durata pentru verde.

Ați greșit doar prima deducție, că roșul durează 30 s. Din datele problemei nu rezultă decît că durează între 25 și 30 s.

De altfel dacă vă uitați la toate intervalele în afară de primul și ultimul, fluctuațiile sînt relativ mici. Teoretic, fluctuațiile statistice în jurul unui număr N >> 1 sînt de ordinul √N, care în cazul de față înseamnă cam ±32. Mai exact deviațiile mai mici de ±32 reprezintă ±1 sigma, adică 68% din cazuri. Fluctuațiile mai mari sînt rare. Și se vede că numerele 1020, 1002, 986 și 991 se înscriu bine în acest ±32. În schimb numărul din ultimul interval e cu vreo 200 mai mic decît celelalte. Asta înseamnă că e improbabil să fie vorba de o simplă fluctuație statistică, mai bine zis e extrem de improbabil, pentru că diferența de 200 reprezintă vreo 6 sigma, deci probabilitatea e de 1 la vreo jumătate de miliard. Cel mai probabil e că nici un timp de așteptare nu s-a apropiat de 30 s și că, dacă statistica s-ar fi făcut pe intervale mai scurte, un interval ca [29, 30) ar fi rămas gol.

Acolo trebuie să regîndiți puțin rezolvarea. În rest v-ați descurcat foarte frumos. Felicitări. Chiar și dacă nu reparați greșeala tot e un răspuns lăudabil.
0 0
Aveţi dreptate. Mi s-a părut şi mie că în ultimul interval au sosit cam puţini pietoni, dar nu mi-a dat prin minte să sap în direcţia asta deşi acum e clar că trebuia săpat, pentru a calcula un timp statistic mai natural pentru acest interval.

Nu ştiu cum ati calculat dumneavoastră abaterea de +/- 32. Eu am luat valorile "normale" de 1020, 1002, 986 şi 991 şi am calculat abaterea pătratică medie. Am obţinut o deviaţie standard de +/-12,91. Tinând seama că facem media unor viteze, adică nr.persoane/5s, puteam calcula abaterea şi faţă de media armonică, e mai indicat atunci când mediem rate sau rapoarte, dar ideea rămâne aceeaşi, ultimul interval arată o dispersie anormală pentru un proces aleator.

E clar că durata ultimului interval trebuie scurtată - implicit durata totală cât semaforul e roşu.

Păstrând media din calculul meu, cea de 957,6 care dă o rată de 191,52 sosiri pe secundă, rezultă că ultimul interval ar trebui să dureze 789 : 191,52 = 4,12 s. Deci timpul total cât semaforul e roşu este de 29,12 s.

Calculând cu media numerelor "normale", cea de 999,75 ar rezulta un timp total de 28,95 s, deci putem deduce un timp în jur de 29 s pentru culoarea roşie. La fel, dacă folosim media de 999,75, timpul cât semaforul e verde e în jur de 22 s.
0 0
Felicitari pentru deductii. Banuiam ca cineva va rationa si astfel. Doua intrebari simple:
- media patratica medie
- media armonica
Ce inseamna si cum se aplica in cazul unei distributii uniforme, cum pare aceasta, respectiv in situatia uneia aleatoare. Este evident faptul ca nimeni, nici macar autorul, nu s-a obosit sa afle daca sugestia mea din comentariu este eronata (rezultatul numeric era pus in acest sens). Pina la sfirsit care este raspunsul, concis si raspicat?
0 0

Mulțumesc.

Abaterea pătratică madie sau deviația standard e utilă pentru a evalua dispersia unor valori aleatoare  în raport cu o valoare  medie, aritmetică dar nu numai. Ea se exprimă ca sqrt[sum(ai - m)2/N] unde ai sunt numerele, m e media lor iar N numărul lor. Deviația standard fixează intervalul de normalitate al valorilor, intervalul admisibil al fluctuațiilor statistice, iar dacă acesta este semnificativ depășit pot fi trase unele concluzii cum ar fi aceea că valorile nu sunt chiar aleatoare, ceea ce poate conduce la existența unor relații de cauzalitate.

 

Definirea valorilor medii se poate face în mai multe moduri, depinzănd de de ce vrem să evidențiem. Dacă vrem, de exemplu să calculăm timpul mediu pe care copiii din blocul meu îl fac pănă la școală, sunt 9 copii care fac între 10 și 12 minute iar al zecilea face 2 ore până la o școală mai îndepărtată, media aritmetică ar da o valoare mult prea mult influențată de cela 2 ore ale unuia din ei, așa că are sens să ne găndim la o medie care pune cele 2 ore la numitorul unei fracții astfel încât ele să influențeze mai puțin media iar valoarea să fie mai concludentă. Aici e mai potrivită media armonică.

 

Media armonică e folosită și când lucrăm cu mărimi care exprimă rații, de exemplu viteze. Vedeți aici la exemplul cu mașinile, unde într-o situație e relevantă media armonică iar în alta media aritmetică https://en.wikipedia.org/wiki/Harmonic_mean

Despre medii un articolsimpatic și aici https://plus.maths.org/content/all-about-averages

Despre deviația standard o pagină adorabilă găsiți aici http://www.mathsisfun.com/data/standard-deviation.html

 

0 0
Nu de forma va spun multumesc.
Nelamurita ramin eu privind rezultatul pe care l-ati obtinut: timpul rosu este de.... si cel verde de...
Si intrebarea are ambiguitati dar se pare ca cere un raspuns precis.
0 0

La acel 22 s cred că ați greșit la calcule, pentru că eu, folosind formulele dumneavoastră, am obținut 21.

Acum vă pot spune că n-am scos numerele din burtă, ci am făcut o simulare cu numere aleatoare, iar aici doar am copiat numerele exact așa cum au ieșit din program, fără să le coafez în vreun fel. În simulare au intrat ca parametri duratele semaforului, iar acelea au fost de exact 21 s pentru verde și 29 s pentru roșu (fără părți fracționare). Astfel, dacă fluctuațiile statistice n-ar fi existat, numerele ar fi ieșit așa: 5200, 1000, 1000, 1000, 1000, 800.

M-ați întrebat de unde vine acel ±32. El este deviația standard teoretică pentru o distribuție Poisson cu media de 1000. (În tipul acesta de probleme distribuția Poisson e cea care descrie rezultatele, cu condiția ca evenimentele să fie independente, adică la noi pietonii să nu-și coreleze sosirile între ei. – PS: Între timp am tot citit și nu mai sînt așa sigur că e o distribuție Poisson.) Cum 1000 >> 1, distribuția Poisson se poate aproxima foarte bine cu o distribuție Gauss cu media de 1000 și deviația standard de √1000, adică aproximativ 32. Dacă am avea foarte multe date am putea estima deviația statistică din ele, dar aici avem numai 4 numere, adică prea puține. Abaterea pe care ați calculat-o, de 13 (mie mi-a ieșit 15, dar e tot pe-acolo), poate fi considerată doar o estimare grosieră a celei reale.

Încă o precizare. Numărul de pietoni care au așteptat peste 30 s a fost zero, iar deducția a fost că semaforul nu stă pe roșu mai mult de 30 s. E o deducție valabilă doar statistic, pentru că încă rămîne posibil ca roșul să dureze 31 s, să zicem, dar cu totul întîmplător n-a ajuns nici un pieton în timpul primei secunde de roșu. Nu este imposibil, dar e foarte improbabil dat fiind numărul mare de pietoni numărați. Dacă probabilitatea ca durata roșului să fie de fix 30 s am calculat-o ca de circa 1 la o jumătate de miliard, atunci probabilitatea să fie de 31 s este încă și mai mică. N-o mai calculez, dar e infimă. Astfel, spuneam ieri că din enunț putem deducă că roșul durează între 25 s și 30 s. riguros vorbind e fals. Putem deduce cu certitudine numai că e peste 25 s. Limita superioară n-o putem deduce decît cu probabilități.

O rezolvare completă a problemei ar însemna nu numai să spunem că durata cea mai probabilă pentru roșu e de 29 s și pentru verde e de 21 s, ci să precizăm și probabilitatea pentru alte valori posibile. Dar un asemenea calcul e complicat (pentru mine), așa că mă mulțumesc cu acest răspuns. Felicitări.

...