Scientia
Scientia terras irradiamus
Ultimele intrebari pe QA
- Ce s-ar intampla cu un obiect macroscopic daca el ar atinge viteza luminii?
- Intre ce limite in spatiu pot fi situati satelitii pentru a nu cadea pe Pamant si a nu se pierde in spatiu?
- Ce inseamna ca doua particule sunt in stare de inseparabilitate cuantica (quantum entanglement)?
- Inexistentei unor valori exacte ale numerelor irationale nu ii corespund anumite limitari in lumea fizica?
- Cum functioneaza bumerangul? De ce revine la aruncator?
- Este adevarat ca in caz de otravire laptele elimina substanta toxica? Cum?
- Cate zile se poate trai fara mancare? Dar fara apa?
- Este materia o formă a energiei?
- Ce semnificatie fizica se poate atribui numerelor irationale?
- Care e procedura ideala cand simtim ca masina aluneca pe gheata?
- Bere sau vin ?
- Pro şi contra: "Dumnezeu este Universul".
- Cum functioneaza un antibiotic?
- A vazut cineva documentarul "The Secret"?
- Demonstraţi că nu există Dumnezeu.
- Credeti ca se va descoperi viata in lacul Vostok?
- Mai sunt și alte țări (excludem Danemarca) în care învățământul să fie gratuit? Mă refer la facultăți
- Putem fi siguri că oamenii percep lumea într-un mod similar?
- De ce atomul de Hidrogen (protiu) nu are neutroni?
- Care este originea expresiei: "a face pe dracu-n patru"?
- Cum s-a ajuns ca învățământul să fie gratuit în Danemarca?
- Ce a generat big bang-ul?
- Se poate comunica între două calculatoare cu ajutorul unei transmisii FM?
- De ce voltajul incepe sa oscileze descrescator ca urmare a interactiei cu UV-ul?
- Ce va ramane in urma noastra atunci cand toti vom disparea?
Concursul "Medicina azi"! (06.02-25.05)
Este în desfăşurare un nou concurs Scientia. Pentru detalii, citiţi regulamentul concursului.
| Cum funcţionează Google? (2) |
|
|
| Computerul - hardware şi software |
| Scris de Scientia.Ro |
| Luni, 22 Februarie 2010 09:38 |
|
Cum funcţionează Google, partea 1
2. GOOGLE INDEXER Google-bot procesează paginile pe care le solicită şi primeşte de la serverele de web pentru a le depozita conţinutul într-o imensă bază de date. Sunt colectate atât tag-urile (cum sunt tag-urile pentru titlu), cât şi atributele (cum sunt atributele ALT). Procesarea are însă limitele sale, fişierele multimedia (filme, fişiere audio, fişierele flash - .swf) ori paginile dinamice neputând fi parcurse din punct de vedere al informaţiei conţinute. De asemenea, nici textul din imagini nu poate fi colectat de google-bot.
Cuvintele colectate sunt depozitate aşadar în baza de date Google. Fiecare termen este însoţit de lista paginilor în care acesta apare şi poziţia în text în care se află. Această formă de stocare permite accesul rapid la paginile web atunci când acestea conţin termenii folosiţi de un utilizator în interogarea sa pe pagina de căutare Google. Cuvintele foarte întâlnite, cum sunt prepoziţiile, pronumele etc. nu sunt indexate, întrucât nu sunt relevante într-o eventuală căutare. Google WebMaster Tools şi indexarea reală a paginilor web Cei care folosesc WebMaster Tools, instrumentul pus la dispoziţia administratorilor site-uri pentru a urmări nivelul de indexare a paginilor site-ului de către Google probabil că au observat următoare inadvertenţă: deşi pagini nou create pe site apar ca fiind neindexate de Google, în fapt, la o căutare folosind cuvinte cheie potrivite se observă acestea sunt luate în calcul de Google, că se află în baza de date a acestuia, iar lista de rezultate Google le conţin. Acest fapt înseamnă, simplu, că datele din pagina WebMaster Tools nu este actualizată. Uneori trec săptămâni până când Google afişează datele corecte şi aici.
3. PROCESORUL DE INTEROGĂRI (QUERY PROCESSOR) Procesorul de interogări este constituit din celebra interfaţă Google (pagina de căutare, google.com), motorul care evaluează interogările utilizatorilor şi identifică paginile web relevante şi softul care formatează rezultatele căutării.
Atunci când un utilizator efectuează o căutare pe Google, are loc o căutare rapidă în indexul de termeni şi sunt returnate linkuri către acele pagini web considerate de Google cele mai relevante pentru respectiva interogare. Relevanţa unei pagini web raportată la o căutare este determinată de mai bine de 200 de factori, dintre care unul important este Page Rank-ul (despre care vom vorbi în detaliu în articolul următor). În esenţă, Page Rank-ul reprezintă importanţa unei pagini web bazată pe linkurile către aceasta de la alte pagini. Desigur, Google ţine secret modul în care stabileşte relevanţa paginilor.
Cum funcţionează Google (3). PageRank-ul
BIBLIOGRAFIE: |


Robotul de căutare Google (google-bot) scanează Internetul, site cu site, pagină cu pagină, pentru a colecta cât mai mult din informaţia creată de deţinătorii de site-uri, bloguri etc. Ulterior acest conţinut este stocat într-o bază de date impresionantă de unde sunt extrase rezultatele atunci când apare o interogare pe pagina de căutare Google.