Scientia

Scientia terras irradiamus

...

Newsletter zilnic!

Ultimele intrebari pe QA

Concursul "Medicina azi"! (06.02-25.05)
Este în desfăşurare un nou concurs Scientia. Pentru detalii, citiţi regulamentul concursului.

Cum funcţionează Google? (2) Imprimare Email
Computerul - hardware şi software
Scris de Scientia.Ro   
Luni, 22 Februarie 2010 09:38

Google softsRobotul de căutare Google (google-bot) scanează Internetul, site cu site, pagină cu pagină, pentru a colecta cât mai mult din informaţia creată de deţinătorii de site-uri, bloguri etc. Ulterior acest conţinut este stocat într-o bază de date impresionantă de unde sunt extrase rezultatele atunci când apare o interogare pe pagina de căutare Google.

Cum funcţionează Google, partea 1

 

2. GOOGLE INDEXER


Google-bot procesează paginile pe care le solicită şi primeşte de la serverele de web pentru a le depozita conţinutul într-o imensă bază de date. Sunt colectate atât tag-urile (cum sunt tag-urile pentru titlu), cât şi atributele (cum sunt atributele ALT). Procesarea are însă limitele sale, fişierele multimedia (filme, fişiere audio, fişierele flash - .swf) ori paginile dinamice neputând fi parcurse din punct de vedere al informaţiei conţinute. De asemenea, nici textul din imagini nu poate fi colectat de google-bot.


Cuvintele colectate sunt depozitate aşadar în baza de date Google. Fiecare termen este însoţit de lista paginilor în care acesta apare şi poziţia în text în care se află. Această formă de stocare permite accesul rapid la paginile web atunci când acestea conţin termenii folosiţi de un utilizator în interogarea sa pe pagina de căutare Google. Cuvintele foarte întâlnite, cum sunt prepoziţiile, pronumele etc. nu sunt indexate, întrucât nu sunt relevante într-o eventuală căutare.

Google WebMaster Tools şi indexarea reală a paginilor web

Cei care folosesc WebMaster Tools, instrumentul pus la dispoziţia administratorilor site-uri pentru a urmări nivelul de indexare a paginilor site-ului de către Google probabil că au observat următoare inadvertenţă: deşi pagini nou create pe site apar ca fiind neindexate de Google, în fapt, la o căutare folosind cuvinte cheie potrivite se observă acestea sunt luate în calcul de Google, că se află în baza de date a acestuia, iar lista de rezultate Google le conţin. Acest fapt înseamnă, simplu, că datele din pagina WebMaster Tools nu este actualizată. Uneori trec săptămâni până când Google afişează datele corecte şi aici.

 

3. PROCESORUL DE INTEROGĂRI (QUERY PROCESSOR)


Procesorul de interogări este constituit din celebra interfaţă Google (pagina de căutare, google.com), motorul care evaluează interogările utilizatorilor şi identifică paginile web relevante şi softul care formatează rezultatele căutării.

 

Procesarea unei interogări pe Google

 

Atunci când un utilizator efectuează o căutare pe Google, are loc o căutare rapidă în indexul de termeni şi sunt returnate linkuri către acele pagini web considerate de Google cele mai relevante pentru respectiva interogare. Relevanţa unei pagini web raportată la o căutare este determinată de mai bine de 200 de factori, dintre care unul important este Page Rank-ul (despre care vom vorbi  în detaliu în articolul următor). În esenţă, Page Rank-ul reprezintă importanţa unei pagini web bazată pe linkurile către aceasta de la alte pagini. Desigur, Google ţine secret modul în care stabileşte relevanţa paginilor.

 

Cum funcţionează Google (3). PageRank-ul

 

BIBLIOGRAFIE:
googleguide.com/google_works.html
google.com/corporate/tech.html
google.com/support/webmasters/bin/answer.py?hl=en&answer=70897

 


Citeşte şi:



Ultimele mesaje pe forum
SpaceAlliance.ro : Primul portal romanesc de tehnologii aerospatiale
Mai putin de 48 de ore pana la lansare
Unde electro-magnetice
RaduH, se pare ca faci confuzie intre modelul matematic folosit in teorie si masuratorile fizice.In modelul matematic, totul este perfect, ideal, 100% exact. Masuratorile fizice sunt insa caracterizate de marje de eroare, (fapt care, apropo, are ca rezultat si folo...
Cum sa depasesti viteza luminii fara a depasi lumina
Citat din mesajul lui: tavy din Ieri la 07:29:02 Nu pot include masa,Ok.Citat este cumva o cerință pentru a fi ceva fizic?Nu. Dar e o cerinta pentru ca ceva sa se poata misca in sens fizic, adica sa aiba o viteza (de deplasare).Citat Am afirmat eu undeva că spotul ...
Din nou despre viteza transmiterii informaţiei.
Iti spun eu ca nu se cauta, citeste rezumatul articolului publicat in revista de specialitate. Articolul sau adaptarea in limba romana nu este riguros din punct de vedere stiintific si te induce in eroare daca nu stii despre ce este vorba. Cum articolul este scris ...
Scientia