Google Caffeine, noul sistem de indexare al gigantului motor de cautare

Apropo.ro / 09.06.2010, 12:00
Google Caffeine, noul sistem de indexare al gigantului motor de cautare
Google a anuntat ca a terminat noul sistem de indexare al paginilor web, denumit Caffeine.

Google loveste puternic in motoarele de cautare
concurente
anuntand ca isi schimba sistemul de indexare al
paginilor web. Google Caffeine se anunta a fi cu 50% mai
eficient
decat vechiul sistem de indexare, deoarece este
capabil sa returneze rezultate proaspete, de abia publicate.

In caz ca erati curiosi, va vom explica modul in care functiona
vechiul sistem de indexare Google.

Primul lucru pe care trebuie sa il intelegeti este ca atunci
cand cautati ceva pe Google, nu cautati efectiv pe internet ci in

baza de date Google
cu site-urile indexate de acesta. Pentru
indexarea site-urilor se foloseau „spiders”(n.r. paienjeni) care
localizau cateva site-uri si apoi incepeau sa creeze o panza cu
paginile acelor site-uri si link-urile care plecau afara din acele
site-uri si tot asa.

Sa zicem ca tastati „cat de mare este Pamantul” in Google si
apasati tasta Enter. In acea clipa Google incepe un
proces foarte
elaborat pentru a returna un raspuns cat mai
relevant. Google incepe sa isi filtreze paginile indexate dupa
cateva repere gen page rank-ul, preponderenta
cuvintelor cautate in pagini, calitatea continului acelui site si
altele, toate aceste actiuni desfasurandu-se in maxim jumatate de
secunda.

Urmariti aici un
video
despre cum indexa
Google
.

Cam acesta este principiul de indexare al
tuturor motoarelor de cautare din lume.

Pentru a se adapta noului val de useri activi si realizand ca nu
pot face fata exploziei de informatii noi care
apar pe internet, la fiecare secunda, o schimbare in sistemul de
indexare a celui mai mare motor de cautare din lume era
necesara.

Cu Caffeine, Google
analizeaza internetul pe bucati mai mici si reimprospateaza
index-ul continuu, la o scala globala. Mai exact, la fiecare
secunda Caffeine proceseaza sute de mii de pagini in paralel.
Daca informatiile ar fi fost scrise pe hartie,
atunci gramada indexata de Caffeine in fiecare secunda s-ar
inalta cu 4 km
.

Momentan Google Caffeine ocupa aproximativ 100
de milioane de GB si in fiecare zi se adauga cateva sute de mii de
GB de informatii noi.

Asadar, cautarile in Google vor returna informatii mult mai noi,
mult mai relevante chiar daca ele au fost publicate cu 1 minut in
urma.