Gå til hovedmeny Gå til hovedinnhold

ENORM: Google leter seg frem til rundt 3 millioner nye nettsteder hvert eneste minutt. ENORM: Google leter seg frem til rundt 3 millioner nye nettsteder hvert eneste minutt.

50.000 nye nettsider – hvert sekund

Skriv ut artikkel Del på Facebook Del på Twitter
Tips en venn om denne artikkelen
Publisert 18.12.08 14:33

Men Google mener de har altfor lite informasjon om brukerne sine.

Del på Facebook

Trodde du Google var et selskap som den siste tiden stort sett har jobbet med alt annet enn sin søketjeneste på nett de siste årene? Det kan kanskje se slik ut når du besøker søkemotoren, for utseendemessig har det ikke skjedd spesielt mye, men bak kulissene skjer mer enn du skulle tro.

Ekstrem økning i antall nettsider
- Vi antar at det finnes rundt én trilling nettsteder på nettet. Hvert sekund finner vi 50.000 nye nettsteder. Disse sidene blir så analysert, og rundt halvparten blir forkastet før resten legges inn i søkeindeksen, forteller Knut Magne Risvik, sjef for Googles forskningsavdeling i Trondheim.

Det jobbes også kontinuerlig med å forbedre søkeresultatene. Tradisjonelt kjenner vi til at Google primært har rangert søk basert på to faktorer: Hvor mange nettsteder lenker inn til både nettstedet og den enkelte nettsiden, og ikke minst den berømte PageRank-statusen til et nettsted. PageRank er et tall mellom 0 og 10 som Google gir forskjellige nettsteder, der lenker fra nettsteder med høy PageRank er mer verdifull enn nettsteder med lav PageRank.

Endrer søkemotoren hver 4. dag
- Før var det veldig mye fokus på PageRank, men nå baserer rangeringen av nettsteder seg på rundt 500 forskjellige signaler, eller matematisk utregnede parametre, som beregner relevans på en nettside. Det kan være alt fra hvor på nettsiden forskjellige ord finnes, til hva som er titler, sammenhenger mellom ord – og over til andre ting som vi ikke går ut med offentlig. Disse 500 signalene endres hver 4. dag, og noen ganger oftere, forteller Risvik.

Det er med andre ord ikke bare enkelt å sikre seg en topplassering på søkeresultatene til verdens overlegent mest brukte søkemotor.

Vi mener oppriktig at vi har altfor lite informasjon om brukerne.

Trenger mye data om bruken
Google har vært kritisert for å ha altfor mye informasjon om sine brukere, men det tilbakeviser forskningssjefen.

- Vi mener oppriktig at vi har altfor lite informasjon om brukerne. Det er et gammelt ordtak som sier «one size fits no-one», og det er ganske beskrivende. Vi bruker i stadig større grad dine gamle søk til å personifisere dine søkeresultater.

Et eksempel på at mye data er viktig for å gi gode resultater mener Risvik er Googles oversettingstjeneste.

- Du kan sette sammen verdens flinkeste språkforskere for å lage nøyaktige og omfattende regler for oversettelse av dokumenter, men når du kjører det gjennom en datamaskin så blir resultatet til dels latterlig, sier han.

Hvert år arrangeres det en stor konkurranse der automatiske oversettelsesverktøy blir testet. For noen år siden lå treffprosenten på korrekt oversatte setninger på rundt 20 prosent.

Bruker store datamengder for å bli gode
- Vår tjeneste har tatt et helt annet utgangspunkt. Vi begynte å samle sammen en enorm mengde dokumenter fra blant annet FN, der alle dokumenter var oversatt av eksperter. Så begynte vi å lage enorme databaser med ordlister, og ikke minst oversettelser av uttrykk og fraser. Resultatet er at vår tjeneste ikke forholder seg til noen vanlige ordbøker eller grammatikkregler, men i stedet er all oversetting basert på statistikk over hva som er mest normalt i oversettelser fra alle disse tusenvis av dokumenter som er analysert. Og jo flere dokumenter vi analyserer, og jo bedre oversettelse får brukerne, forteller han.

Denne endringen i taktikk skal ha fått treffprosenten opp i rundt 50 prosent.

Tenker mest på egen tjeneste
Google-sjefen ville i utgangspunktet ikke kommentere rapportene fra tidligere denne uken som tyder på at Google går vekk fra ønsket om såkalt nettnøytralitet, der all internettrafikk behandles likt. Men i forbindelse med omtale av funksjonen Google Suggest, som en funksjon der Google forsøker å gjette seg til hva du forsøker å søke på etter hvert som du skriver ting inn i søkeboksen, letter Risvik litt på sløret.

Poenget er nemlig at denne typen tjenester er med på å generere relativt mye mer trafikk mot Googles servere, og selskapet er ekstremt opptatt av ytelse.

- Våre tall viser at en ekstra forsinkelse på reaksjonen på våre tjenester på 0,2 sekunder gir et tap på 15 prosent av brukerne, og tjenester som Google Suggest genererer en god del trafikk. Det er vel litt av årsaken til at vi nå er på utkikk etter mer kapasitet, sier han.



Annonse

Kommentarer


MittOppdrag.no Få anbud på 1-2-3! Leter du etter kjærligheten? Side2.match.com/
Stikkord fra Nettavisen Bedrift: