Gå til hovedmeny Gå til hovedinnhold
ENORM: Google leter seg frem til rundt 3 millioner nye nettsteder hvert eneste minutt.
Men Google mener de har altfor lite informasjon om brukerne sine.
Trodde du Google var et selskap som den siste tiden stort sett har jobbet med alt annet enn sin søketjeneste på nett de siste årene? Det kan kanskje se slik ut når du besøker søkemotoren, for utseendemessig har det ikke skjedd spesielt mye, men bak kulissene skjer mer enn du skulle tro.
Ekstrem økning i antall nettsider
- Vi antar at det finnes rundt én trilling nettsteder på nettet. Hvert sekund
finner vi 50.000 nye nettsteder. Disse sidene blir så analysert, og rundt
halvparten blir forkastet før resten legges inn i søkeindeksen, forteller
Knut Magne Risvik, sjef for Googles forskningsavdeling i Trondheim.
Det jobbes også kontinuerlig med å forbedre søkeresultatene. Tradisjonelt kjenner vi til at Google primært har rangert søk basert på to faktorer: Hvor mange nettsteder lenker inn til både nettstedet og den enkelte nettsiden, og ikke minst den berømte PageRank-statusen til et nettsted. PageRank er et tall mellom 0 og 10 som Google gir forskjellige nettsteder, der lenker fra nettsteder med høy PageRank er mer verdifull enn nettsteder med lav PageRank.
Endrer søkemotoren hver 4. dag
- Før var det veldig mye fokus på PageRank, men nå baserer rangeringen av
nettsteder seg på rundt 500 forskjellige signaler, eller matematisk
utregnede parametre, som beregner relevans på en nettside. Det kan være alt
fra hvor på nettsiden forskjellige ord finnes, til hva som er titler,
sammenhenger mellom ord – og over til andre ting som vi ikke går ut med
offentlig. Disse 500 signalene endres hver 4. dag, og noen ganger oftere,
forteller Risvik.
Det er med andre ord ikke bare enkelt å sikre seg en topplassering på søkeresultatene til verdens overlegent mest brukte søkemotor.
Vi mener oppriktig at vi har altfor lite informasjon om brukerne.
Trenger mye data om bruken
Google har vært kritisert for å ha altfor mye informasjon om sine brukere,
men det tilbakeviser forskningssjefen.
- Vi mener oppriktig at vi har altfor lite informasjon om brukerne. Det er et gammelt ordtak som sier «one size fits no-one», og det er ganske beskrivende. Vi bruker i stadig større grad dine gamle søk til å personifisere dine søkeresultater.
Et eksempel på at mye data er viktig for å gi gode resultater mener Risvik er Googles oversettingstjeneste.
- Du kan sette sammen verdens flinkeste språkforskere for å lage nøyaktige og omfattende regler for oversettelse av dokumenter, men når du kjører det gjennom en datamaskin så blir resultatet til dels latterlig, sier han.
Hvert år arrangeres det en stor konkurranse der automatiske oversettelsesverktøy blir testet. For noen år siden lå treffprosenten på korrekt oversatte setninger på rundt 20 prosent.
Bruker store datamengder for å bli gode
- Vår tjeneste har tatt et helt annet utgangspunkt. Vi begynte å samle sammen
en enorm mengde dokumenter fra blant annet FN, der alle dokumenter var
oversatt av eksperter. Så begynte vi å lage enorme databaser med ordlister,
og ikke minst oversettelser av uttrykk og fraser. Resultatet er at vår
tjeneste ikke forholder seg til noen vanlige ordbøker eller
grammatikkregler, men i stedet er all oversetting basert på statistikk over
hva som er mest normalt i oversettelser fra alle disse tusenvis av
dokumenter som er analysert. Og jo flere dokumenter vi analyserer, og jo
bedre oversettelse får brukerne, forteller han.
Denne endringen i taktikk skal ha fått treffprosenten opp i rundt 50 prosent.

Tenker mest på egen tjeneste
Google-sjefen ville i utgangspunktet ikke kommentere rapportene fra tidligere
denne uken som tyder på at Google
går vekk fra ønsket om såkalt nettnøytralitet, der
all internettrafikk behandles likt. Men i forbindelse med omtale av
funksjonen Google Suggest, som en funksjon der Google forsøker å gjette seg
til hva du forsøker å søke på etter hvert som du skriver ting inn i
søkeboksen, letter Risvik litt på sløret.
Poenget er nemlig at denne typen tjenester er med på å generere relativt mye mer trafikk mot Googles servere, og selskapet er ekstremt opptatt av ytelse.
- Våre tall viser at en ekstra forsinkelse på reaksjonen på våre tjenester på 0,2 sekunder gir et tap på 15 prosent av brukerne, og tjenester som Google Suggest genererer en god del trafikk. Det er vel litt av årsaken til at vi nå er på utkikk etter mer kapasitet, sier han.