Barra di navigazione
  Home page Inizio Pagina precedente
 79 di 198 
Pagina seguente Fine Indice Tabelle Figure Bibliografia 74 75 76 77 78 79 80 81 82 83 84  

79
del nucleo centrale della tecnologia software di Google, l’algoritmo
PageRank.
Tra i task comunemente svolti da un motore di ricerca, le proce-
dure di ranking rivestono un ruolo fondamentale, essendo in grado di
influenzare direttamente la qualità dei risultati. Il ranking consiste
nell’assegnare ai documenti indicizzati un ordine di rilevanza rispetto
alle query degli utenti; questa misura è quindi utilizzata per la selezio-
ne e presentazione in tempo reale dei risultati delle ricerche. Prima di
Google, gli algoritmi di ranking utilizzati dai maggiori motori di ricer-
ca facevano uso praticamente esclusivo di criteri cosiddetti on-the-
page, fra i quali rivestiva grande importanza l’occorrenza delle parole
chiave all’interno dei documenti HTML (per esempio nel titolo oppu-
re nel testo della pagina). Ora, mentre i criteri on-the-page possono
dare una buona misura del grado di rilevanza di un documento, nulla
dicono a proposito della sua importanza
11
. Questo problema è diventa-
to evidente in seguito alla crescita esplosiva del Web, alla quale si è
accompagnato un progressivo deterioramento della qualità dei risultati
dei motori di ricerca: mentre il numero di documenti indicizzati cre-
sceva di alcuni ordini di grandezza, diminuiva parallelamente la quali-
tà media del contenuto (anche a causa dell’aumento relativo dei con-
tenuti commerciali e promozionali rispetto a quelli di tipo informati-
vo), e la capacità degli utenti di trovare informazioni con gli strumenti
a loro disposizione rimaneva invariata
12
. L’innovazione fondamentale
di Brin e Page è stata quella di introdurre un algoritmo di ranking che
utilizza criteri off-the-page per migliorare la qualità dei risultati.
                                                
11
Ai fini di questo capitolo intendiamo per “importanza” di un documento o di una
risorsa web una misura oggettiva della sua autorevolezza e qualità generale, mentre
utilizziamo il termine “rilevanza” per indicare la pertinenza di un documento rispet-
to ad una query specifica.
12
[BriPag98].
Pagina precedente Inizio pagina Pagina seguente