Barra di navigazione
  Home page Inizio Pagina precedente
 90 di 198 
Pagina seguente Fine Indice Tabelle Figure Bibliografia 85 86 87 88 89 90 91 92 93 94 95  

90
L’espansione del numero di server ha la funzione di contenere i
tempi di risposta del motore di ricerca a fronte di un traffico in conti-
nuo aumento; contemporaneamente, l’incremento della potenza di cal-
colo permette di gestire in maniera efficiente le operazioni di crawling
e indexing di una porzione del Web sempre più vasta: grazie alla sue
doti di scalabilità, il database di Google è cresciuto ad un ritmo espo-
nenziale, superando nettamente per numero di pagine indicizzate tutti
gli altri motori di ricerca già a partire dal 2000
41
.
4.2.4
Sfide per il futuro
Le maggiori sfide tecnologiche dalle quali dipende la possibilità
di Google di rimanere competitivo vanno essenzialmente in due dire-
zioni. La prima è legata alla necessità di tenere l’indice del motore di
ricerca costantemente aggiornato: sebbene Googlebot visiti regolar-
mente le pagine web il cui contenuto cambia con maggiore frequenza
(ad esempio i siti di news come CNN.com
42
) allo scopo di avere sem-
pre un’immagine il più possibile fresca di tali pagine nella propria
cache, la completa ricostruzione dell’indice del motore di ricerca non
è effettuata che su base mensile (tipicamente durante la quarta setti-
mana di ogni mese)
43
. Ciò è dovuto all’elevata complessità computa-
zionale del calcolo di PageRank su un indice di oltre due miliardi di
pagine web. Come anticipato dal CEO E. Schmidt, uno degli obiettivi
di lungo termine di Google è quello di riuscire ad aggiornare comple-
tamente l’indice del motore di ricerca su base giornaliera. Naturalmen-
te questo obiettivo richiederà un incremento notevole della potenza di
calcolo del motore di ricerca, per cui non ci si può ragionevolmente
aspettare che sia raggiunto entro breve. Nel frattempo, l’attività dello
staff di ricerca di Google è concentrata sullo sviluppo di algoritmi che
                                                
41
Vedi figg. 4.1, 4.2 e 4.3.
42
Un servizio sperimentale creato a questo scopo è Google News Search
(http://news.google.com/), una rassegna stampa interattiva che google costruisce ef-
fettuando una scansione su base oraria dei siti web dei maggiori quotidiani, news
network e agenzie di stampa. 
43
Pagina precedente Inizio pagina Pagina seguente