87
computer e memorie di massa a basso costo e di facile reperibilità e
manutenzione perché prodotte su larga scala per il mercato consumer:
è questa la differenza di approccio fondamentale che distingue il pro-
totipo di Google descritto in [BriPag98] dai motori di ricerca pre-
esistenti, perlopiù basati su architetture ben più costose e complesse
da gestire
27
. Le soluzioni adottate sul lato hardware del sistema, fun-
zionali allefficienza delle procedure di crawling, indexing e ranking,
rispecchiano la stessa filosofia do-it-yourself in unottica di ottimizza-
zione spinta che ha caratterizzato le attività di sviluppo software di
Google.
4.2.1
Architettura modulare
La modularità di un sistema informativo è comunemente definita
come la misura in cui tale sistema è composto di componenti (softwa-
re o hardware) discreti relativamente indipendenti, tali che le modifi-
che apportate a uno o più componenti hanno un impatto minimo o nul-
lo sul resto del sistema. Nel caso dei sistemi di calcolo distribuiti, la
modularità è una proprietà importante per la stabilità globale del si-
stema in termini di tolleranza ai guasti.
Google si basa su unarchitettura distribuita altamente modulare,
costituita da migliaia di server situati in quattro centri di calcolo (dei
quali due sulla costa Ovest e due sulla costa Est degli Stati Uniti)
28
.
Tale scelta è da ricondursi principalmente al fatto che le applicazioni
di ricerca si prestano bene ad essere parallelizzate
29
. Inoltre, la scelta
dellhardware ha privilegiato il rapporto prezzo/performance, optando
per luso di server estremamente compatti, montabili a rack, equipag-
giati con economici processori Intel Celeron e hard disk IDE da 40
Gigabyte
30
. Infine, il sistema fa uso di sofisticate tecniche di load ba-
27
Ad esempio AltaVista, lanciato nel 1995, era basato sul processore RISC a 64 bit
Alpha della Digital Equipment Corporation, allora proprietaria del motore di ricerca.
28
Il numero di server utilizzati da Google è oggi superiore alle diecimila unità, an-
dando a costituire il più grande Linux cluster del mondo [Del02].
29
[Spo00].
30
[Int02].