91
permettano di individuare quali pagine web hanno unalta frequenza
di aggiornamento, e pertanto necessitano di essere visitate più spesso
dal crawler
44
.
La seconda direzione in cui Google intende indirizzare
levoluzione della sua tecnologia di ricerca riguarda aspetti legati
allintelligenza artificiale quali il problema del riconoscimento ed ela-
borazione del linguaggio naturale (NLP, Natural Language
Processing) e, più in generale, la necessità di applicare criteri seman-
tici alle tecniche di ricerca di informazioni:
È da parecchio tempo che si sta cercando di incorporare [tecniche
di] intelligenza artificiale nei [servizi di] ricerca, ed è molto diffici-
le. È difficile comprendere la query, ed è difficile comprendere il
corpus nel nostro caso, il Web al punto tale di essere in grado di
fornire lo stesso tipo di risposte che un essere umano darebbe se
avesse la capacità di consultare oltre due miliardi di pagine web.
Naturalmente, più i computer saranno in grado di comprendere
quello che sta accadendo, migliore sarà la nostra esperienza nella
ricerca di informazioni. Il nostro obiettivo, per un domani, è quello
di avere un computer come quello di Star Trek. Avere un computer
che sappia parlare e che capisca le domande, che abbia questo e-
norme database a sua disposizione a cui possa accedere istantane-
amente, riassumendo le informazioni e leggendole [allutente] con
voce umana. Ad ogni modo, sebbene lIA sia prevista per il nostro
futuro, non sarà la prossima cosa di cui ci occuperemo. Quello che
sta già accadendo oggi è che Google è più di un semplice motore di
ricerca. In risposta ad una query forniamo più di una semplice lista
di siti web. Estrapolando una quantità di informazioni semantiche
sufficiente per comprendere il tipo di query con cui abbiamo a che
fare [
] noi ora siamo in grado di restituire un collegamento a una
mappa (in risposta a [una query contenente] un indirizzo) o un col-
legamento agli indici di borsa (in risposta a [una query contenente]
un codice di borsa). Inoltre, gli utenti possono cliccare su una paro-
44
[Spr02].