Vorrei sapere come funziona un motore di ricerca internet, o meglio, le caratteristiche principali che gli permettono di raggiungere una cosi alta velocità.
Le ragioni della velocità nelle risposte dei motori di ricerca sono due:
indicizzazione e parallelismo. La prima è concettuale, ed è una tecnica
usata da decenni nel settore dell'information retrieval, e da millenni
nelle biblioteche. Si tratta di costruire un indice che dica, per ogni
termine, quali sono i documenti che lo contengono. Nel caso dei motori
di ricerca, i documenti sono le pagine Web; nel caso di un libro, i
documenti diventano le pagine del libro (e l'indice è denominato indice
analitico); e così via. Grazie all'indice, un motore di ricerca non deve
andare a cercare sul Web dopo ogni richiesta: gli basta guardare
nell'indice.
La seconda ragione è più tecnologica. I motori di ricerca odierni
sfruttano tecniche di parallelismo massiccio, dato che devono essere in
grado di gestire migliaia di richieste al secondo. Ogni richiesta viene
ridiretta a un calcolatore diverso, e ci sono decine di migliaia di
calcolatori per ogni motore di ricerca. Questo causa, tra l'altro,
problemi non banali di raffreddamento e di consumo di energia elettrica,
che vengono gestiti con soluzioni sofisticate.