I motori di ricerca

I motori di ricerca


Vorrei sapere come funziona un motore di ricerca internet, o meglio, le caratteristiche principali che gli permettono di raggiungere una cosi alta velocità.

Fiorenzo Masotti
11 dicembre 2006

Le ragioni della velocità nelle risposte dei motori di ricerca sono due: indicizzazione e parallelismo. La prima è concettuale, ed è una tecnica usata da decenni nel settore dell'information retrieval, e da millenni nelle biblioteche. Si tratta di costruire un indice che dica, per ogni termine, quali sono i documenti che lo contengono. Nel caso dei motori di ricerca, i documenti sono le pagine Web; nel caso di un libro, i documenti diventano le pagine del libro (e l'indice è denominato indice analitico); e così via. Grazie all'indice, un motore di ricerca non deve andare a cercare sul Web dopo ogni richiesta: gli basta guardare nell'indice.

La seconda ragione è più tecnologica. I motori di ricerca odierni sfruttano tecniche di parallelismo massiccio, dato che devono essere in grado di gestire migliaia di richieste al secondo. Ogni richiesta viene ridiretta a un calcolatore diverso, e ci sono decine di migliaia di calcolatori per ogni motore di ricerca. Questo causa, tra l'altro, problemi non banali di raffreddamento e di consumo di energia elettrica, che vengono gestiti con soluzioni sofisticate.

Stefano Mizzaro

© Copyright SISSA - Scuola Internazionale Superiore di Studi Avanzati - Trieste (Italy) - 2001-2011