Motore di ricerca

Enciclopedia della Scienza e della Tecnica (2008)

motore di ricerca

Mauro Cappelli

Sistema automatico (web search engine) contenente un indice ricercabile di pagine web e dati di varia natura che fornisce all’utente una lista dei contenuti disponibili ordinati secondo un grado di rilevanza (ranking) fissato da determinate regole algoritmiche. L’algoritmo che gestisce il motore ordina le pagine richieste secondo le parole o frasi ricercate dall’utente. Il principale motore di ricerca, con ca. il 50% del mercato globale, è ormai da anni Google (il suo indice nel 2007 supera qualche decina di miliardi di pagine), benché siano molto usati, a livello mondiale, anche Yahoo! e Live Search. In Cina, invece, il motore di ricerca più popolare è Baidu. In Italia, oltre alle versioni locali dei motori citati, i più frequentati risultano Libero e Virgilio. Un motore di ricerca svolge tipicamente la propria funzione in tre fasi: web crawling, indexing e searching. La prima è la fase di analisi dei database attraverso software proprietari detti crawler, spider o bot, in grado di rintracciare tutti i contenuti di interesse per la ricerca in atto seguendo la tela dei link. La seconda è la fase di inserimento delle pagine analizzate all’interno dell’indice del motore di ricerca. L’ultima fase rappresenta la risposta vera e propria all’utente mediante la creazione di un elenco in ordine di importanza delle pagine contenenti informazioni rilevanti per la ricerca. Pertanto, quando un utente digita la propria richiesta, il motore di ricerca esamina il suo indice e fornisce una lista delle pagine che meglio si accordano alle parole chiave cercate, fornendo spesso anche un breve saggio del contenuto e qualche informazione aggiuntiva. La gran parte dei motori di ricerca offre oggi anche una lista separata di siti sponsorizzati, ovvero pagine web commerciali che pagano direttamente o indirettamente il motore di ricerca per essere inseriti nel top ranking. Sebbene l’idea di realizzare motori in grado di fornire un elenco di contenuti relativi ad alcune parole chiave di ricerca risalga ai primordi dell’informatica, i primi tool a disposizione sul Web per un numero elevato di utenti compaiono solo nei primi anni Novanta. Uno dei primi fu Aliweb nel 1993, cui fecero seguito negli anni successivi WebCrawler, Infoseek, Lycos, Magelan, Excite, Altavista, Netscape e Yahoo!. Intorno al 2000 compare Google, che ha rivoluzionato il mondo dei motori di ricerca grazie al suo innovativo algoritmo iterativo chiamato PageRank.

Computer. Calcolo parallelo; Informatica teorica

CATEGORIE
TAG

Informatica teorica

Informatica

Altavista

Algoritmo

Italia