"FUNZIONAMENTO MOTORI DI RICERCA"

Breve guida alla comprensione dei motori di ricerca.

Definizione
Nel contesto del Web un motore di ricerca (search engine) è un software utilizzato per effettuare ricerche in database contenenti documenti (HTML, txt, pdf, rtf, doc, ed altri formati: immagini, audio, video, ecc.).

Importanza dei motori di ricerca
Nel Web non esiste un "elenco telefonico": a differenza degli altri mezzi mediatici, dove l'utente riceve in modo "passivo" le informazioni (es. radio, TV, ecc.), qui bisogna reperire in modo "attivo" le informazioni (accedendo a motori di ricerca, directory, pagine contenenti links, ecc.).
Questa funzione è svolta dalle pagine "links" dei siti web e dei portali, e, in larga parte, dai motori di ricerca: un buon posizionamento nei motori incrementa il numero dei visitatori.

Motori di ricerca e siti web
La crescita esponenziale dei siti presenti in rete e l'assenza di regole in materia di classificazione delle informazioni, rendono difficile l'accesso alle informazioni stesse: i primi 10/20 siti web in testa ai risultati generati dai motori di ricerca, in risposta alle richieste degli utenti, godono di visibilità massima in Internet (soprattutto su Google, Bing e Yahoo) e, quindi, di un buon incremento del numero dei visitatori.

Struttura di un motore di ricerca
Tipicamente un motore di ricerca è organizzato nei seguenti moduli:
   - database: in cui sono archiviati i dati relativi ai siti web
   - gatherer (raccoglitore): "visita" i siti per mezzo di un robot (spider) e invia al database le informazioni reperite nel sito (robots.txt, pagine, immagini, pdf, ecc.);
   - indexer (indicizzatore): analizza i dati presenti nel database ed assegna ad ogni singola pagina web un indice di "rilevanza" per determinate parole chiave;
   - search (ricerca): per mezzo di un'interfaccia web (ad es. un browser), permette agli utenti di Internet di formulare una richiesta (query) tramite parole chiave;
   - retrieval (recupero): raccoglie le risorse presenti nel database e restituisce al modulo search i risultati da visualizzare all'utente.

Tipologie
Tra i veri e propri motori di ricerca che utilizzano questo tipo di organizzazione figurano Google, Bing, Yahoo, Ask, Baidu, istella.
In alcuni motori di ricerca, definiti "directory" (categorie o cataloghi), ad es. Yahoo e Dmoz, sono dei redattori che si occupano di valutare i siti. La ricerca in questo tipo di motore avviene per "categoria" (internet, salute, ecc.). Spesso è a disposizione degli utenti anche un motore di ricerca, interno o esterno, Virgilio, Arianna e Tiscali, ad esempio, utilizzano Google.
Altri motori di ricerca detti metacrawler o metamotori (Dogpile.com, Mamma.com, Metacrawler.com, ecc.) restituiscono, in risposta alle query degli utenti, i risultati di altri motori di ricerca. Metacrawler.com, ad esempio, invia le query dell'utente a Google, Ask, ed altri, "organizza" i risultati, e visualizza le risposte all'utente.


Ricerca semantica
La ricerca Semantica sarà sicuramente uno dei prossimo obiettivi dei motori di ricerca.
Un motore di ricerca semantico, a differenza di uno"testuale", tenderà a "comprendere" la richiesta di un utente in relazione al "contesto" nel quale viene effettuata.