Vai alla home page ufficiale di 'Internet, manuale per l'uso della rete'

Indice Premessa
Introduzione La telematica
Come funziona Il collegamento
Come si naviga E-mail
Newsgroup FTP
Telnet Gopher
WWW Tempo reale
Nuove frontiere La ricerca
Risorse Il sociale
Mercato globale HTML
Glossario Bibliografia

...torna alla parte 1 Come si fa ricerca in Internet parte 2 di 2

15 Come si fa ricerca in Internet

  • Informazione ordinata e informazione disordinata
  • Dall'ordine al disordine, dal disordine all'ordine
  • Gli ipertesti come strumento per organizzare l'informazione
  • Strumenti di ricerca
  • La ricerca di indirizzi di e-mail
  • La ricerca di file
  • Archie
  • Archie a caratteri
  • L'interrogazione di un Archie server attraverso la posta elettronica
  • Un Archie client grafico: fpArchie
  • I sistemi di ricerca basati su Web
  • La ricerca nei newsgroup: i servizi newsfilter
  • La ricerca nello spazio dei gopher: Veronica
  • La ricerca su World Wide Web
  • I motori di ricerca per termini
  • HotBot
  • AltaVista
  • Altri motori di ricerca
  • Servizi di catalogazione sistematica delle risorse
  • Yahoo!
  • Altri servizi di catalogazione sistematica
  • Il futuro della ricerca: gli agenti

  • Un Archie client grafico: fpArchie

    Per illustrare l'uso di un Archie client grafico ricorriamo a un programma freeware (cioè totalmente gratuito) per Windows 95: fpArchie, della fpWare di Peter Tanis e Frank Fesevur. Possiamo trovarne la versione più recente sul sito Web http://www.fpware.demon.nl/.

    I principi generali di funzionamento di questa applicazione sono gli stessi di qualsiasi altro client Archie per qualsiasi computer (Macintosh, Amiga, ecc.): non dimentichiamo infatti che i client Archie non fanno altro che fornire un'interfaccia, grafica o a caratteri, tra noi e i database (gli Archie server) che contengono le informazioni.

    Figura 92 fpArchie, della fpWare di Peter Tanis e Frank Fesevur

    Per interrogare un Archie server attraverso fpArchie, dobbiamo selezionare con il mouse la finestra denominata 'Name & Location'. Nelle due caselle di testo che troviamo possiamo indicare nella prima il nome del programma cercato, nella seconda la sua collocazione (qualora si disponga già di questa informazione). Nella maggior parte dei casi, ovviamente, forniremo soltanto il nome, o parte del nome; in tal caso avremo a disposizione diverse opzioni. Potremo ad esempio indicare a fpArchie se il nome che forniamo è parziale o esattamente corrispondente. Questa seconda scelta renderà assai più efficiente la nostra ricerca; si cerchi perciò — dove possibile — di adottarla.

    La finestra di programma denominata 'Date Modified' ci permette, se lo desideriamo, di specificare l'arco temporale nel quale il programma è stato messo on-line (utile, ad esempio, per scremare eventuali vecchie versioni); la finestra 'Advanced' ci consente invece di restringere la ricerca in base alla dimensione del file e al testo contenuto nei nomi delle directory che lo contengono; 'Servers' infine ci consente di indicare l'indirizzo elettronico degli Archie server cui rivolgersi.

    Anche se in linea teorica tutti gli Archie server dovrebbero avere contenuto uguale, scopriamo empiricamente che non tutti sono ugualmente efficienti. Tra i più aggiornati c'è sicuramente l'Archie server finlandese, archie.funet.fi, che però è anche tra i più affollati.

    Per concludere, una interessante caratteristica di fpArchie è quella di poter prelevare subito i file individuati; il programma infatti contiene al suo interno un semplice ma funzionale client FTP. Il prelievo si effettua con un semplice click del tasto destro del mouse sul file desiderato e poi con un ulteriore click sull'opzione 'Retrieve'.

    Un click del tasto destro del mouse sul nome del file ci consente anche di evidenziare tutte le informazioni ad esso associate (dimensione, data e ora di immissione, attributi di protezione Unix, ecc.). Interessante notare infine che il look del programma si integra fortemente con quello di Windows 95 (ad esempio la finestra per il prelievo via FTP è identica a quella che Windows 95 visualizza quando si copia un file).

     
      I sistemi di ricerca basati su Web

    Diversamente da Archie, Shareware.com non è un programma, ma un sito Web, la cui URL è http://www.shareware.com. Si tratta di un database consultabile on-line, che consente di reperire e scaricare programmi disponibili in rete.

    Fortunatamente il suo uso, anche nelle funzioni più avanzate, è estremamente intuitivo. Una volta selezionata la voce 'Search' non si dovrà fare altro che indicare il sistema operativo utilizzato dal nostro computer e quindi le chiavi di ricerca utili a individuare il file che ci interessa. Possiamo specificare anche in base a quale criterio vogliamo vengano ordinati i file una volta individuati, e quanti ne vogliamo visualizzare.

    Una volta ottenuto l'elenco dei file che soddisfano la nostra ricerca, è possibile prelevare ciò che ci interessa con un semplice click del mouse direttamente attraverso il browser Web.

    Shareware.com, tra le altre cose, si preoccupa anche di fornirci una stima del tempo necessario per il prelievo, in funzione della velocità del nostro collegamento. È bene specificare che gli archivi di questo sistema si limitano ad indicizzare le collocazioni dei programmi disponibili sui maggiori server FTP per i vari sistemi operativi (come SimTel, Garbo, Cica, Sunsite dell'Università del Minnesota).

    In virtù della sua facilità d'uso e della sua immediatezza, è il sistema migliore per cercare un programma inserito nel grande circuito del pubblico dominio, ma ancora non può essere proposto come un reale e definitivo sostituto di Archie.

    Figura 93 www.shareware.com, per la ricerca di programmi

    Tra gli altri sistemi di ricerca file basati du Web, vale la pena citare Tucows (The Ultimate Collection of Winsock Software), una vasta collezione di programmi per Windows 95/NT, Windows 3.x e Macintosh destinati specificamente all'utilizzo della rete. Ogni programma memorizzato in Tucows dispone di una scheda nella quale sono indicate numerose informazioni: tra queste anche un 'voto', spesso utile per scegliere un programma quando ce ne sono molti con funzioni simili.

    Il beneficio principale offertto da Tucows non è tanto la semplificazione della ricerca dei programmi (c'è un motore di ricerca interno, ma è molto semplice), quanto piuttosto quella di accelerarne il prelievo. Tucows infatti dispone di numerosissimi 'mirror', ovvero duplicati, in numerose nazioni, che consentono di aggirare efficacemente le lentezze di Internet. Molti di questi mirror sono predisposti dagli stessi 'Internet provider'. Il sito principale di Tucows si trova all'indirizzo: http://www.tucows.com, dove sono anche elencati i mirror nazionali (solo in Italia ce ne sono più di una dozzina).

    La ricerca nei newsgroup: i servizi newsfilter

    I newsgroup Usenet sono una risorsa informativa potenzialmente preziosa, ma anche complessa e dispersiva come poche. In che modo orientarsi, ricercare e reperire l'informazione che ci interessa senza essere costretti a seguire decine di gruppi diversi, e a leggere centinaia di messaggi irrilevanti?

    Fortunatamente, negli ultimi anni sono sorti alcuni servizi in grado di aiutare in questo non facile compito.

    Innanzitutto, molti fra i motori di ricerca dei quali parleremo più estesamente in seguito — e in particolare HotBot (raggiungibile all'indirizzo http://www.hotbot.com), AltaVista (raggiungibile all'indirizzo http://www.altavista.digital.com), Infoseek (raggiungibile all'indirizzo http://www.infoseek.com/) ed Excite! (raggiungibile all'indirizzo http://www.excite.com/) — consentono di effettuare ricerche specifiche nei messaggi recenti di molti fra i principali newsgroup. Per farlo, occorrerà selezionare la voce 'Usenet', 'Usenet News' o 'Usenet Newsgroup' nel menu a tendina dell'opzione 'Search' nel caso rispettivamente di AltaVista, HotBot e Infoseek, e selezionare il pulsante 'Usenet' nella pagina di ricerca nel caso di Excite!. Dato che i newsgroup controllati da questi motori di ricerca e l'aggiornamento delle basi dati possono essere parzialmente diversi, conviene effettuare una ricerca su tutti e tre.

    Un motore di ricerca 'specializzato' in newsgroup è invece quello offerto da DejaNews, all'indirizzo http://www.dejanews.com/. Fra le caratteristiche interessanti di Deja News c'è la possibilità, una volta individuato un messaggio Usenet che ci interessa, di visualizzare un 'profilo' del suo autore, che comprenda un elenco degli altri messaggi da lui inviati a gruppi Usenet. Le numerose altre opzioni specifiche alla ricerca su newsgroup fanno di DejaNews lo strumento forse più avanzato in questo campo.

    A contendergli il primato esiste però un altro, potentissimo servizio: quello offerto da Reference.com, alla URL http://www.reference.com. Si tratta di un servizio che ha due aspetti veramente notevoli: da un lato, l'archivio indicizzato è composto non solo da newsgroup Usenet, ma anche da diverse migliaia di mailing list, scelte fra le più significative, e da un certo numero di forum Web, un sistema di discussione attraverso pagine Web dedicate che per la sua comodità sta conoscendo una grande diffusione. Dall'altro, è possibile impostare ricerche 'attive' ('active queries'), che vengono ripetute per noi a intervalli regolari. I risultati della ricerca ci verranno inviati automaticamente e periodicamente per posta elettronica. In sostanza, si tratta di un servizio che permette un vero e proprio 'monitoraggio' di una sezione rilevante dell'informazione che viaggia su Internet, una sorta di 'eco della stampa' gratuito e altamente configurabile.

    Un servizio in parte analogo è offerto dal dipartimento di Computer Science dell'Università di Stanford. Si chiama Stanford Netnews Filtering Service (SNFS), e si basa sull'uso della posta elettronica: fornendo le 'parole chiave' che ci interessano è possibile ricevere periodicamente e direttamente, via e-mail, i messaggi Usenet nei quali tali parole compaiono. La ricerca può essere effettuata attraverso operatori booleani, o attraverso un sistema 'statistico' che valuta se, relativamente all'elenco di parole chiave che avete fornito, il messaggio supera o no una determinata soglia di interesse.

    Istruzioni complete sull'uso del Net News Filter si possono ricevere inviando dal vostro account una mail senza oggetto, e contenente nel corpo del messaggio solo la parola help (niente firma o indirizzi), all'indirizzo netnews@db.stanford.edu, oppure dando un'occhiata alla pagina WWW http://woodstock.stanford.edu:2000/. Ah, già che ci siamo: attraverso la URL http://elib.stanford.edu si accede a un servizio simile che 'copre' le informazioni tecniche nell'ambito dell'informatica che circolano su Internet, non solo nei newsgroup.

    Sia nel caso di Reference.com, sia nel caso del SNFS, dato che la ricerca avviene su un numero sterminato di newsgroup, occorre essere molto specifici nel fornire la (o le) parole chiave che interessano, per evitare di essere sommersi dai messaggi.

    I lettori di Internet '96 ricorderanno forse che avevamo segnalato come potenzialmente interessante il servizio Newsweeder, che si proponeva di usare intelligenza artificiale e reti neurali per aiutarci nella selezione e nel filtraggio delle informazioni, con particolare riferimento al mondo Usenet. Ebbene, Newsweeder si è evoluto, ed è diventato WiseWire: un servizio (per ora gratuito) che ha l'interessante caratteristica di... imparare col tempo i nostri gusti. Il meccanismo è basato su una scelta iniziale fra un certo numero di U-Zines (si legge, ovviamente, 'You-zines'), selezioni di materiale informativo tratto dalla rete e riguardante una larga varietà di settori. Supponiamo, per cominciare, di scegliere una U-Zine relativa alla pittura occidentale. Inizialmente, ci saranno proposti articoli che riguardano un po' tutta l'area tematica. Leggendoli possiamo, con un semplice click del mouse su una barra di gradimento, segnalare a WiseWire quali articoli ci hanno interessato di più, e quali di meno. Le nostre scelte serviranno a stabilire quali articoli ci saranno sottoposti la volta successiva; col tempo, secondo gli ideatori del programma, riceveremo una U-Zine assolutamente personalizzata, 'tagliata' esattamente per rispondere ai nostri interessi più specifici. Se volete mettere alla prova queste promesse, la URL è http://www.wisewire.com.

    Per finire, un paio di 'meta-indirizzi' utili per tenersi aggiornati sui programmi e sui motori di ricerca e di filtraggio esistenti per il mondo Usenet: http://www.ee.umd.edu/medlab/filter/ e http://www.yahoo.com/text/News/Usenet/Searching_and_Filtering/.

    La ricerca nello spazio dei gopher: Veronica

    Il gopher, come abbiamo visto nel prima parte del manuale, è stato in passato uno strumento molto utile per cercare informazioni e risorse su Internet. Malgrado l'affermazione di World Wide Web ne abbia progressivamente diminuito l'importanza, tra le voci dei menu gopher (gopherspace) è ancora oggi possibile reperire molte informazioni, specialmente di tipo accademico.

    Tuttavia, visto l'elevato numero di gopher server esistenti, riuscire a trovare qualcosa di interessante può richiedere passeggiate lunghissime tra i 'tunnel' scavati dal nostro animaletto digitale. Per facilitare la ricerca di informazioni nel gopherspace ci viene in aiuto una tecnologia sviluppata da due ricercatori della Nevada University, Steven Foster e Fred Barrie: Veronica.

    Con questo fascinoso appellativo viene indicato un potente sistema di ricerca in grado di interrogare i menu di tutti gopher server, in base a parole chiave fornite dall'utente. Se Veronica trova al loro interno una qualsiasi voce che contiene la parola specificata, ne annota le specifiche e l'indirizzo. Quando la ricerca è terminata, invia al client – cioè a noi — un menu (del tutto uguale ai normali menu di un gopher) che contiene come voci tutti i riferimenti trovati.

    Naturalmente anche in questo caso la ricerca viene effettuata in un database che viene aggiornato periodicamente (ogni una o due settimane), attraverso visite ai vari gopher. Veronica insomma rappresenta, per i server gopher, l'equivalente di Archie per i server FTP, ma ha il vantaggio di poter fare ricerche non su inespressivi nomi di file, ma su voci di menu, assai più descrittive.

    Veronica è strettamente integrata con gopher, e si utilizza attraverso un normale client gopher. Quasi tutti i gopher server contengono una voce dedicata all'accesso ai server Veronica, che si intitola normalmente 'Search Gopher Space using Veronica'.

    Selezionando questa voce, appare un menu che ci consente di scegliere quale server Veronica utilizzare per la ricerca, oppure di farlo scegliere al client in maniera automatica. I gopher server che ospitano anche i servizi di ricerca Veronica non sono molti. Dal punto di vista del contenuto la scelta circa il server da utilizzare non è fondamentale, poiché per il novantacinque per cento i database coincidono. Alcuni server possono essere più aggiornati per i materiali 'più vicini', ma lo scarto è veramente minimo. È dunque opportuno scegliere il server in base alla distanza ed agli orari (non è raro infatti trovare i server Veronica tanto affollati da rifiutare la connessione).

    È possibile effettuare due tipi di ricerca: si può limitare la ricerca alle sole voci che corrispondono a menu, con l'opzione 'Find gopher directories by Title Word(s)'; oppure si possono ricercare i riferimenti alle parole chiavi desiderate in tutte le voci (anche quelle 'terminali', le 'foglie' dell'albero dei gopher): 'Search GopherSpace by Title word(s)'. In ogni caso occorre ricordare che la ricerca non può essere effettuata all'interno dei singoli documenti, che rimangono inaccessibili al gopher.

    Una volta selezionato il server, appare una schermata che chiede di inserire le parole chiave in base alle quali effettuare la ricerca. La sintassi per effettuare ricerche è molto semplice: basta inserire la parola chiave nell'apposita finestra; ricordate, nel farlo, che Veronica non distingue fra maiuscole e minuscole.

    La scelta della parola chiave è molto importante nella ricerca con Veronica. Non dobbiamo infatti dimenticare che i menu gopher sono costruiti da operatori umani senza seguire alcuno standard di catalogazione, e questo impone a chi effettua ricerche una certa immaginazione e la capacità di prevedere il maggior numero possibile di intestazioni sotto le quali possono essere catalogate le informazioni desiderate.

    Il server, una volta terminata la ricerca, ce ne mostra i risultati attraverso un normale menu gopher. Molto spesso una semplice ricerca produce un output molto esteso, pieno di voci spurie e di ripetizioni. Veronica permette di raffinare notevolmente la ricerca, attraverso una sintassi molto semplice. In primo luogo si possono utilizzare anche più parole chiave, concatenandole attraverso gli operatori logici AND, OR e NOT. Se si immettono due parole chiave senza specificare un operatore, il server assume che si voglia usare l'operatore AND. Se necessario, possiamo costruire espressioni complesse utilizzando parentesi tonde.

    È anche possibile specificare che tipo di risorsa stiamo cercando. Ogni tipo è associato ad un numero; i più utili sono i seguenti:

    • 1 per i file
    • 2 per i menu
    • 8 per una sessione telnet
    • 9 per i file binari

    Per indicare il tipo di file in una ricerca Veronica occorre aggiungere alla parola chiave il modificatore '-t' seguito dal numero.

    Chiudiamo questo paragrafo sulla ricerca di informazioni attraverso i gopher con un cenno ad un altro strumento: Jughead. Al contrario dei server Veronica, che consentono di effettuare ricerche in tutto il gopherspace, i server Jughead sono motori di ricerca locali: essi permettono di effettuare ricerche sulle voci di un singolo gopher. In questo modo si può evitare di esplorarne tutto l'albero. Per il resto esso funziona esattamente come Veronica. I gopher server che sono dotati di questo servizio vi dedicano generalmente una voce del menu principale. Non farete fatica a trovarla: il titolo è normalmente "Search gopher titles at the University of ... ".

     
     

    La ricerca su World Wide Web

    World Wide Web è la risorsa Internet probabilmente più nota, e i suoi ritmi di espansione sono esponenziali. Le pagine informative immesse in rete riguardano gli argomenti più vari, e provengono da fornitori di informazione di natura assai eterogenea: dalle università alle industrie private (grandi e piccole), dai centri di ricerca ai negozi, dalle imprese editoriali ai partiti politici. Vi sono poi le numerosissime 'home page' personali del popolo di Internet.

    Chi svolge una ricerca in rete si trova dunque davanti un duplice problema: reperire l'informazione cercata e valutare la sua correttezza, completezza, imparzialità.

    Il secondo compito, assai delicato, dipende in parte dall'esperienza; un consiglio generale — una volta trovata una pagina informativa che reputiamo interessante — è quello di risalire sempre alla home page del sito che la ospita (su molte pagine sono disponibili apposite icone attive — altrimenti si può provare ad 'accorciare' progressivamente l'indirizzo nella barra delle URL, salendo di livello in livello nella struttura gerarchica del sito). In questo modo potremo in genere reperire informazioni su chi ha immesso in rete quella particolare pagina, in quale contesto e a quali fini.

    Quanto al primo problema — quello di 'scoprire' le pagine esistenti che si occupano di un determinato argomento — una buona partenza è in genere rappresentata dai motori di ricerca disponibili in rete. Vi sono due tipi di risorse che è bene conoscere: i motori di ricerca per termini e gli indici sistematici.

    I motori di ricerca per termini permettono di ricercare parole o combinazioni di parole. Se vogliamo ad esempio cercare le pagine che si occupano di Lewis Carroll (pseudonimo del reverendo Dodgson, l'autore di Alice nel paese delle meraviglie), potremo fornire al motore di ricerca le due parole 'Lewis' e 'Carroll'. In molti casi è possibile combinare le parole fornite utilizzando i cosiddetti operatori booleani: ad esempio, una ricerca con chiave 'Lewis AND Carroll' potrebbe fornirci le pagine in cui compaiono tutti e due i nomi, aiutandoci a scremare via pagine che non ci interessano. Attenzione, però, perché la sintassi corretta per utilizzare operatori come AND, OR, NOT varia da sito a sito.

    La ricerca attraverso un indice per termini è molto comoda nel caso di nomi propri, o nel caso in cui le informazioni che vogliamo trovare si lascino caratterizzare attraverso termini molto specifici. Occorre tuttavia tenere presente che si tratta di una ricerca meccanica: il programma utilizzato non farà altro che cercare i termini da noi forniti all'interno di un immenso indice alfabetico in suo possesso — indice tenuto aggiornato da un 'demone' software che si muove continuamente lungo la rete, seguendo ogni link incontrato e indicizzando tutte le pagine percorse — e fornirci le corrispondenze trovate. L'intelligenza della ricerca dipende dunque in gran parte dalla scelta delle parole usate come parametri, anche se quasi tutti i motori di ricerca hanno la capacità di 'pesare' i risultati in base a elementi quali il numero di occorrenze della parola, l'occorrenza in zone significative del documento come i titoli o i link, e così via. Ciò significa che se abbiamo scelto bene i nostri termini di ricerca, riceveremo un elenco di pagine che avrà alte possibilità di iniziare da quelle per noi più significative. Ma se ad esempio avremo effettuato una ricerca con chiave 'Lewis Carroll', non troveremo mai le pagine nelle quali compare solo il nome di Dodgson.

    Al contrario della ricerca alfabetica, la ricerca sistematica avviene su cataloghi ragionati di risorse: in genere la base dati è più ristretta (non saremo sicuri di trovare direttamente tutte, o anche solo la maggioranza delle pagine che ci interessano), ma la valutazione della pertinenza o meno di una determinata informazione non sarà più meccanica, ma risultato di una decisione umana.

    Naturalmente, in questi casi i principi utilizzati per costruire l'impianto sistematico della banca dati sono fondamentali. Un catalogo ragionato di questo tipo si basa infatti su una sorta di 'albero delle scienze', da percorrere partendo da categorizzazioni più generali per arrivare via via a categorizzazioni più specifiche. Ed è importante che questo percorso di 'discesa al particolare' avvenga attraverso percorsi intuitivi e coerenti — compito naturalmente tutt'altro che facile.

    L'esame dettagliato di alcune fra le risorse disponibili per la ricerca su World Wide Web ci aiuterà a comprendere meglio questi problemi. Sottolineiamo però fin d'ora l'importanza di un terzo tipo di ricerca, del quale è assai più difficile fornire un inquadramento generale: la navigazione libera attraverso pagine di segnalazioni di risorse specifiche. È infatti quasi una norma di 'netiquette' che chi rende disponibili informazioni su un determinato argomento, fornisca anche una lista di link alle principali altre risorse esistenti in rete al riguardo. Questo tipo di liste ragionate va naturalmente esso stesso cercato e trovato, cosa che in genere viene fatta usando indici alfabetici o cataloghi sistematici di risorse secondo le modalità sopra delineate. Una volta però che abbiamo individuato una di queste pagine-miniera di link specifici, potrà essere produttivo proseguire la nostra ricerca attraverso di essa. Le risorse in tal modo segnalate presentano infatti due importanti caratteristiche: sono state scelte in maniera esplicita e ragionata, e la scelta è presumibilmente opera di una persona che conosce bene il settore in questione. Abbiamo trovato comodo caratterizzare con l'espressione navigazione orizzontale questa terza modalità di ricerca su Web.

    I motori di ricerca per termini

    Consideriamo innanzitutto un po' più da vicino i motori di ricerca appartenenti alla prima delle categorie sopra considerate: la ricerca per termini.

    Come si è detto, in questi casi la ricerca avviene indicando una parola, o una combinazione di parole, che consideriamo ragionevolmente associata al tipo di informazione che vogliamo reperire. Questo evidentemente può avvenire solo se abbiamo un'idea sufficientemente chiara di quello che stiamo cercando, e se l'ambito della nostra ricerca può essere associato in maniera abbastanza immediata ad un termine, o ad un piccolo insieme di termini.

    Il caso tipico è quello in cui la nostra ricerca riguarda una persona. Scegliamo come esempio una ricerca di informazioni sulla scrittrice Jane Austen, e vediamo come condurla utilizzando quelli che sono al momento forse i due principali motori di ricerca per termini disponibili su Internet: HotBot e AltaVista.

    HotBot

    HotBot (http://www.hotbot.com) è nato nel 1996 per iniziativa di HotWired (http://www.hotwired.com), la controparte in rete della rivista Wired e, come la sorella su carta, sito 'di culto' per molti fra i nuovi profeti del digitale.

    Nuovo ingresso nella ormai lunga lista dei motori di ricerca per termini (al momento di scrivere Internet '96 HotBot non esisteva ancora, ma ne segnalammo la nascita e le notevoli caratteristiche in uno dei primi aggiornamenti in rete del manuale), HotBot si segnala sia per numero di pagine indicizzate (quasi 60 milioni, si tratta al momento della più vasta base dati di pagine Web indicizzata da un singolo motore di ricerca) sia per la potenza delle opzioni messe a disposizione dell'utente, attraverso una interfaccia coloratissima e divertente.

    Le ricerche possono svolgersi sia su Web che su un archivio di newsgroup Usenet, e le varie opzioni sono tutte disponibili attraverso menu a tendina. Possiamo così decidere se svolgere una ricerca in AND (opzione 'all the words'), in OR (opzione 'any of the words'), una ricerca su nomi (opzione 'the person': viene cercata sia la stringa "Nome Cognome" che quella "Cognome Nome"). Ricerche ancor più avanzate possono essere effettuate attraverso l'opzione 'modify', che permette di combinare fra loro ricerche con operatori differenti. Il modulo di ricerca avanzata permette inoltre di selezionare il tipo di documento (inclusi documenti non HTML come quelli scritti in Adobe Acrobat, e addirittura immagini, mondi VRML, applet Java), la sua provenienza geografica o 'ciberspaziale' (determinata attraverso il dominio del server che lo ospita), le date estreme tra le quali effettuare la ricerca. È anche possibile salvare come default la particolare configurazione di ricerca che utilizziamo più frequentemente (ad esempio: ricerca su nomi di persone, presentando 25 risultati alla volta, con descrizioni brevi...). Insomma, come avrete capito, al momento HotBot ha davvero pochi rivali; volendo trovare il pelo nell'uovo, va detto però che il sito è talvolta più lento di quello Digital che ospita Altavista, e che l'aggiornamento degli indici, all'inizio davvero rapido, sembra procedere negli ultimi mesi con qualche ritardo (nonostante HotBot dichiari una media di 10 milioni di pagine visitate al giorno, che dovrebbe portarlo ad aggiornare tutto il proprio indice in meno di una settimana).

    Figura 94 HotBot, il più ricco motore di ricerca per termini

    A inizio marzo 1997, una ricerca con chiave 'Jane Austen' condotta su HotBot portava a 10.451 pagine: fra le altre, pagine dedicate alla scrittrice da università, da appassionati, da librai e case editrici; versioni ipertestuali e testuali di molte fra le sue opere; programmi di corsi universitari dedicati a Jane Austen; bibliografie; articoli accademici che studiano i più disparati aspetti della sua letteratura, e addirittura... barzellette ispirate a Jane Austen. Per avere un'idea della mole del materiale disponibile, potete dare un'occhiata alla URL http://uts.cc.utexas.edu/~churchh/janeinfo.html. Per confrontare i risultati con quelli relativi ad alcuni autori italiani, nella stessa data una ricerca con chiave 'Eugenio Montale' portava a 481 pagine, e una ricerca con chiave 'Umberto Eco' a 4973 (questi dati naturalmente sollecitano alcune riflessioni sui meccanismi della 'fama su Web').

    AltaVista

    AltaVista è il risultato di un progetto di ricerca iniziato nell'estate del 1995 nei laboratori di Palo Alto della Digital, una delle principali aziende informatiche mondiali. L'indirizzo al quale raggiungerlo è http://www.altavista.digital.com (o anche solo http://altavista.digital.com).

    A inizio marzo 1997, Altavista dichiara di indicizzare circa 31 milioni di pagine; il dato numerico è inferiore a quello di HotBot, ma la cifra è comunque impressionante — così come lo sono le statistiche fornite per gli accessi, con 28 milioni di ricerche effettuate ogni giorno. Un dato per la verità quasi eccessivo, dato che, nonostante le dispute sul numero reale degli utenti di Internet, sembra difficile sostenere che il numero di 'naviganti' in ogni singola giornata possa superare di molto tale cifra. È chiaro comunque che, per molti internauti, il passaggio da Altavista è una tappa quasi obbligata di ogni navigazione.

    Le ricerche attraverso AltaVista sono possibili in due distinte modalità: come 'simple query' e come 'advanced query'. La 'simple query' mette a disposizione un modulo come quello qui sotto (in verità, un po' deturpato dalla onnipresente pubblicità):

    Figura 95 Il motore di ricerca AltaVista (simple query)

    Occupandoci delle ricerche su newsgroup, abbiamo già considerato la prima delle caselle: l'opzione standard è 'Search the Web', ma il menu a tendina ci permette di scegliere anche l'opzione 'Search Usenet'. La seconda casella permette di scegliere la forma in cui vogliamo ci siano presentati i risultati della ricerca. 'Detailed form' produrrà una lista di siti contenente i titoli delle pagine reperite, accompagnati dalle prime due righe di testo, da una indicazione sulla dimensione in Kbyte della pagina, e dalla data dell'ultima indicizzazione da parte del motore di ricerca. 'Compact form' produrrà invece un elenco più scarno, in forma tabellare. La 'standard form' preimpostata al momento di accedere al sito è simile alla 'detailed form'.

    Nella casella principale andranno inseriti il termine o i termini cercati. Nel nostro esempio, li abbiamo racchiusi fra virgolette, per indicare al motore di ricerca di considerarli come un termine unico: troveremo solo le pagine in cui compare l'espressione 'Jane Austen', e non quelle in cui compare solo il termine 'Jane', o solo il termine 'Austen', o quelle in cui i due termini compaiono lontani. Se non avessimo usato le virgolette, avremmo incluso nella ricerca anche questi casi — ma AltaVista ci avrebbe comunque fornito per prime le pagine in cui i due termini comparivano insieme, possibilmente nel titolo.

    Il bottone 'Submit' (o il tasto 'Invio' della tastiera) serve ad eseguire la ricerca impostata.

    Il fatto di utilizzare la 'simple query' non deve ingannare: è possibile compiere ricerche molto raffinate, usando fra gli altri gli operatori '+' (va premesso ai termini che vogliamo necessariamente presenti nella pagina), '-' (va premesso ai termini la cui occorrenza vogliamo escludere), '*' (che funziona come 'wild card': il termine 'astronom*' corrisponderà sia ad 'astronomy' che ad 'astronomia', o 'astronomical'). È possibile anche limitare la ricerca a specifiche aree dei documenti: ad esempio inserendo come termine da ricercare 'title:"Jane Austen"' avremmo trovato solo le pagine il cui titolo contiene l'espressione 'Jane Austen'.

    Per avere una descrizione dettagliata della sintassi ammissibile in una 'simple query' basterà fare click sull'icona 'Help' presente in apertura della pagina.

    Nel momento in cui scriviamo, una simple query con valore 'Jane Austen' porta a un elenco di circa cinquemila pagine informative (oltre mille in più del risultato che la stessa ricerca aveva dato nel marzo 1996, ma circa la metà di quelle cui ci aveva condotto HotBot)

    La 'Advanced query' mette a disposizione una finestra di dialogo più complessa, e gli operatori booleani standard.

    Nella casella 'Selection criteria' si può continuare a usare "Jane Austen", ma gli operatori '+' e '-' non funzioneranno più; possiamo invece raffinare la ricerca con operatori booleani (se vogliamo eliminare tutte le pagine che parlano di Orgoglio e Pregiudizio potremo scrivere ad esempio '"Jane Austen" NOT Pride'). Per consentire la costruzione di espressioni di ricerca complesse, è possibile anche utilizzare parentesi. Attraverso la casella 'Results Ranking Criteria' possiamo influenzare l'ordine in cui visualizzare le pagine trovate (se 'Pride' lo scriviamo qui, le pagine che trattano di Orgoglio e pregiudizio saranno visualizzate per prime); possiamo anche eliminare le pagine 'poco aggiornate' (nel caso di una ricerca su Jane Austen, questa possibilità non ha probabilmente un gran senso), utilizzando le caselle nelle quali impostare la data iniziale e la data finale di creazione per le pagine cercate.

    Per avere un'idea un po' più precisa delle capacità di Altavista, e riprendendo gli esempi fatti in precedenza, notiamo che una ricerca con chiave 'Eugenio Montale' porta nel marzo 1997 a circa 200 pagine, e una ricerca con chiave 'Umberto Eco' a circa 2000: anche in questi casi, circa la metà di quelle raggiunte da HotBot.

    Altri motori di ricerca

    Progressivamente, diversi altri motori di ricerca basati su (tentativi di) indicizzazione globale di World Wide Web si stanno avvicinando alla copertura offerta da HotBot e Altavista, tanto che, se il primato generale spetta al momento senz'altro a HotBot, la lotta per il secondo posto è più aperta che mai. Va detto inoltre che strumenti diversi offrono modalità di ricerca diverse, e non è detto che il motore più adatto per una determinata ricerca sia necessariamente il più esteso in termini di pagine indicizzate. Ricordiamo fra gli altri:

    • Lycos (http://www.lycos.com) il capostipite, nato come progetto sperimentale presso la Carnegie Mellon University sotto la direzione di Michael Mauldin e trasformatosi nel giugno 1995 in una vera e propria impresa, la Lycos Inc. Fra gli aspetti interessanti di Lycos, l'indicizzazione separata del 'Top 5% of the Web', che nelle intenzioni dovrebbe portare solo a pagine di alto interesse grafico e contenutistico (ma ovviamente ogni classificazione di questo tipo è assai opinabile).
    • Infoseek (http://guide.infoseek.com/) Come avevamo previsto in Internet '96, Infoseek ha fortunatamente rinunciato alla scelta (anacronistica nel momento in cui esistono motori di ricerca gratuiti con una base di dati indicizzata più ricca) di far pagare le ricerche dopo la visualizzazione dei primi 100 risultati, ed è quindi ormai anch'esso gratuito (anche se — come per gli altri motori di ricerca — la pubblicità ampiamente presente sulle sue pagine non lascia dubbi sul carattere commerciale dell'iniziativa). Negli ultimi mesi Infoseek è molto cresciuto, e ha integrato al motore di ricerca per termini un catalogo sistematico piuttosto bene organizzato. Si proclama 'the largest directory of the Web', ma non fornisce dati per suffragare questa affermazione. I nostri test hanno dato sostanzialmente gli stessi risultati ottenuti nel caso di Altavista: un po' più di 5.000 pagine su Jane Austen, 180 su Eugenio Montale, circa 2.200 su Umberto Eco. Merita una citazione la capacità di Infoseek di individuare anche argomenti correlati ('related topics') a quelli sui quali avete svolto la ricerca. Così, ad esempio, una ricerca con chiave Isaac Asimov fornirà come argomenti correlati 'fantascienza' e 'autori di libri'; si tratta di una potenzialità interessante, ma sulla quale per ora è bene non fare troppo affidamento: nel caso di Eugenio Montale, ad esempio, come argomenti correlati abbiamo ottenuto la corretta indicazione 'autori di libri', assieme a quella, più discutibile (o rivelatrice?) di 'humor e divertimento'.
    • Excite! (http://www.excite.com/) Un altro motore di ricerca che ha conosciuto negli ultimi mesi un notevole sviluppo, tanto che, secondo la società che lo gestisce, Excite ha già superato Altavista per numero di pagine indicizzate. Una pretesa che sembra confermata dalla nostra ricerca-test: oltre 6.500 pagine su Jane Austen, 274 su Montale, circa 2.600 su Umberto Eco. La ricerca è assai semplice, e può avvenire fornendo le nostre interrogazioni in linguaggio naturale (inglese, naturalmente). Buona la sintassi della ricerca avanzata, con la possibilità di combinare fra loro in maniera flessibile gli operatori booleani, usando anche le parentesi. Il programma interpreta come nome proprio la combinazione di due nomi con iniziali maiuscole, svolgendo in tal caso la corretta ricerca di prossimità.
    • Open Text (http://index.opentext.net). Open Text accetta una sintassi di ricerca piuttosto evoluta; in questo caso, tuttavia, la base delle pagine indicizzate è veramente piuttosto limitata.
    • WebCrawler (http://www.webcrawler.com), un altro motore di ricerca 'storico', con una sintassi non proprio intuitiva ma piuttosto potente, e una base di pagine indicizzate lontana dagli standard di HotBot, Altavista, Excite e Infoseek. È accompagnato da un catalogo sistematico di risorse. Funziona di default in OR, ed accetta operatori booleani e di prossimità.
    • World Wide Web Worm (http://wwww.cs.colorado.edu/home/mcbryan/WWWW.html), anche lui fra i precursori, anche lui ormai decisamente superato. L'home page riporta il riconoscimento di 'miglior strumento di ricerca del 1994', una data che per il Web è ormai quasi archeologia.

    Col moltiplicarsi dei motori di ricerca, acquistano importanza altri due tipi di risorse che può essere utile ricordare in conclusione: i cosiddetti strumenti di 'metaricerca', e gli indici di indici.

    Le 'metaricerche' consistono, in sostanza, nell'inviare in maniera sequenziale o contemporaneamente a più motori di ricerca il termine o i termini che ci interessano. L'invio sequenziale è analogo alla consultazione successiva di più motori di ricerca: è comodo poterlo fare da un'unica pagina, ma non vi è alcun 'valore aggiunto' fornito da uno strumento di questo tipo. Provate comunque, fra i servizi che rientrano in questa categoria, EZ-Find (http://www.theriver.com/TheRiver/Explore/ezfind.html), Find-It (http://www.cam.org/~psarena/find-it.html), Starting Point (http://www.stpt.com/), IntelliScope (http://wizard.inso.com).

    Decisamente più appetibile è invece la possibilità di consultare contemporaneamente più motori di ricerca, in modo da ottenere un'unica lista di risposte. Ai due servizi di questo tipo che avevamo segnalato in Internet '96 se ne sono nel frattempo aggiunti diversi altri. Savvy Search (http://guaraldi.cs.colostate.edu:2000/form) e Meta Crawler (http://www.metacrawler.com) restano comunque fra i più completi. Savvy Search — che dispone anche di una interfaccia in italiano — permette di scegliere se integrare o no i risultati eliminando le ripetizioni, ma a prezzo di un sostanziale ritardo nella visualizzazione dei risultati; inoltre è spesso sovraffollato (nel qual caso rifiuta di svolgere la ricerca richiesta), e la lista di risultati ottenuta non sembra seguire alcun ordine di rilevanza. Meta Crawler è moderatamente più efficiente: anch'esso richiede una certa attesa per la visualizzazione dei risultati, ma la lista che si ottiene è priva di duplicati e informativa. Anche in questo caso, tuttavia, l'ordine di visualizzazione non è sempre quello che ci si aspetterebbe.

     
      Un altro discreto motore di ricerca parallelo è Highway 61 (http://www.highway61.com), che ha come logo un armadillo che attraversa la strada, e si segnala senz'altro per l'opzione più originale: fra i parametri che dovete impostare, infatti, è anche la vostra personale risposta alla domanda "riuscirà l'armadillo ad attraversare la strada senza essere investito?"; inoltre, potete impostare i tempi di attesa scegliendo in una rosa che va da "non perdete tempo, fannulloni!" a "fate con calma, sto andando in bagno". Peccato che, nel momento in cui scriviamo, tra i motori di ricerca utilizzati manchi all'appello HotBot.

    Altri motori 'paralleli' di ricerca sono The Internet Sleuth (http://www.isleuth.com/), che l'anno scorso era solo sequenziale, e che adesso permette di interrogare fino a sei motori di ricerca contemporaneamente, scelti fra un elenco di dieci; Superseek (http://www.mcp.com/superseek/), ovvero il trionfo dei frame, che mostra i risultati della ricerca in tante sottofinestre quanti sono i motori interrogati (per le ricerche su World Wide Web quattro, e al momento in cui scriviamo mancano sia HotBot sia Altavista); ProFusion (http://www.designlab.ukans.edu/profusion/), che permette di scegliere fra sei motori di ricerca, HotBot per ora escluso; All4One (http://www.all4one.com), che interroga solo Altavista, Lycos, WebCrawler e Yahoo!.

    Naturalmente, metaricerche di questo tipo impediscono di utilizzare fino in fondo i linguaggi propri dei diversi motori di ricerca — e si tratta di un limite spesso notevole. L'integrazione fra motori di ricerca diversi è comunque senza dubbio una delle strade da esplorare per cercare di organizzare l'informazione disponibile attraverso World Wide Web, ed è probabile che in futuro gli strumenti di metaricerca acquisteranno una rilevanza e una flessibilità maggiore di quella attualmente possibile.

    L'ultima osservazione riguarda gli indici di indici, che permettono di 'tenersi aggiornati' sui motori di ricerca esistenti: un esempio davvero impressionante è All-in-one (http://www.albany.net/allinone/), che contiene una vera e propria banca dati ricchissima di indici di tutti i tipi, interrogabili direttamente; si tratta dunque anche di uno strumento di metaricerca sequenziale. Un'altra risorsa di questo tipo è Virtual Reference Desk (http://www.refdesk.com/newsrch.html), che unisce ben 256 motori di ricerca in aree anche estremamente specifiche (dalla ricerca di impiego alle previsioni metereologiche).

    Un buon punto di partenza per esplorare altri motori di ricerca e di metaricerca in rete è disponibile su Yahoo! alla URL http://www.yahoo.com/Computers_and_Internet/Internet/
    World_Wide_Web/Searching_the_Web/.

    Servizi di catalogazione sistematica delle risorse

    Accanto ai motori di ricerca che consentono ricerche per termini, abbiamo già accennato all'esistenza di cataloghi sistematici e ragionati di risorse. Il modello adottato è quello dell'arbor scientiae di derivazione medievale e rinascimentale, anche se naturalmente in questo caso fra i 'rami' principali dell'albero compaiono discipline come l'informatica e la telematica.

    In una risorsa di questo tipo, elemento fondamentale è la scelta delle suddivisioni interne delle varie discipline: ad esempio, le informazioni relative alla musica delle popolazioni primitive andranno catalogate sotto la voce 'antropologia' (presumibilmente una sottovoce del settore 'scienze umane') o sotto la voce 'musica'?

    Per fortuna la struttura ipertestuale di World Wide Web permette di superare problemi di questo tipo, che avevano angustiato generazioni e generazioni di enciclopedisti 'lineari'. Nulla impedisce, infatti, di classificare una stessa sottocategoria sotto più categorie diverse (ed eventualmente a 'livelli' diversi dell'albero). Non vi sarà alcun bisogno, per farlo, di duplicare l'informazione: basterà duplicare i link. Visto da un punto di vista lievemente più tecnico, questo significa che gli indici sistematici di risorse sono strutturalmente più simili a grafi che ad alberi: ad uno stesso nodo si può arrivare attraverso percorsi alternativi, tutti egualmente validi. Dal punto di vista dell'utente, invece, ciò comporta semplicemente che — a meno di non andarla a cercare sotto categorie palesemente innaturali — trovare una determinata risorsa informativa sarà assai facile: se ben compilato, l'indice sembrerà 'adattarsi' alle nostre scelte di categorizzazione.

    Yahoo!

    Yahoo! sta agli indici sistematici di risorse un po' come HotBot e AltaVista messi insieme stanno ai motori di ricerca per termini: si tratta indubbiamente dello standard, alla luce del quale vengono valutati tutti gli altri tentativi.

    Yahoo! è nato nell'aprile 1994, quando David Filo e Jerry Yang, studenti di ingegneria elettronica all'Università di Stanford, iniziarono a creare pagine riassuntive con link ai siti Internet di loro interesse. Nel corso del 1994, Yahoo! (a proposito: la sigla ricorda naturalmente il grido di gioia che si suppone seguire all'individuazione dell'informazione cercata, anche se è ufficialmente sciolta dal curioso acronimo 'Yet Another Hierarchical Officious Oracle') si trasformò progressivamente in un vero e proprio database, ricco di migliaia di pagine indicizzate. All'inizio del 1995 Mark Andreessen, cofondatore della Netscape, percepì l'interesse dello strumento creato da Filo e Yang, e si offrì di contribuire alla trasformazione della iniziativa in una impresa commerciale. Adesso Yahoo! è un'impresa privata, finanziata attraverso le 'inserzioni' pubblicitarie accolte a rotazione nelle sue pagine. Nell'estate 1996 l'azienda è approdata in borsa, con un buon successo. Probabilmente, l'indice Yahoo! diventerà col tempo solo una delle attività della omonima azienda: a quanto pare, è in particolare il settore delle news finanziarie e dei dati di borsa che sembra ora tentare la giovane e dinamica società.

    Utilizzare Yahoo! è assai semplice. Al momento del collegamento (la URL è naturalmente http://www.yahoo.com) ci viene proposta una pagina come questa:

    Figura 96 Yahoo!, il più completo tentativo di indicizzare le informazioni presenti su Internet

    Le voci in grassetto sono le categorie principali, quelle in carattere più piccolo sono alcune fra le loro sottocategorie. Supponiamo di ricercare informazioni sulle agenzie di traduzione raggiungibili attraverso Internet (esistono ormai molti servizi di questo tipo, nei quali la possibilità di scambio veloce e senza limiti geografici di testi costituisce un valore aggiunto notevolissimo). Presumibilmente, una buona categoria di partenza è quella 'Business and Economy'. Se seguiamo il collegamento disponibile, troveremo una ampia lista di sottocategorie: cerchiamo una agenzia professionale, e proviamo quindi la voce 'Companies'. La sottovoce 'Communications and media services' sembra fare al fatto nostro: in effetti, al suo interno troviamo l'ulteriore specificazione 'Translation Services': una lista che al momento in cui scrivevamo Internet '96 comprendeva i link alle pagine in rete di ben 168 diverse agenzie di traduzione, e che adesso, meno di un anno dopo, vede questo numero salito a 558: più che triplicato, dunque, in soli undici mesi!

    Saremmo arrivati allo stesso risultato anche seguendo itinerari diversi: ad esempio, saremmo potuti partire dalla categoria 'Social Science', passando alla sottocategoria 'Linguistics and Human Languages', nella quale è pure presente la voce 'Translation Services'. Le categorizzazioni di Yahoo! — come quelle di qualsiasi altro indice sistematico dello stesso genere — sono spesso altamente discutibili, ma la moltiplicazione delle strade di accesso rende molto difficile perdersi completamente.

    Yahoo! permette inoltre una ricerca per parole chiave che si rivela spesso il sistema più rapido per individuare la categoria cercata: nel nostro caso, sarebbe bastato inserire il termine 'translation' nella casella presente in tutte le pagine del servizio, e premere il bottone 'Search'. A differenza di quanto avviene nel caso di un motore di ricerca come HotBot o AltaVista, la ricerca non riguarda il testo integrale delle pagine World Wide Web, ma solo il database interno di Yahoo!; questa funzione permette dunque in genere di individuare, più che le singole risorse informative, le categorie che ci interessano.

    Altri servizi di catalogazione sistematica

    Yahoo! non è l'unico servizio di catalogazione sistematica delle risorse disponibile su Internet, ma come si accennava è al momento quello di gran lunga più completo. Un elenco di altri cataloghi di questo tipo è raggiungibile premendo il pulsante 'Search' di Netscape 4 (o quello 'Net Directory' delle versioni precedenti).

    Da segnalare sono comunque i discreti indici sistematici offerti da Infoseek (http://www.infoseek.com), da Excite (nella sezione Web Reviews; http://www.excite.com), da Magellan (http://www.mckinley.com/), da Web Crawler (http://www.webcrawler.com). Indici talvolta più ampiamente commentati di quelli di Yahoo! — ma assai meno completi e sistematici.

    Negli ultimi mesi si sono moltiplicati anche gli indici in italiano, utili sia per chi desidera evitare eccessive acrobazie linguistiche con le categorizzazioni inglesi, sia per chi desidera effettuare ricerche limitate allo specifico del nostro paese. Tenete presente, però, che la completezza è in genere molto inferiore a quella della concorrenza di oltreoceano — spesso anche per quanto riguarda le informazioni relative agli stessi siti italiani.

    Da segnalare soprattutto Virgilio, un indice nato in casa Telecom On Line, con una ottima home page e una scelta informativa ricca anche di articoli e suggerimenti. La URL è ovviamente http://www.virgilio.it. Ma vanno provati anche Arianna, il motore di Italia On Line che permette ricerche sia sul proprio indice di siti italiani, sia sui principali motori internazionali (http://www.arianna.it/), Il Trovatore, realizzato dalla Webzone di Perugia (http://iltrovatore.webzone.it), Il ragno italiano (http://www.ats.it/ragno/), e infine le IWP (Italian Web Pages), che riprendono molto da vicino il 'look' di Yahoo! , e possono essere utilizzate attraverso una interfaccia in diversi linguaggi (http://www.iwp.it).

    Figura 97 Virgilio, un buon punto di partenza per una navigazione guidata su siti italiani.

    In tutti questi casi, le pagine segnalate sono prevalentemente in italiano, o in qualche modo collegate al nostro paese.

    Il futuro della ricerca: gli agenti

    La maggior parte degli strumenti di ricerca in rete fin qui considerati presuppongono un utente estremamente 'impegnato' nel processo di individuare l'informazione che lo interessa, e presuppongono una ricerca per così dire 'd'occasione'. In altre parole, è nel momento specifico in cui una determinata informazione mi serve che mi metto a cercarla, e la mia ricerca richiede che io compia ogni volta e in prima persona un certo numero di azioni, alcune delle quali senz'altro ripetitive: ad esempio collegarmi alla pagina di HotBot o di Yahoo!, impostare i parametri della ricerca, restare collegato mentre ne aspetto i risultati.

    Sarebbe molto comodo, in questi casi, disporre di un 'segretario' che conosca più o meno i miei interessi, sappia prevedere ed anticipare le mie richieste, compia al posto mio (prendendo autonomamente le decisioni più opportune) le azioni più ripetitive, e magari anche qualcuna di quelle meno ripetitive. L'idea di agente software cerca di avvicinarsi a questo ideale: in sostanza, si tratta di incaricare un programma di svolgere per mio conto, anche a intervalli prefissati, determinate ricerche, magari chiedendogli di reagire autonomamente ai risultati della ricerca stessa (ad esempio 'filtrandoli' attraverso l'uso di criteri che potrebbero essere difficili o impossibili da impostare direttamente sul motore di ricerca utilizzato). Se il programma 'agente' non è poi fisicamente legato al mio computer (potrebbe ad esempio trattarsi di un programma ospitato da un server remoto, o addirittura 'distribuito' fra più server remoti), potrei affidargli ricerche e compiti da svolgere anche mentre il mio computer è scollegato dalla rete, e il contascatti della mia utenza telefonica resta tranquillo.

    Per certi versi, alcuni degli strumenti che abbiamo visto fin qui possiedono già almeno in parte queste caratteristiche: è il caso ad esempio dei servizi di net filtering che permettono di impostare una ricerca da ripetere a intervalli regolari, comunicandocene i risultati via posta elettronica. I programmi client per ricevere informazione attraverso i meccanismi di information pushing hanno anch'essi alcune caratteristiche tipiche degli agenti (una volta che ho impostato i miei interessi, saranno loro a occuparsi di collegarsi al server o ai server remoti e a scaricare i dati, magari a intervalli di tempo prefissati), anche se restano fisicamente legati al mio computer. Quello che manca, in questi casi, è però la capacità di prendere decisioni realmente autonome, reagendo dinamicamente alle caratteristiche dell'universo informativo nel quale si muovono.

    Approssimazioni un po' migliori all'idea di agente sono rappresentati da risorse come Firefly (http://www.firefly.com), che permette di accedere a un agente software capace di fungere da advisor (consigliere) analizzando i gusti cinematografici e musicali dell'utente, e consigliandogli – sulla base dell'analisi svolta - film e dischi che dovrebbero piacergli. Il programma agente è in grado di 'imparare' utilizzando un meccanismo di voto elettronico, attraverso il quale i diversi utenti del sistema valutano i film e i dischi compresi nel suo database. Come ricorderete, Wisewire (http://www.wisewire.com) utilizza un meccanismo simile per creare pagine informative personalizzate.

    E' prevedibile però che il settore degli agenti di ricerca intelligenti conoscerà nei prossimi anni un'evoluzione tale da far sembrare questi primi strumenti solo rozze e primitive approssimazioni ad applicazioni assai più sofisticate, potenti e autonome. Per adesso, ci limitiamo a segnalare una prospettiva, una probabile linea di tendenza. Siamo convinti, però, che se dopo Internet '97 avremo occasione di lavorare a Internet '98 o a Internet '99, questa sezione del manuale sarà una di quelle che conosceranno la maggiore espansione.

    Indietro Avanti
    Torna su
    torna su
    Internet facile con E-text!