Come si fa ricerca in Internet 01

vai alla parte 2...

Come si fa ricerca in Internet

parte 1 di 2

15 Come si fa ricerca in Internet

Informazione ordinata e informazione disordinata

Dall'ordine al disordine, dal disordine all'ordine

Gli ipertesti come strumento per organizzare l'informazione

Strumenti di ricerca

La ricerca di indirizzi di e-mail

La ricerca di file

Archie

Archie a caratteri

L'interrogazione di un Archie server attraverso la posta elettronica

Un Archie client grafico: fpArchie

I sistemi di ricerca basati su Web

La ricerca nei newsgroup: i servizi newsfilter

La ricerca nello spazio dei gopher: Veronica

La ricerca su World Wide Web

I motori di ricerca per termini

HotBot

AltaVista

Altri motori di ricerca

Servizi di catalogazione sistematica delle risorse

Yahoo!

Altri servizi di catalogazione sistematica

Il futuro della ricerca: gli agenti

Internet, abbiamo detto più volte, costituisce una immensa risorsa informativa. L'anno scorso ci è capitato di incontrare, affisso in una bacheca di una facoltà universitaria, un avviso dal titolo singolare: "Cercatore d'oro offresi". Non si trattava della vendita di un cercametalli, ma dello slogan scelto da un giovane e intraprendente cibernauta per offrire — a prezzi popolari — i suoi servigi di via Internet. L'oro, dunque, era l'informazione, e il nostro cercatore information broker garantiva di poter reperire, in rete, informazione per tutte le esigenze: dallo studio per un esame alla preparazione di una tesi di laurea, dalla ricerca giornalistica alla semplice curiosità.

Chi sorridesse davanti a queste pretese commetterebbe un grosso errore di valutazione. Certo, poche tesi di laurea potrebbero (per ora) essere scritte basandosi esclusivamente sul materiale reperibile attraverso Internet, e chi si affidasse alla rete come risorsa informativa universale resterebbe (per ora) probabilmente deluso. Non è vero che su Internet ci sia — come è stato scritto — una risposta per ogni domanda. E per scrivere una tesi di laurea è (per ora) molto meglio disporre di una buona biblioteca che di un accesso alla rete. Ma Internet può aiutare a trovare molte risposte — incluse, probabilmente, alcune che non penseremmo mai di cercarvi. E anche (o soprattutto) se abbiamo accesso a una buona biblioteca, e sappiamo utilizzarla, la nostra produttività in termini di reperimento e utilizzazione dell'informazione aumenterà enormemente affiancandovi la possibilità di svolgere ricerche in rete.

Per essere ancor più espliciti, è nostra convinzione che il vero 'virtuoso' nel campo della ricerca, gestione e produzione dell'informazione, l'information manager del duemila, sarà chi riesce a meglio padroneggiare e integrare fonti informative diverse, tradizionali e no. Se il 'cercatore d'oro' dell'annuncio appena citato avesse davvero questa capacità, le sue pretese sarebbero pienamente giustificate — e il suo futuro economico sarebbe probabilmente assicurato.

Disporre di risorse informative adeguate, e saperle usare, rappresenta indubbiamente una forma di potere di alto valore politico ed economico. E Internet, pur non essendo l'unica risorsa informativa che è oggi utile e necessario saper utilizzare, è sicuramente una delle più importanti.

Farsi una vaga idea di come funziona una biblioteca è abbastanza facile, ma saper usare bene una biblioteca non lo è affatto. Lo stesso discorso vale per Internet. Chi pensasse che, grazie alla disponibilità di motori di ricerca ai quali proporre parole chiave da trovare, reperire informazione su Internet sia relativamente semplice, commetterebbe di nuovo un grave errore di valutazione. Internet mette a disposizione informazione di natura assai eterogenea, raggiungibile attraverso canali diversi. Per svolgere correttamente una ricerca occorre per prima cosa interrogarsi sulla natura dell'informazione che stiamo ricercando, e avere la capacità di capire se, dove e attraverso quali strumenti essa può essere reperita su Internet.

L'information broker su Internet deve dunque conoscere abbastanza bene la rete; soprattutto, deve aver piena coscienza della diversa natura di molte fra le fonti informative accessibili attraverso di essa.

Informazione ordinata e informazione disordinata

Supponiamo, ad esempio, di dover svolgere una ricerca sulla musica per liuto. Il tema sembra abbastanza specifico e circoscritto. Ma è veramente così?

Consideriamo i tipi diversi di informazione che potremmo voler trovare:

una bibliografia (per poter poi cercare in biblioteca i libri che ci interessano);
articoli e notizie disponibili direttamente attraverso la rete;
spartiti di musica per liuto;
immagini di liuti;
notizie utili ad acquistare un liuto (ad esempio, indirizzi di liutai e prezzi degli strumenti);
indicazioni su dischi di musica per liuto (eventualmente accompagnate dai prezzi e, perché no, dalla possibilità di acquistare i dischi direttamente attraverso Internet);
brani registrati di musica per liuto;
informazioni e valutazioni critiche sui diversi esecutori.

Sicuramente non si tratta di un elenco completo, ma dovrebbe bastare a illustrare un concetto essenziale: per svolgere correttamente una ricerca non basta conoscerne l'argomento — sapere cioè su che cosa vogliamo trovare informazione. Bisogna anche sapere che tipo di informazione vogliamo trovare.

Questo naturalmente è vero in generale, ed è particolarmente vero nel caso di ricerche svolte attraverso Internet. La rete ci può aiutare nella maggior parte dei compiti elencati sopra (e forse addirittura in tutti). Ma non possiamo pensare di cercare in un unico posto, o di usare un unico strumento di ricerca.

In particolare, nel cercare informazione in rete va tenuta presente la differenza fondamentale fra informazione fortemente strutturata e informazione 'libera', non strutturata e a volte occasionale.

Per capire meglio di cosa si tratta, consideriamo il primo dei compiti sopra elencati: raccogliere una bibliografia sul liuto e la musica per liuto. Naturalmente, la costruzione di una bibliografia ragionata è un compito che richiede non solo la consultazione di cataloghi e repertori, ma anche lo studio diretto di almeno parte dei testi selezionati. Limitiamoci però al primo livello, quello della mera raccolta di informazioni bibliografiche essenziali. Un buon punto di partenza può essere, evidentemente, il catalogo di una biblioteca. Attraverso Internet se ne possono raggiungere moltissimi — supponiamo di partire dal catalogo della Library of Congress, al quale ci si può collegare via telnet all'indirizzo locis.loc.gov.

La consultazione del catalogo non è difficile, e ci si può far guidare dagli abbondanti aiuti in linea presenti. Nel caso specifico, una ricerca per soggetto con chiave 'lute' ci porta a un primo elenco di termini:

Terms alphabetically close to:LUTE
B01 Lutchmeenaraidoo, K//(AUTH=2)
B02 Lutcke, Ernst, 1929-//(AUTH=1)
B03 Lutcke, Klaus-Peter//(AUTH=1)
B04 Lutcke, Willy//(AUTH=1; SUBJ=1)
B05 Lutczyn//(AUTH=1; SUBJ=1)
B06+Lute--//(TITL=1; SUBJ=22)
B07 Lute and the lattice//(TITL=1)
B08 Lute and the rifle//(TITL=1)
B09 Lute construction//(TITL=1)
B10 Lute making//(TITL=1)
B11 Lute music--//(SUBJ=52)
B12 Lute of jade//(TITL=1)

---EXAMPLES: s b6 (SELECTs line b6; creates a
SET for each term type)
f b6-b8/b10 (FINDs b6-b8 and b10; combines
sets, displays result)
r b6 (RETRIEVEs term on b6;
searches text in some files)
r subj=b6 (RETRIEVEs term type
specified; e.g., SUBJ, TITL)

Next page of BROWSE list, press ENTER key.
More info, type HELP BROWSE.
READY:

Come suggerito dagli esempi a fine schermata, combiniamo i termini b6-b12 in una ricerca di tipo 'find':

f b6-b12

Il risultato è il seguente:

ITEMS 1-3 OF 74 SET 9: BRIEF DISPLAY FILE: LOCI
(DESCENDING ORDER)
1. 95-18783: Caroso, Fabritio. Courtly dance of the
Renaissance : a new translation and edition of
the Nobilta di dame (1600) / New York :
Dover Publications, 1995. vi, 408 p.: ill. ; 24 cm.
LC CALL NUMBER: GV1590 .C2913 1995
2. 94-234985: Knispel, Claudia. Das Lautenbuch der
Elisabeth von Hessen / Frankfurt am Main : Haag +
Herchen, c1994. 246 p. : ill., music ; 21 cm.
LC CALL NUMBER: ML1013 .K6 1994
3. 94-214649: Eichmann, Ricardo. Koptische Lauten :
eine musikarchaologische Untersuchung von sieben
Langhalslauten des 3.-9. Jh. n. Chr. aus Agypten
/ Mainz am Rhein : Philipp von Zabern, c1994.
xxii, 157 p., 24 leaves of plates : ill. ; 31 cm.
LC CALL NUMBER: ML1011 .E43 1994
NEXT PAGE: press transmit or enter key
SKIP AHEAD/BACK: type any item# in set Example--> 25
FULL DISPLAY: type DISPLAY ITEM plus an item#
Example--> display item 2
READY:

Quella visualizzata è la prima schermata del lungo elenco di testi (complessivamente, 74) disponibili in biblioteca e collegati nel soggetto o nel titolo al liuto. Per ogni testo possiamo anche ottenere una schermata di dettaglio, contenente tutti i dati di schedatura.

Naturalmente, oltre alla Library of Congress potrei consultare i cataloghi di numerose altre biblioteche: ad esempio la Bibliothèque Nationale di Parigi (telnet su opale02.bnf.fr, raggiungibile anche attraverso World Wide Web alla URL http://www.bnf.fr/web-bnf/catalog/index.htm), o, in Italia (ma solo per i testi recenti), il catalogo del sistema bibliotecario nazionale (SBN) raggiungibile ad esempio alla URL biblio.cib.unibo.it.

Una ricerca di questo tipo ci porta, in una mezz'ora di lavoro dalla scrivania di casa, e al prezzo di una telefonata urbana (in orario non di punta, 30 minuti corrispondono a 5 scatti, e dunque a una spesa inferiore alle 1000 lire), a consultare i cataloghi di quattro o cinque fra le maggiori biblioteche mondiali, e a raccogliere (abbiamo fatto la prova) una bibliografia di circa 140 titoli. Internet, dunque, si è rivelato uno strumento di ricerca prezioso. Ma in questo momento ci interessa soffermarci soprattutto sul tipo di informazione che abbiamo cercato.

Il catalogo informatizzato di una biblioteca è una raccolta ordinata di informazioni, che è possibile consultare attraverso una interfaccia standard, e su cui è possibile effettuare ricerche attraverso un linguaggio di interrogazione. Quando facciamo una ricerca di questo tipo, sappiamo in anticipo che tipo di informazione ci verrà restituita: se la ricerca ha esito positivo, ne ricaveremo un certo numero di schede bibliografiche, con una struttura costante (autore, titolo, luogo e anno di edizione, numero delle pagine, formato, collocazione...). Nessuno userebbe il catalogo di una biblioteca per cercare una immagine di un liuto, o informazioni su quali dischi di liuto comprare — anche se naturalmente alcuni dei libri presenti a catalogo potrebbero fornirci queste informazioni, e la ricerca sul catalogo potrebbe essere utile per trovare quei libri. D'altro canto, il ricercatore accorto (ma non sempre quello occasionale) sa che una ricerca di questo tipo fornisce per lo più titoli di libri, e non titoli, ad esempio, di articoli su riviste; e sa che le riviste specializzate possono essere anch'esse una fonte informativa essenziale (cosa pensereste della bibliografia di una tesi di laurea che citasse solo libri, e nessun articolo?). Nessun timore, attraverso Internet si possono fare ricerche anche su basi dati costituite da abstract di articoli (ce ne occuperemo tra breve, parlando del servizio Uncover). Quello che ci preme sottolineare in questa sede, tuttavia, è che per fare una ricerca non basta la mera competenza 'tecnica': occorre anche avere delle buone strategie di ricerca.

Attraverso Internet sono dunque accessibili — fra le altre cose — banche dati specializzate, contenenti informazione fortemente strutturata, come il catalogo di una biblioteca (ma anche, ad esempio, banche dati di formule chimiche, o di genetica, o di informazioni geografiche e sociopolitiche sui vari stati mondiali, o atlanti stellari...). Non ci capiteremo per caso: le consulteremo quando cerchiamo informazioni di quel tipo. E — occorre che questo sia ben chiaro — il contenuto di una di queste banche dati è accessibile attraverso Internet, ma non nello stesso senso in cui lo è, ad esempio, una pagina di World Wide Web: se utilizzassimo uno dei cosiddetti 'motori di ricerca' che indicizzano le informazioni presenti su World Wide Web, non arriveremmo mai dentro al catalogo di una biblioteca (a meno, naturalmente, che il catalogo stesso non sia interamente costruito utilizzando pagine HTML).

Consideriamo adesso gli altri tipi di ricerca concernenti il liuto che avevamo suggerito come esempio: in molti di questi casi, non ricorreremo a banche dati altamente strutturate come il catalogo di una biblioteca, ma all'informazione sparsa disponibile in rete.

Cosa vuol dire 'informazione sparsa disponibile in rete'? Vuol dire che qualcuno — una istituzione musicale, un appassionato, un negozio di musica — ha ritenuto di rendere accessibili (in genere attraverso pagine su World Wide Web) informazioni da lui considerate interessanti o utili. Nel caso del catalogo di una biblioteca, sapevamo già cosa aspettarci; in questo caso, non lo sappiamo. Troveremo ad esempio immagini di liuti? Molto probabilmente sì, ma non ne siamo sicuri. E che affidabilità avranno le notizie che raccoglieremo? Impossibile dirlo a priori: un negozio di strumenti musicali potrebbe avere interesse a parlar bene di una certa marca di strumenti perché deve venderli; un appassionato potrebbe avere una sensibilità musicale diversissima dalla nostra. In poche parole, anziché una informazione fortemente strutturata, in genere avalutativa e uniformemente caratterizzata da un alto livello di affidabilità, stiamo cercando (e troveremo) una informazione assai più eterogenea. Non per questo — si badi — il risultato della nostra ricerca sarà meno utile o interessante: sarà solo di diversa natura.

Va anche considerato che qualunque ricerca su World Wide Web è fortemente legata al momento in cui viene fatta: l'evoluzione della rete è infatti continua, e questo significa non solo che nuova informazione viene aggiunta ogni giorno, ma anche che alcune informazioni possono essere rimosse, o spostate. Abbiamo potuto accorgercene direttamente nel verificare, a meno di un anno di distanza dalla stesura di Internet '96, quali e quanti cambiamenti vi fossero nei risultati di una ricerca quale quella che abbiamo scelto a mo' di esempio.

Nello scrivere questa sezione del manuale, nel caso di Internet '96 eravamo partiti dal motore di ricerca per termini all'epoca più completo: AltaVista, della Digital. La ricerca era stata effettuata sul termine 'lute' (naturalmente, nel caso di Internet la prima ricerca viene in genere fatta utilizzando il termine inglese; una ricerca più raffinata vi avrebbe affiancato almeno i corrispondenti termini italiani, francesi, tedeschi, spagnoli...). Ebbene, se nel marzo 1996 questa ricerca aveva fornito un elenco di circa 5.000 pagine nelle quali compare, per i motivi più vari, la voce 'lute', effettuando la stessa ricerca nel marzo 1997 le pagine disponibili sono oltre 8.000. E se al posto di Altavista utilizziamo HotBot, un motore di ricerca con una base di pagine indicizzata più ampia (ci occuperemo in dettaglio di entrambi fra breve), che all'epoca della stesura di Internet '96 non era ancora disponibile, l'elenco al quale arriviamo conta 12.477 pagine.

A titolo di esempio, vediamo i primi 8 rimandi ai quali eravamo arrivati nel 1996 (nel 1997 l'elenco è ovviamente in parte diverso, ma per i nostri scopi attuali questo ha poca importanza). Il risultato arriva in una pagina grafica, ma per comodità espositiva lo riportiamo qui in forma solo testuale:

Harmonia Mundi France Title: Lute Songs & Solos, Vol.2 Composer: DOWLAND, John Soloist / Inst.: A Deller, ctr-ten; R Spencer, lute Group : The Consort of Six CAT #: HMC 90245. http://www.harmoniamundi.com/hmc90245.html - size 1K - 1 Feb 96

Harmonia Mundi France Title: Lute Songs & Solos, Vol.1 Composer: DOWLAND, John Soloist / Inst.: A Deller, ctr-ten; R Spencer, lute CAT #: HMC 90244. http://www.harmoniamundi.com/hmc90244.html - size 1K - 1 Feb 96

Lute Suites Lute Suites. Individual Works: Suite in g-moll BWV 995 Fuge in g-moll BWV 1000 Suite in e-moll BWV 996 Praludium, Fuge und Allefro in Es-Dur BWV 998 Partita in c-moll... http://tile.net/bach/lutesuites.html - size 2K - 27 Feb 96

The Lute The Lute. You cautiously pick up the lute and experimentally pluck a few strings... Stangely enough, it does not make any sound at all, no matter which chords you play... http://www.sct.gu.edu.au/~anthony/ground/ jester/playlute.html - size 2K - 11 Dec 95

No Title Lute-Book Lullaby, from the MS. Lute Book by William Ballet, early seventeenth century. Lyric: 1. Sweet was the song the Virgin sang, when she to Bethlem Juda came and... http://zebra.asta.fh-weingarten.de/pub/Sound/ MIDI/L/LUTEBOOK.TXT - size 535 bytes - 6 Nov 92

Put your title here ab·so·lute (àb¹se-l¡t´, àb´se-l¡t¹) adjective Abbr. abs. 1. Perfect in quality or nature; complete. 2. Not mixed; pure. 3. Not limited by restrictions or exceptions;... http://www.sound.net/~mvc/emblem/absolute.html - size 606 bytes - 24 Jan 96

Guitar and Lute Links Classical Guitar and Lute Links. some links and format courtesy of John P. Dimick http://www.teleport.com/~jdimick/ocg.html. Early Music. Astor Piazzolla. Classical MIDI... http://www.mtsu.edu/~yelverto/glynx.html - size 3K - 21 Feb 96

Other Guitar and Lute Music Pages Other Guitar and Lute Music Pages. By starting with these, you can find almost anything on the Internet relating to nylon stringed instruments. I have tried to include... http://world.std.com/~sdrasky/more.html - size 2K - 12 Jan 96

Già questo primo elenco mostra il carattere eterogeneo dell'informazione reperita: se andiamo a consultare le pagine troveremo informazioni (commerciali) su dischi per liuto, consigli (apparentemente non commerciali) di un appassionato sullo stesso argomento, il testo di una canzone per liuto (della quale è disponibile anche lo spartito e una registrazione in formato MIDI), la pagina di un gioco in rete nel quale compare un misterioso liuto che non riusciamo a far suonare, una voce di dizionario relativa alla parola 'absolute', e due pagine di ulteriori rimandi a informazioni relative ai liuti e agli strumenti a corde.

Morale: un motore di ricerca di questo tipo ci porta a informazione estremamente eterogenea, e lascia a noi il compito di selezionare quella che ci interessa veramente.

In un caso come questo, proseguiremmo probabilmente la navigazione attraverso le ultime due pagine, che sembrano le più promettenti. Dopo qualche salto, arriveremo fra l'altro: a una antologia di trattati 'classici' sulla posizione delle mani da parte del suonatore di liuto (se avete curiosità, la troverete alla URL http://www.cs.dartmouth.edu/~wbc/hand/Technique.html); a una collezione di ben 22 riproduzioni a colori di quadri nei quali sono raffigurati liuti e suonatori di liuto (alla URL http://www.cs.dartmouth.edu/~wbc/icon/icon.html); a file sonori con registrazioni di sonate per liuto (ad esempio alla URL http://www.cs.dartmouth.edu/~wbc/lute/fw_8.au); a un documento di suggerimenti e consigli per chi intende acquistare un liuto (alla URL ftp://ftp.cs.dartmouth.edu/pub/lute/Buying_A_Lute.FAQ); a un elenco di liutai e di negozi di liuto sparsi in tutto il mondo (ftp://cs.dartmouth.edu/pub/lute/Luthier.FAQ); alle pagine di un negozio che vende attraverso Internet corde per liuto (http://www.cp.duluth.mn.us/~lvgamut/); all'associazione liutai americani che vende, fra l'altro, libri di istruzioni su come costruirsi da soli un liuto (http://www.deltanet.com/GAL/bp.htm); alle pagine personali di suonatori di liuto (segnaliamo quella, presente anche in italiano, del liutista romano Federico Marincola: http://members.aol.com/marincola/italiano.htm), e così via. Potremo anche scaricare programmi per preparare, stampare e suonare attraverso la scheda sonora o una interfaccia MIDI delle tablature per liuto (come quello per Windows di Francesco Tribioli denominato Fronimo e disponibile sul server FTP dell'osservatorio di Arcetri o alla URL http://members.aol.com/cyberius/fronimo.zip), o addirittura — una novità del 1997 — uno screen-saver basato su immagini di liuti (alla URL http://www.albany.net/~dowland/screen.html). E naturalmente innumerevoli immagini di spartiti e tablature, come quella qui sotto (presa a mo' di esempio dal lunghissimo elenco disponibile alla URL http://www.cs.dartmouth.edu/~wbc/tab-serv/tab-gif.cgi).

Figura 91 L'immagine di uno spartito per liuto visualizzata da Internet Explorer

In sostanza: dall'informazione ordinata e (dal punto di vista formale) prevedibile di un catalogo di biblioteca siamo passati al mare ricchissimo, ma caotico e disorganizzato, di World Wide Web. In entrambi i casi, Internet si è rivelato uno strumento prezioso di reperimento dell'informazione. Ma le strategie di ricerca non possono evidentemente essere le stesse. E avremmo potuto introdurre ancora altri esempi, come le informazioni ricavabili dai newsgroup Usenet (fra i quali troviamo news:tnn.music.early.lute) o dalle liste di distribuzione postale dedicate al liuto (per iscriversi, il comando 'subscribe' va mandato a lute-request@cs.dartmouth.edu) o, più in generale, agli strumenti a corde.

Naturalmente, quello del liuto è solo un esempio fra gli innumerevoli che si potrebbero fare. Il nostro scopo principale era quello di far comprendere l'esistenza di differenze notevolissime nella tipologia dell'informazione raggiungibile attraverso la rete. Imparare come e dove cercare tipi di informazione diversa, costituisce un primo passo essenziale per padroneggiare — per quanto possibile — l'offerta informativa di Internet. Forniremo, nel seguito, altri esempi e suggerimenti, anche se il lettore deve essere consapevole che in questo campo nessuna istruzione e nessun consiglio possono sostituire l'esperienza e, perché no, anche il 'fiuto' che possono venire solo dalla pratica della ricerca attraverso la rete.

Dall'ordine al disordine, dal disordine all'ordine

Ancora qualche breve considerazione generale. Abbiamo esaminato la differenza fra informazione 'ordinata' e informazione 'disordinata', e abbiamo visto che entrambe presentano vantaggi e difficoltà. L'informazione 'ordinata' di una banca dati è in genere più puntuale e affidabile, ma, pur essendo raggiungibile attraverso Internet, non è in genere integrata nella grande ragnatela ipertestuale del World Wide Web. L'informazione 'disordinata' di World Wide Web è più difficile da valutare dal punto di vista dell'affidabilità, e per reperirla siamo spesso costretti a navigazioni che possono sembrare quasi casuali, e talvolta frustranti.

Questa situazione spiega quelli che sono forse i compiti principali che una risorsa informativa come Internet, in crescita talmente rapida da non potersi permettere 'pause di riflessione' per la riorganizzazione del materiale disponibile, si trova a dover affrontare: integrare e organizzare l'informazione fornita.

Internet, tuttavia — a differenza di quanto vorrebbe far credere un certo numero di film 'alla moda' sulla nuova realtà delle reti telematiche — non è una sorta di 'superorganismo' autocosciente. L'integrazione e l'organizzazione delle informazioni disponibili in rete dipende in gran parte dai suoi utenti 'di punta': in primo luogo da chi fornisce informazione e da chi progetta, realizza e rende disponibili programmi e motori di ricerca.

Gli ipertesti come strumento per organizzare l'informazione

L'impegno per capire come integrare e organizzare l'informazione disponibile in rete è uno dei principali fattori che hanno determinato lo sviluppo di Internet negli ultimi mesi — e sarà senz'altro fra i nodi teorici principali che resteranno al centro dell'evoluzione della rete nel prossimo futuro.

Dal punto di vista dei fornitori dell'informazione, questo impegno si traduce nel tentativo di comprendere al meglio i meccanismi di funzionamento 'concettuale' di un ipertesto. A differenza di quanto si potrebbe a prima vista pensare, non si tratta affatto di un compito facile. Se infatti stabilire qualche collegamento all'interno delle proprie pagine, e fra esse e il mondo esterno, basta a costruire formalmente un ipertesto, perché questa costruzione sia adeguata dal punto di vista semantico, produttiva dal punto di vista informativo, e funzionale dal punto di vista operativo, serve molto di più.

Internet, abbiamo detto, si è andata trasformando in una sorta di 'ipertesto globale': World Wide Web nasce come risorsa ipertestuale, e la linea di tendenza chiaramente percepibile è quella dell'assorbimento all'interno di questa struttura ipertestuale anche delle altre funzionalità della rete. Programmi di gestione della posta elettronica o di lettura dei newsgroup Usenet capaci di attivare automaticamente un browser World Wide Web, collegamenti di tipo telnet e FTP resi accessibili partendo da una pagina HTML, disponibilità di accessori e plug-in in grado di integrare nella struttura Web file e documenti prodotti dai programmi più vari, ne sono eloquente testimonianza. I percorsi disponibili — sotto forma di link, di punti di passaggio da una informazione all'altra — all'interno di questa sterminata mole di informazioni, sono fili che aiutano a camminare attraverso un labirinto. Se questi fili guidano lungo itinerari inconsistenti, portano a movimenti circolari, ci distraggono dalle risorse che effettivamente cerchiamo o le presentano in modo fuorviante o disordinato, la navigazione risulterà difficile o infruttuosa.

Supponiamo, ad esempio, di voler realizzare una rivista letteraria in rete. Entusiasti per le possibilità offerte dalla strutturazione ipertestuale dell'informazione, ci ingegniamo di trovare il maggior numero possibile di collegamenti fra il materiale da noi fornito e il resto delle risorse disponibili. Ci viene proposto un articolo su Goethe, e noi lo 'pubblichiamo' aggiungendovi quello che — riteniamo — è il valore aggiunto reso possibile dal suo inserimento su Internet: si parla di Francoforte come luogo natale di Goethe, e noi colleghiamo la parola 'Francoforte' al sito Internet dell'ufficio di informazioni turistiche della città; si parla dello studio dell'ebraico da parte del giovane Goethe, e noi colleghiamo il passo a un corso di ebraico disponibile in rete; si parla dei suoi studi di anatomia, ed ecco un link al 'Visible Human Project', una impressionante raccolta di immagini e informazioni sull'anatomia umana.

Alla fine, avremo reso un servizio al lettore? Non crediamo proprio: i collegamenti proposti sono dispersivi, la relazione con il contenuto del testo è minima, non vi è alcuna offerta di percorsi di ricerca strutturati e coerenti.

Se tuttavia nell'articolo fosse presente un riferimento alle letture alchemiche di Goethe, e se per avventura su Internet fosse presente il testo di una delle opere lette e utilizzate dal poeta, il collegamento sarebbe probabilmente assai meno gratuito: laddove in un libro a stampa avremmo inserito una nota che rimandava a edizione e pagina del testo in questione, in un ipertesto in rete possiamo inserire un collegamento diretto. Il lettore interessato non avrà più bisogno (volendo) di interrompere la lettura per cercare di procurarsi — presumibilmente in una libreria specializzata — un'opera poco conosciuta e magari esaurita, ma potrà consultarla immediatamente (se siete scettici sulla possibilità di trovare in rete il testo dei trattati alchemici letti da Goethe, date un'occhiata alla URL http://www.levity.com/alchemy/texts.html).

Esiste dunque una sorta di 'potere di link' da parte di chi realizza una pagina ipertestuale: perché l'ipertesto si riveli effettivamente uno strumento produttivo di strutturazione dell'informazione, e perché la ricchezza dei rimandi non si traduca in disordine, occorre che questo 'potere' non sia usato male. Ma come imparare a scegliere i collegamenti giusti? Si tratta di un campo in cui lo studio teorico è in gran parte da compiere: l'avvento degli ipertesti porta con sé problematiche finora poco esplorate, ed è probabile che la critica testuale avrà, nei prossimi decenni, un nuovo settore nel quale esercitarsi. Dal canto nostro, saremo soddisfatti se il lettore comprenderà l'importanza di scegliere in maniera oculata i legami ipertestuali forniti.

Naturalmente il problema riguarda non solo il fornitore ma anche il fruitore dell'informazione, che dovrà imparare a valutare e scegliere, fra i vari che gli sono offerti, i percorsi di navigazione più adeguati al suo scopo. Un compito che richiede una certa esperienza, ma anche una buona conoscenza degli strumenti di ricerca disponibili in rete. Vediamo quindi di esaminarne in dettaglio alcuni.

Strumenti di ricerca

La ricerca di indirizzi di e-mail

Su Internet, purtroppo, non esiste l'equivalente diretto di un elenco telefonico, e non c'è quindi un sistema certo per trovare un indirizzo di posta elettronica. Non si tratta di una carenza casuale: il meccanismo di funzionamento della rete, come abbiamo visto, è estremamente decentrato, l'aggiunta di nuovi nodi può avvenire in ogni momento senza bisogno di 'informarne' direttamente tutta la rete, e lo stesso vale, a fortiori, per l'aggiunta di singoli utenti. Le stesse stime sul numero di utenti collegati a Internet, come abbiamo visto, variano considerevolmente, con scarti in più o in meno anche dell'ordine della decina di milioni.

Negli anni sono stati fatti vari tentativi per rimediare alla difficoltà di trovare gli indirizzi in rete del 'popolo di Internet'. Al momento i tentativi meglio riusciti sembrano essere quattro:

Bigfoot (alla URL http://www.bigfoot.com)
Four11 (http://www.four11.com)
Internet Address Finder (IAF — la URL è http://www.iaf.net)
WhoWhere, (http://www.whowhere.com).

E, proprio considerando la difficoltà di tenere traccia di tutti gli utenti di Internet, nelle nostre ricerche sarà probabilmente utile interrogarli tutti e quattro (aggiungendo magari, soprattutto se cerchiamo indirizzi e numeri telefonici americani — Switchboard, alla URL http://www.switchboard.com). Così come sarà utile, se vogliamo essere reperibili, fornire il nostro indirizzo di posta elettronica e i nostri dati almeno a un paio di questi indici: sulle loro pagine è sempre disponibile il bottone per farlo, riempiendo un modulo (non è detto comunque che inserire il proprio indirizzo di casa e il proprio numero di telefono sia necessariamente una buona idea — ricordate che spesso queste basi di dati sono utilizzate anche con scopi commerciali).

Può valere la pena ricordare alcune delle caratteristiche specifiche di questi motori di ricerca.

Bigfoot, simboleggiato dalla simpatica icona di un grosso piedone blu a tre dita, è di utilizzazione semplicissima: basta riempire il campo 'Search' con il cognome — o, meglio, con nome e cognome — della persona cercata, e premere il pulsante. A inizio marzo 1997, Bigfoot dichiara di indicizzare otto milioni di nominativi. Due caratteristiche meritano di essere segnalate: la possibilità di mantenere 'riservati' alcuni dei dati forniti (chi raggiunge la nostra 'voce' in Bigfoot potrà in tal caso spedirci un messaggio attraverso una apposita interfaccia, ma non gli verrà rivelato il nostro indirizzo di posta elettronica), e la possibilità di attivare gratuitamente un indirizzo di posta elettronica 'stabile'. Una possibilità, quest'ultima, assai utile se prevediamo di cambiare spesso provider, se ne utilizziamo contemporaneamente molti, o se più persone utilizzano lo stesso account. Un servizio analogo, con una navigazione molto curata — ma non sempre efficientissima — all'interno della nostra posta, è offerto da Hotmail: http://www.hotmail.com, e come vedremo da Iname, collegato all'Internet Address Finder.

Four11, dal canto suo, permette di effettuare ricerche anche per reperire numeri telefonici, e 'classifica' gli utenti attraverso una categorizzazione assai dettagliata, che comprende le scuole e le università frequentate, il lavoro svolto, gli interessi e gli hobby... insomma, è quasi una schedatura! L'interfaccia per la ricerca, comunque, è semplice ed efficiente. Una caratteristica preziosa (che comunque offrono diversi fra i siti qui ricordati) è la registrazione degli IP address degli utenti dei principali programmi di telefonia e videotelefonia in rete, da Microsoft NetMeeting a Intel Internet Phone, da CU-SeeMe a Connectix Videophone: un notevole aiuto per raggiungere gli interlocutori delle nostre telefonate e videotelefonate (per ulteriori dettagli, si veda la relativa sezione di questo manuale). La gestione dei propri dati personali avviene attraverso una registrazione — gratuita — che ci permette di ottenere la password da utilizzare nel caso di integrazioni e modifiche. Se volete trovare l'indirizzo di posta elettronica di politici o attori famosi, la directory 'Celebrities' di Four 11 vi aiuterà. Va infine segnalato che, grazie a un accordo con Italia Online, esiste una interfaccia a Four11 completamente in italiano. La si raggiunge alla URL http://iol.four11.com. A inizio marzo 1997, Four 11 dichiara di possedere nel proprio indice 10 milioni di indirizzi e-mail.

Quanto a Internet Address Finder, si tratta di uno dei servizi che si è costituito col tempo la base dati più articolata, integrandovi i risultati delle ricerche su indirizzari di organismi universitari e di ricerca, oltre che dei maggiori fornitori di connettività americani. Anche in questo caso, interfaccia semplicissima — in generale, basta inserire il cognome della persona cercata per verificare se è presente o no del database di IAF. Come si accennava, anche IAF è collegato a un servizio di assegnazione gratuita di un indirizzo e-mail: la URL da contattare è http://iaf.iname.com. Nel momento in cui scriviamo gli indirizzi di posta elettronica che IAF ha memorizzato sono circa 5 milioni e mezzo.

WhoWhere, infine, è il motore di ricerca che ha fornito i risultati migliori nella ricerca di indirizzi italiani di ambiente universitario — mentre è più carente nelle ricerche di indirizzi registrati presso provider privati. Anche Whowhere dispone, se ne sentiamo il bisogno, di un buon meccanismo per la 'copertura' degli indirizzi di posta elettronica: attivandolo, chi ha trovato il nostro nome nell'indice può mandarci un messaggio, pur senza conoscere il nostro indirizzo e-mail. Da segnalare l'amplissimo indice di pagine personali, e quello relativo agli indirizzi di persone e istituzioni nell'ambito del governo americano. Esistono versioni nazionalizzate di Whowhere in francese e in spagnolo, ma per ora non in italiano.

Per quanto riguarda il nostro paese, va segnalato l'ottimo servizio Mailory di Telecom On Line, raggiungibile alla URL http://mailory.tol.it. La base di dati di Mailory è ancora assai limitata, la ricerca viene però completata attraverso altri motori di ricerca di indirizzi (fra i quali l'appena segnalato WhoWhere), riuscendo quindi a fornire buoni risultati.

La ricerca di file

Abbiamo visto nella prima parte di questo manuale come su Internet siano disponibili milioni di file (programmi, immagini, testi, etc.), che chiunque può prelevare usando il protocollo per il trasferimento di file (FTP). Ma come facciamo a sapere dove trovare il programma che ci interessa? Per lungo tempo lo strumento più usato a questo scopo è stato 'Archie'.

Recentemente sono stati sviluppati alcuni sistemi di ricerca per file assai più evoluti ed amichevoli, basati su World Wide Web. A differenza di Archie, che è uno strumento di ricerca universale e permette di individuare file di tutti i tipi, questi sono orientati in modo specifico al reperimento di programmi. In questa categoria le due risorse più complete ed utilizzate sono probabilmente Shareware.com (realizzato da C|Net) e Tucows.

Archie

Archie è un programma che ci consente di 'frugare' all'interno di una serie di ampie banche dati (gestite da appositi Archie server), che archiviano il contenuto dei server FTP di pubblico dominio sparpagliati sulla rete. In questi archivi, a ogni nome di file è associata una serie di informazioni come: localizzazione, dimensione, data di memorizzazione, ecc. L'operazione di archiviazione è automatica, e viene effettuata dagli Archie server costantemente, così da mantenere allineati i propri indici con il contenuto effettivo dei server FTP. Va detto, tuttavia, che non sempre lo scopo è pienamente raggiunto. I siti FTP e i file in essi contenuti sono ormai in numero tale che gli Archie server faticano a restare aggiornati. Può dunque capitare di non trovare un file che invece è stato già immesso nel circuito del pubblico dominio, così come può capitare che risulti ancora presente una determinata versione di un programma che è stata invece cancellata (o sostituita da una più recente).

Archie può essere interrogato in varie modalità: on-line attraverso una interfaccia a caratteri oppure grafica (ne parleremo fra poco), oppure con una procedura batch, ovvero differita, attraverso la posta elettronica.

Indifferentemente dal sistema che decidiamo di utilizzare per la nostra ricerca, sono due le cose di cui abbiamo bisogno: l'indirizzo elettronico di uno dei database Archie, e la stringa di caratteri su cui impostare la ricerca, e che ci consentirà (auspicabilmente) di isolare dagli altri il file ricercato. Mentre per l'indirizzo degli Archie server non ci sono problemi di sorta (tutti i programmi sono dotati di una mini-rubrica preimpostata con gli indirizzi più noti, fra i quali l'italiano archie.unipi.it, ospitato dall'università di Pisa), per la scelta della stringa su cui effettuare la ricerca è necessaria un po' di pratica. Se infatti scegliamo un termine troppo generico, verremo sommersi dai file che soddisfano la nostra richiesta; se invece scendiamo troppo nel dettaglio, ad esempio provando a fornire il nome (secondo noi) esatto del file, rischieremo di non trovare nulla perché magari il nome del programma cercato è stato aggiornato da poco. A complicare un po' le cose intervengono le limitazioni del sistema operativo MS-DOS — tuttora molto usato — che impedisce l'usi di nomi di file più lunghi di 8 caratteri (più 3 per l'estensione). Dovendosi adeguare, gli sviluppatori archiviano spesso sui i server FTP programmi con nomi decisamente criptici, come c32e40b2.exe (per la cronaca: il file in questione è la versione a 32 bit di Netscape Communicator 4, beta 2: un tipico file che dopo un mesetto circa di permanenza in rete è già scomparso, sostituito dalla versione definitiva del programma).

Niente paura, in ogni caso gli strumenti per venirne a capo ci sono. Vediamoli.

Archie a caratteri

Ricorrono in genere agli Archie server con una interfaccia a caratteri coloro che accedono a Internet attraverso macchine Unix (queste 'nude' interfacce Unix sono ormai appannaggio quasi esclusivo di account universitari e di istituti di ricerca).

Se non disponete di un accesso di questo tipo, ma desiderate comunque usare Archie a caratteri, potete usare tramite un collegamento via telnet uno dei numerosi server pubblici (alla connessione immettere la parola 'archie' al login), come archie.funet.fi, archie.unipi.it, archie.switch.ch, archie.internic.net.

Una volta attivata la connessione con un Archie server (digitando 'archie' al prompt di comando se si dispone di account Unix, o facendo telnet su uno degli indirizzi sopra riportati), si potrà impartire una serie di istruzioni.

La fondamentale, quella che ci consente di attivare una ricerca, ha la seguente sintassi:

find chiave_di_ricerca

In luogo del 'find' talvolta occorrerà usare 'prog', il risultato è identico. Vediamo ad esempio l'impostazione di una semplice ricerca, ed il risultato che viene inviato dal server:

FUNET-archie> find roberts

# Search type: sub.
# Your queue position: 12
# Estimated time for completion: 3 minutes, 7 seconds.
working...

Host cranach.rz.tu-ilmenau.de (141.24.8.28)
Last updated 04:59 28 Mar 1996
Location: /pub/unix/pvm3/pvmug/.cap
FILE -r--r--r-- 39 bytes 11:30 3 Feb 1996
robertson

Host ftp.ask.uni-karlsruhe.de (129.13.200.33)
Last updated 17:16 27 Mar 1996
Location: /pub/matlab/proceedings
DIRECTORY drwxr-xr-x 1024 bytes 01:00 17 Sep 1994
roberts
...

L'Archie server per prima cosa ci avverte che la nostra è una ricerca per sottostringhe: 'Search type: sub'. Nei rislutati troveremo quindi elencato un file che si chiama ad esempio 'Robertson' anche se noi abbiamo scritto solo 'Roberts'; il comando 'set search exact', inserito prima di avviare la ricerca, ci avrebbe invece portato solo a quei file che corrispondono esattamente alla chiave di ricerca fornita. Il programma ci comunica che ci sono dodici richieste prima della nostra e che stima di completare il lavoro in tre minuti e sette secondi (di solito viene di fatto impiegato un tempo minore di quello stimato). Terminata la ricerca, il programma ci fornisce poi i dati circa la collocazione su Internet dei file trovati.

Archie mette a disposizione altri comandi che possono essere utili. Qui di seguito ne elenchiamo i principali:

comando	descrizione
Help	consente di accedere a un manuale on-line; 'help comando' dà informazioni più dettagliate su un singolo comando
Quit	chiude una sessione Archie
set mailto	consente di specificare un indirizzo di posta elettronica (tipicamente il proprio) cui spedire copia del risultato delle ricerche. Es.: 'set mailto rossi@liberliber.it'
set maxhits n	dove n è un numero che va da 1 a 1000. Consente di indicare il numero massimo di file che il comando find (o prog) può visualizzare. Normalmente è regolato a 100
set search exact	elenca solo i file che corrispondono esattamente alla nostra chiave di ricerca. Distingue anche tra maiuscole e minuscole
Set search sub	elenca tutti i file che corrispondono, anche solo in parte, alla nostra chiave di ricerca. Es.: cercando 'Roberts' elenca anche 'Robertson'. Non distingue tra maiuscole e minuscole
Set search subcase	come il precedente, salvo che distingue tra maiuscole e minuscole

L'interrogazione di un Archie server attraverso la posta elettronica

Molto utile è l'opportunità di interrogare un Archie server attraverso un messaggio di posta elettronica. In caso di ricerche lunghe e complesse non dovremo attendere il responso on-line, con conseguente dispendio di tempo e soldi, e potremo recuperare il risultato della ricerca nella nostra mailbox in un successivo collegamento. Naturalmente si possono attivare più ricerche via e-mail contemporaneamente, e presso Archie server diversi.

Per usufruire di questo servizio è sufficiente mandare una e-mail ad uno dei molti Archie server pubblici, i cui indirizzi di posta elettronica si costruiscono come segue:

archie@nome_dell'Archie_server

Ad esempio, l'indirizzo dell'Archie server dell'università di Pisa (archie.unipi.it) è 'archie@archie.unipi.it', oppure, più semplicemente, 'archie@unipi.it'.

Nel corpo del messaggio vanno inseriti i comandi di interrogazione, che sono i medesimi usati per la ricerca on-line. Vediamo un esempio di interrogazione. Il corpo della nostra e-mail conterrà:

set mailto nostro_indirizzo_email
set search sub
find Roberts
quit

Alcuni Archie server considerano l'oggetto di una e-mail parte integrante del messaggio; andrà quindi lasciato vuoto. Si consideri inoltre che di alcuni comandi esistono degli alias: 'set mailto' si può sostituire con 'path', oppure si può omettere del tutto (se il vostro mailserver invia correttamente e in modo automatico il vostro indirizzo di posta elettronica). Anche il 'quit' a fine lettera può essere omesso, ma è buona norma inserirlo comunque (consiglio valido specialmente per chi usa programmi di posta elettronica che inseriscono automaticamente una firma, la quale potrebbe confondere l'Archie server).

continua...

torna su