Risorse e percorsi di ricerca

Molti manuali di introduzione a Internet contengono sezioni, spesso assai estese, dedicate a elenchi di risorse specifiche: si tratta in alcuni casi di vere e proprie 'pagine gialle' della rete, suddivise per categorie. Costruire un elenco di questo tipo può non essere troppo difficile - basta lavorare un po' con colla e forbici (virtuali, s'intende!) su uno dei tanti cataloghi sistematici di risorse esistenti su Internet. Ma trasferirlo su un libro a stampa ha a nostro avviso un senso piuttosto limitato: i cataloghi in rete resteranno comunque più completi e più aggiornati, oltre ad avere il notevole pregio aggiuntivo di essere gratuiti. Come già accennato nell'introduzione, la nostra scelta è stata quindi diversa: da un lato, fornire al lettore gli strumenti necessari a compiere da solo le proprie ricerche (ed è quanto speriamo di essere riusciti a fare nel capitolo precedente); dall'altro (ed è quanto faremo in questa sede) segnalare poche risorse di interesse generale, presentate, anziché attraverso il loro semplice indirizzo, discutendone in qualche dettaglio natura e finalità.

Tra le risorse di interesse generale, un posto particolare meritano naturalmente le biblioteche: una biblioteca, è bene ricordarlo in una società forse troppo orientata all'informazione effimera e all'immagine, è il luogo per la ricerca di informazioni, la risorsa informativa per eccellenza. Ed Internet consente da un lato di accedere agli strumenti catalografici e informativi di molte biblioteche tradizionali, dall'altro di entrare in vere e proprie biblioteche virtuali, nelle quali l'informazione è conservata, anziché su carta, in formato digitale. La discussione sui servizi bibliotecari disponibili in rete ci fornirà anche l'occasione per qualche considerazione sui testi elettronici.

Parleremo poi di editoria elettronica in senso più generale: sempre più spesso, giornali e riviste nate nel mondo dell'informazione su carta si affacciano anche sulla rete, e sono ormai moltissime le riviste nate su Internet, che hanno scelto di circolare solo come bit, e non come atomi.

Un discorso analogo vale per mostre, musei, gallerie d'arte; anche in questo caso, non forniremo alcuna catalogazione esaustiva delle risorse (non sarebbe possibile, sono troppe!), ma discuteremo brevemente gli aspetti principali di un fenomeno certo meritevole di approfondimento.

Risorse di interesse generale

La biblioteca

Una delle metafore ricorrenti per descrivere il fenomeno Internet è quella della biblioteca. La grande rete delle reti viene vista come una realizzazione tecnologica della biblioteca di Babele immaginata da Borges, nella quale tutto il sapere potrebbe trovar posto.

Come una biblioteca, lo spazio informativo digitale creato da Internet contiene in effetti una quantità enorme di informazioni; come una biblioteca ha i suoi cataloghi, i suoi soggettari; più di una biblioteca, è dotato di potenti strumenti di ricerca dell'informazione.

E, sebbene sembri un gioco di parole, tra le risorse informative che sono disponibili in questa nuova Alessandria digitale fanno bella mostra di sé proprio le biblioteche, quelle del mondo reale, che si affacciano nel mondo digitale.

Sono infatti migliaia le biblioteche pubbliche e scientifiche di tutto il mondo che hanno un loro sito su Internet. Il tipo di risorsa più utile offerto dalle biblioteche su Internet è naturalmente la possibilità di consultare i cataloghi dei testi disponibili (talvolta sono annessi servizi di prestito interbibliotecario). Oggi è possibile stilare una bibliografia completa su qualsiasi argomento stando comodamente seduti a casa davanti al proprio computer. Accanto ai cataloghi, è disponibile una grande quantità di documentazione e manualistica su tematiche di biblioteconomia e documentalistica, e informazioni approfondite sulle biblioteche e sui loro fondi (compresi gli orari di apertura!).

Ma c'è un secondo aspetto di questo rapporto tra Internet e biblioteche degno di grande interesse: la nascita delle prime biblioteche virtuali. Con questa suggestiva denominazione si suole indicare varie esperienze e progetti che producono, organizzano e mettono a disposizione sulla rete, in vario modo, trascrizioni elettroniche dei testi che la nostra cultura ha prodotto nel passato, produce nel presente e (auspicabilmente) continuerà a produrre in futuro.

Si tratta insomma del prodotto di novelli copisti, che ripercorrono le orme dei monaci medievali e dei primi grandi stampatori che a cavallo tra Quattro e Cinquecento diedero inizio all'era della stampa. E non è un caso che molti di questi progetti abbiano scelto di onorare questa nobile ascendenza, intitolandosi con i nomi di quei lontani maestri: Johannes Gutenberg, Aldo Manuzio.

Nei prossimi paragrafi vedremo una per una queste varie tipologie di risorse, cercando di fornire un quadro delle più rilevanti, e gli strumenti per mettere in grado il lettore di rintracciare le altre.

Internet come fonte di informazione bibliografica

I servizi bibliotecari accessibili attraverso la rete

Il più tipico dei servizi bibliotecari offerto attraverso Internet è naturalmente la consultazione dei cataloghi elettronici delle biblioteche collegate alla rete. Si tratta di una vera miniera per chi ha necessità di effettuare ricerche bibliografiche.

I cataloghi bibliotecari informatizzati che possono essere consultati attraverso i canali di comunicazione telematici vengono definiti Online Public Access Catalog (OPAC). Per facilitare la rappresentazione, lo scambio tra biblioteche e la consultazione da parte degli utenti delle informazioni bibliografiche, sono state definite una serie di specifiche che un OPAC deve rispettare. Ad esempio esiste ormai da tempo un formato standard per la costruzione di record catalografici denominato MARC (Machine Readable Cataloging). Esistono anche delle raccomandazioni sulle caratteristiche dell'interfaccia utente: in generale tutti gli OPAC permettono di effettuare ricerche usando come chiavi le principali intestazioni presenti in una normale scheda catalografica: autore, titolo, soggetto, editore. Alcuni forniscono anche altre chiavi di ricerca, quali data o luogo di pubblicazione e indice di classificazione decimale.

Dal punto di vista delle tecnologie di rete, fino a poco tempo fa la maggior parte degli OPAC erano accessibili solo tramite sessioni telnet. Attualmente moltissime biblioteche hanno sviluppato dei gateway tra i loro database catalografici e i server gopher o HTTP. Queste tecnologie permettono di consultare le banche dati direttamente dalle pagine grafiche di World Wide Web, attraverso dei moduli interattivi, o dai menu di un client gopher.

I servizi bibliotecari accessibili attraverso Internet sono diverse centinaia, ed è ovviamente impossibile elencarli tutti. La maggiore concentrazione di biblioteche dotate di accessi tramite Internet è sicuramente negli Stati Uniti, ma ci sono anche molte biblioteche europee, un certo numero delle quali italiane.

Un elenco aggiornato delle biblioteche di tutto il mondo che offrono sevizi OPAC su Web è il catalogo Libweb realizzato all'università di Berkeley in California. L'indirizzo è http://sunsite.berkeley.edu/Libweb/. L'elenco è diviso per aree geografiche (Stati Uniti, Africa, Asia, Australia, Europa, Sud America, Canada), ed offre anche un motore di ricerca locale.

Tra le grandi biblioteche che hanno un servizio OPAC possiamo ricordare la Library of Congress. Si tratta della più importante biblioteca degli Stati Uniti, e della più grande del mondo. Contiene pubblicazioni in 450 lingue, e su vari media. Il catalogo della Library of Congress è accessibile sia tramite telnet sia attraverso un gateway World Wide Web (sebbene quest'ultimo non dia accesso a tutte le collezioni della biblioteca). L'indirizzo della home page della Library of Congress è http://www.loc.gov.

Negli Stati Uniti sono collegate ad Internet anche le biblioteche di tutte le più importanti Università. Per i residenti, inoltre, molte di queste biblioteche offrono anche un servizio di prestito interbibliotecario tramite Internet.

Un altro esempio di grande risorsa bibliotecaria accessibile via Internet, questa volta situato in Europa, è il catalogo unico delle biblioteche dell'università di Oxford. Il sistema informativo di Oxford, denominato OLIS (Oxford University Libraries System) raccoglie i cataloghi informatizzati di oltre cento tra biblioteche generali, di college e di facoltà. Si può raggiungere tramite Web all'indirizzo http://www.lib.ox.ac.uk/, sebbene la consultazione dei cataloghi veri e propri per il momento possa avvenire solo tramite telnet.

Tra le varie biblioteche di questa prestigiosa università ricordiamo la Bodleian Library, una delle maggiori biblioteche del mondo per le scienze umane, il cui catalogo elettronico è, però, limitato alle accessioni posteriori al 1988.

Accessibile via telnet è anche la Bibliothèque Nationale di Parigi. Il sito Web di questa biblioteca, il cui indirizzo è http://www.bnf.fr, permette anche la navigazione fra mille bellissime miniature tratte da manoscritti del periodo di Carlo V (1338-1380).

Anche in Italia esiste un importante servizio OPAC. Si tratta del Sistema Bibliotecario Nazionale, che contiene il Catalogo Unico Nazionale. SBN raccoglie in un catalogo unico i cataloghi di trecento biblioteche, divise in poli cittadini, tra cui molte biblioteche universitarie e la Biblioteca Nazionale.

SBN offre diversi database per la consultazione: il catalogo dei testi a stampa, che contiene al momento circa due milioni di titoli pubblicati dal 1831 ai giorni nostri; il catalogo degli spartiti musicali, con circa duecentomila entrate; il catalogo dei manoscritti, per ora limitato a cinquecento schede; ed altri cataloghi specializzati, tra cui l'elenco di tutte le biblioteche italiane. Tutti i servizi disponibili sono elencati nella pagina Web del progetto SBN, il cui indirizzo è http://www.cineca.it/sbn/, ma i cataloghi SBN possono per ora essere consultati solo tramite collegamento telnet con emulazione di terminale TN3270 (in sostanza, al posto del normale client telnet va usato un client che preveda l'emulazione per questo particolare tipo di terminale; la pagina del progetto contiene dei link a siti ove scaricare un programma adatto).

Molte biblioteche italiane, oltre a partecipare al progetto SBN, hanno dei propri sistemi OPAC, alcuni dei quali dotati di accesso Web. Un elenco di queste biblioteche, l'Italian OPAC directory, è ospitato presso il server Web del GARR, l'ente che gestisce la sezione universitaria della rete Internet in Italia, all'indirizzo http://www.nis.garr.it/opac-dir/opac.html. Nel momento in cui scriviamo, le biblioteche italiane che prevedono un accesso via Internet ai loro cataloghi e che sono riportate in questo elenco sono ventidue.

Un altro sistema per trovare la biblioteca che cercate: Hytelnet

Hytelnet (in Italia è talvolta chiamato Ipertelnet) è un programma creato in Canada da Peter Scott, che permette di navigare attraverso un catalogo strutturato di siti telnet, attivando direttamente le connessioni delle quali dovessimo aver bisogno. Si tratta di un programma nato su Unix, e fornito quindi originariamente di una interfaccia a caratteri, del quale esistono versioni per tutti i principali sistemi operativi. All'inizio, Hytelnet era nato come un database generale; col passare del tempo, tuttavia, si è andato sempre più specializzando in campo bibliotecario, anche perché le biblioteche costituiscono la grande maggioranza dei siti telnet aperti all'accesso esterno.

Cosa mette a disposizione Hytelnet? Sostanzialmente, un menu gerarchico di risorse (simile, per intendersi, a quello di un gopher), attraverso il quale si può 'scendere' all'indirizzo della singola risorsa che ci interessa. Una volta selezionate le risorse bibliotecarie, ad esempio, si può passare a quelle americane, poi a quelle statunitensi, poi ai consorzi bibliotecari, e infine al singolo catalogo - ad esempio quello del South Dakota Library Network. A questo punto, Hytelnet ci informa (ed è questa una delle sue funzioni più preziose) di quale sia la password necessaria per l'accesso pubblico al catalogo, e ci consente - se vogliamo - di collegarci direttamente alla risorsa selezionata.

Come arrivare ad Hytelnet? Se vi collegate a Internet attraverso la shell Unix di una università, probabilmente basterà digitare 'hytelnet' al prompt. In caso contrario, dovrete installare sul vostro computer una versione del software, o (più semplicemente) raggiungere un sito pubblico che vi dia accesso. Tenete presente che Hytelnet è messo a disposizione dei propri abbonati da MC-link e da Agorà, e che in ogni caso i 'ponti' pubblici non mancano, in alcuni casi anche su World Wide Web. L'università di Cambridge ha realizzato ad esempio un gateway Hytelnet alla URL http://www.cam.ac.uk/Hytelnet/, e una ricerca con chiave 'Hytelnet' su AltaVista o su Lycos permetterà di raggiungerne molti altri.

Altri servizi di interesse bibliotecario

Su Internet esistono molte altre risorse di interesse bibliotecario. Una fonte di informazione preziosa per chi lavora in questo ambito è il sito Web della International Federation of Library Associations and Institutions (IFLA), all'indirizzo http://www.nlc-bnc.ca/ifla/home.html.

Il server della IFLA offre una quantità enorme di notizie e documenti sulle attività di questa associazione, che coordina gli enti bibliotecari nazionali di tutto il mondo. Si possono trovare i testi delle pubblicazioni, gli atti delle conferenze internazionali, e la documentazione relativa agli standard di catalogazione e classificazione in ambito biblioteconomico e documetalistico.

La IFLA mantiene anche tre liste di discussione alle quali partecipano bibliotecari di tutto il mondo e che sono dedicate ai problemi relativi alla gestione e alla classificazione, sia con metodi tradizionali sia mediante strumenti informatici, dei patrimoni di biblioteche e centri di documentazione.

Un altro tipo di risorsa molto importante sono i cataloghi on-line delle case editrici. I cataloghi editoriali sono uno strumento essenziale per il bibliotecario, ma possono essere molto utili anche per uno studioso, o per un normale lettore. Essi infatti consentono di essere costantemente aggiornati circa le ultime pubblicazioni settoriali, e di avere notizie sui vari titoli pubblicati per effettuare eventuali acquisti.

I tradizionali cataloghi editoriali su carta vengono rilasciati con frequenza prefissata, e molto spesso contengono informazioni molto succinte su titoli annunciati, anche a causa degli elevati costi di stampa. I cataloghi editoriali su World Wide Web possono invece esser aggiornati in tempo reale, e sono in grado di offrire una informazione molto più completa su ciascun titolo: si va dall'immagine della copertina a riassunti o estratti di interi capitoli di un libro. Queste informazioni mettono in grado il lettore di avere un quadro assai migliore sulla qualità o sulla rilevanza di un testo.

Infine molti dei cataloghi editoriali su Internet permettono anche di acquistare direttamente i testi mediante carta di credito, o di effettuare ordinativi.

Le case editrici che stanno realizzando versioni elettroniche dei loro cataloghi sono moltissime (Laterza, casa editrice di questo manuale, ha ad esempio il suo catalogo all'indirizzo http://www.iqnet.it/laterza/html/home.html). Un elenco molto esteso degli editori che hanno un sito Web è consultabile attraverso Yahoo!, all'indirizzo http://www.yahoo.com/Business_and_Economy/Companies/Publishing/.

Strumenti alternativi di diffusione selettiva dell'informazione: il servizio Uncover

Fra le risorse bibliografiche accessibili attraverso Internet, una menzione particolare merita il servizio Uncover. Si tratta di una base di dati contenente lo spoglio completo di circa 17.000 riviste scientifiche internazionali, in tutti i campi dello scibile umano. Il servizio è stato avviato da un consorzio di università americane (CARL) che si è in seguito trasformato in una vera e propria società, con sede a Denver nel Colorado. Nell'agosto 1995 CARL e Uncover sono stati acquisiti dalla Knight-Ridder Information, la società responsabile di DIALOG (uno dei principali servizi per l'accesso remoto a data base in linea).

Complessivamente la banca dati consta di circa 7 milioni di articoli, schedati per autore e titolo (in alcuni casi è presente anche un breve abstract), e cresce a un ritmo quotidiano di circa 5.000 articoli.

La banca dati è accessibile via telnet partendo dai menu principali di oltre mille biblioteche inglesi e americane (il sito telnet principale è telnet://database.carl.org), ed ha un proprio sito web (http://www.carl.org/uncover/) che ne spiega dettagliatamente natura e finalità. E' annunciato anche un software (Personal Uncover Navigator) che si dovrebbe comportare come un client specifico per la consultazione di Uncover in un ambiente grafico e user-friendly. Al momento in cui scriviamo, tuttavia, non è ancora chiaro se si tratterà di un programma commerciale o gratuito.

Il servizio di base fornito (gratuitamente) da Uncover è la ricerca sulla base dati di articoli, ricerca che può svolgersi per autore, rivista, parole chiave nel titolo o nell'abstract. Ma la caratteristica che rende Uncover una risorsa informativa davvero unica è la possibilità, una volta individuato l'articolo o gli articoli che ci interessano, di riceverne una copia in tempi brevissimi (normalmente entro 24 ore) via fax. Considerando che il progetto effettua uno spoglio delle riviste al momento della loro uscita, spesso Uncover permette di reperire e ricevere articoli molto prima dell'arrivo nelle biblioteche italiane della relativa rivista.

Farsi trasmettere via fax un articolo ha naturalmente un costo, che si aggira in genere, fra spese fax e diritti d'autore, attorno ai 20 dollari (il pagamento è automatico, via carta di credito).

Un altro servizio di grande interesse offerto da Uncover è la possibilità di ricevere via posta elettronica l'indice completo di ogni fascicolo delle riviste di nostro interesse, al momento dell'uscita del fascicolo stesso. In questo caso il prezzo è di 20 dollari l'anno, e permette di 'abbonarsi' all'indice elettronico di 50 riviste a nostra scelta.

Dal testo elettronico alla biblioteca di Babele

L'applicazione di macchine informatiche alla manipolazione di testi è avvenuta relativamente tardi nella storia dell'informatica. Solo verso la fine degli anni sessanta infatti iniziano a comparire i primi sistemi gestionali e poi i primi sistemi di scrittura elettronica (basati, allora, su mainframe). Questo ritardo è dovuto al fatto che i computer, sin dalla loro nascita alla fine degli anni quaranta, erano stati considerati prevalentemente come potenti e veloci macinatori di numeri.

A partire dagli anni settanta, e ancora più nel decennio successivo con l'affermazione del personal computer, il trattamento dei testi con tecnologie informatiche si è evoluto e diffuso a ritmi sempre crescenti. Fino a pochi anni fa tali tecnologie si collocavano esclusivamente nella fase di redazione o composizione grafica del testo. Il supporto finale, comunque, rimaneva il libro o il giornale.

Oggi i supporti digitali iniziano a proporsi anche come possibili o probabili sostituti del libro. Il testo elettronico, o testo in Machine Readable Form (MRF)01, assume dunque una funzione autonoma. Naturalmente l'introduzione del testo elettronico, come è avvenuto per gli altri supporti testuali che si sono succeduti nella storia, determina una notevole trasformazione nelle pratiche di trattamento e diffusione testuale.

L'evoluzione delle tecnologie telematiche, e in modo particolare della rete Internet, e la loro vasta diffusione in ambito bibliotecario ed umanistico (nonché le risorse a disposizione delle istituzioni universitarie, specialmente negli Stati Uniti), hanno stimolato una grande quantità di iniziative e di sperimentazioni in questo campo.

Sono state realizzate una serie di banche dati testuali on-line, che lasciano prefigurare una nuova forma della diffusione e della consultazione del sapere. Grandi biblioteche hanno già avviato progetti per l'archiviazione elettronica del loro patrimonio librario; tra le altre ricordiamo la Library of Congress, e la Bibliotèque Nationale di Parigi. Anche la Biblioteca Vaticana ha da poco concluso la prima fase di un progetto, avviato in collaborazione con la IBM, che mira a rendere disponibili le immagini digitalizzate di parte dei suoi manoscritti.

Naturalmente queste iniziative hanno tempi di realizzazione assai lunghi. Tuttavia già oggi esistono su Internet molti esempi di banche dati ed archivi testuali che rendono liberamente disponibile un notevole patrimonio. Si tratta di progetti realizzati sia da figure istituzionali sia da associazioni private, che dimostrano la enorme potenzialità della rete come strumento di diffusione dell'informazione e come laboratorio di un nuovo spazio comunicativo.

I diversi tipi di testo elettronico

Nella nostra cultura la quasi totalità dei testi (fino a questo momento) è conservata su supporti cartacei di varia natura e forma. Per rendere disponibile questo patrimonio attraverso i sistemi elettronici di gestione dell'informazione il primo problema che si pone è quello di effettuare una trasposizione dei testi dal loro supporto originario al nuovo supporto elettronico, e di farlo in maniera esaustiva e fedele.

La memorizzazione informatica dei testi non è assolutamente un processo banale. I computer, come è noto, utilizzano solo i due simboli della notazione numerica binaria, eventualmente articolati in sequenze, per rappresentare l'informazione. Un testo su un supporto cartaceo, invece, presenta una grande varietà di informazioni che non sono riducibili esclusivamente alla sequenza dei caratteri alfabetici. Si pensi, a titolo di esempio, alla funzione che rivestono gli elementi non linguistici, quali la disposizione tipografica, i caratteri, l'impaginazione, lo stesso sostrato materiale cartaceo, durante l'atto di lettura.

Le tecnologie informatiche offrono diverse modalità di produzione di testi in MRF. Ognuna risponde, con diversi livelli di adeguatezza e di complessità, alle esigenze di rappresentazione delle informazioni testuali su supporto digitale.

La prima modalità, che potremmo definire il grado zero del testo elettronico, è quella che si basa sulla codifica binaria dei caratteri. Tale codifica viene effettuata associando il repertorio ordinato di simboli di un determinato sistema di scrittura (che comprende il sistema alfabetico, le cifre numeriche decimali, ed una serie variabile di caratteri ortografici), detto character set, a sequenze di numeri binari (bit). Queste tavole di corrispondenza biunivoca vengono chiamate Coded Character Set (insieme ordinato di caratteri codificati).

Le tavole di caratteri si differenziano per il numero di cifre binarie che utilizzano, e dunque per il numero di caratteri che possono codificare. Durante l'evoluzione e la diffusione dell'informatica, ne sono state elaborate numerose.

Per evitare una vera e propria esplosione babelica, durante gli anni vari enti di standardizzazione nazionali e internazionali hanno definito alcune tavole standard; tra queste la più universale è quella denominata ISO 646 IRV, ripresa nello standard internazionale di fatto, l'American Standard Code for Information Interchange (ASCII). Questa tavola usa sequenze di sette numeri binari, che consentono di rappresentare 128 simboli. Quando venne definita, alla fine degli anni sessanta, i computer usavano infatti parole di sette bit per la rappresentazione dell'informazione. Si tratta dell'unica tavola dei caratteri condivisa da tutte le piattaforme hardware e software, dai personal computer ai mainframe.

Quando i computer hanno iniziato ad usare parole di otto cifre binarie, la sequenza base è stata incrementata di un elemento, portando le possibili disposizioni a 256. Però le nuove posizioni sono state riempite in maniera diversificata, determinando la nascita di una serie di 'pagine dei codici' derivata dall'originale ASCI a 7 bit. Ancora una volta la ISO ha inteso mettere ordine in questa confusione, definendo la famiglia di code set denominata ISO 8859. La tavola più nota di questa famiglia è la 8859-1, conosciuta anche come ISO Latin 1 poiché contiene i caratteri per quasi tutte le lingue occidentali con alfabeti latini. Questa famiglia di codici è usata da molte applicazioni su Internet (ad esempio World Wide Web è basata su questa tavola), e da molti sistemi operativi. Nel 1992 infine la ISO ha rilasciato una tavola di caratteri che usa 16 bit: si chiama ISO 10646, ma è conosciuta come Unicode. Unicode, la cui penetrazione tra le piattaforme informatiche sta appena iniziando (lo prevede ad esempio Windows NT), permetterà di risolvere moltissimi problemi di standardizzazione, specialmente per tutti gli alfabeti non latini.

La codifica di un testo in MRF basata sulle tavole dei codici consente di rappresentare la sequenza ordinata di grafemi del testo per i quali è possibile reperire un corrispettivo nella tavola di caratteri utilizzata dalla macchina. Ma un testo a stampa o un manoscritto, come si è detto, contengono una serie di informazioni che vanno oltre la mera sequenza di caratteri. Informazioni veicolate da caratteristiche grafiche (composizione, stili, font) che definiscono ad esempio la struttura astratta del testo e ne individuano le partizioni logiche.

La diffusione dei personal computer e le esigenze di elaborazione e formattazione dei testi in formato elettronico hanno portato allo sviluppo di molteplici strumenti orientati alla creazione e manipolazione di testi: dai word processor ai più sofisticati sistemi di desktop publishing, che consentono di controllare tutto il processo di produzione, composizione e impaginazione dei testi ai fini editoriali.

Dal punto di vista strettamente informatico i sistemi di text processing si possono dividere in due classi, che corrispondono a due diverse impostazioni:

  • sistemi di tipo WYSIWYG (What You See Is What You Get) con formato proprietario
  • sistemi basati su markup language

I sistemi di tipo WYSIWYG con formato proprietario fondono le potenzialità del trattamento dei testi con le capacità grafiche raggiunte dalle attuali strumentazioni hardware e dagli ambienti con interfacce grafiche. Quasi tutti i sistemi di scrittura e impaginazione WYSIWYG utilizzano caratteri di controllo invisibili (in genere i primi trentadue delle tavole dei codici standard), che rendono il file leggibile esclusivamente dal software con cui è stato generato.

I markup language, come abbiamo già avuto modo di vedere, si basano invece su un insieme di istruzioni che costituisce un vero e proprio linguaggio, nato per descrivere la struttura e/o l'impaginazione del testo. Si possono distinguere due tipologie di linguaggi di markup:

  • markup procedurale
  • markup dichiarativo

Il primo tipo (i cui testimoni più illustri sono lo Script, il TROFF, il TEX) consiste di un set di istruzioni operative che indicano la struttura tipografica della pagina (il lay-out), le spaziature, l'interlineatura, i caratteri usati. Questo tipo di marcatura è detta procedurale in quanto indica ad un programma le procedure di trattamento cui deve sottoporre la sequenza di caratteri al momento della stampa.

Il markup dichiarativo invece permette di descrivere la struttura astratta di un testo. Il più noto e potente linguaggio che rientra in questa categoria è SGML. Tra le varie applicazioni SGML, oltre ad HTML che ben conosciamo, è opportuno ricordarne una dedicata in modo specifico alla realizzazione ed alla diffusione di testi elettronici con finalità scientifica in ambito umanistico: la Text Encoding Initiative (TEI).

Il progetto TEI è partito nel 1987 per iniziativa delle tre maggiori associazioni mondiali di studiosi di scienze umane attraverso metodologie informatiche, la Association for Computers and the Humanities (ACH), la Association for Computational Linguistics (ACL) e la Association for Literary and Linguistic Computing (ALLC).

Il lavoro svolto dalle varie commissioni del progetto a partire dal 1989 ha portato alla definizione di un vasto e complesso Document Type Definition, le cui specifiche sono state pubblicate con il titolo Guidelines for Electronic Text Encoding and Interchange, TEI P3 nel 1994. Questa DTD, che contiene oltre cinquecento marcatori, è attualmente utilizzata dalle maggiori banche dati testuali realizzati in ambito scientifico. Tutti i materiali relativi a questo progetto sono consultabili presso il sito Web ufficiale della TEI, all'indirizzo http://www.uic.edu/orgs/tei/index.html.

Le biblioteche virtuali

Su Internet esistono ormai moltissimi siti che ospitano archivi e banche dati in cui trovano collocazione vaste collezioni di testi elettronici in vari formati. Si parla, a questo proposito, di biblioteche virtuali o biblioteche digitali.

Le biblioteche virtuali si dividono in due tipologie sulla base delle modalità di accesso e di consultazione dei testi elettronici in esse contenuti:

  • archivi dai quali l'utente può prelevare testi memorizzati in semplice formato testuale (ASCII o ISO Latin), in vari formati proprietari, o testi codificati con opportuni linguaggi di marcatura (come le varie implementazioni SGML);
  • banche dati di testi consultabili in linea in tempo reale, eventualmente dotate di strumenti di information retrieval.

I primi usano generalmente tecnologie FTP, eventualmente con la mediazione di pagine Web che fungono da indice attivo. Le seconde invece nella maggior parte si basano su tecnologia World Wide Web.

Queste risorse su Internet vengono organizzate e gestite sia da centri di ricerca universitari sia da organizzazioni ed associazioni private. Le biblioteche digitali realizzate in ambito universitario sono normalmente il frutto di progetti di ricerca specializzati, che possono disporre di strumenti tecnologici e di competenze specifiche molto qualificate, a garanzia della qualità scientifica delle edizioni realizzate.

Accanto a queste iniziative istituzionali si collocano una serie di progetti, realizzati e curati da organizzazioni ed associazioni private e volontarie. Queste banche dati contengono testi che l'utente può prelevare liberamente e poi utilizzare sulla propria stazione di lavoro. Le edizioni elettroniche contenute in questi archivi non hanno sempre un grado di affidabilità filologica elevato. Tuttavia si tratta di iniziative che, basandosi sullo sforzo volontario di moltissime persone, possono avere buoni ritmi di crescita, e che già oggi mettono a disposizione di un vasto numero di utenti una notevole mole di materiale altrimenti inaccessibile.

Anche dal punto di vista tematico le biblioteche virtuali su Internet presentano un vasto spettro. Nella maggior parte dei casi si tratta di testi letterari o saggistici in lingua inglese, ma non mancano archivi di testi in molte altre lingue occidentali, archivi di testi latini e greci, e biblioteche speciali con fondi dedicati a particolari autori o temi.

Il numero di biblioteche digitali presenti su Internet è oggi assai consistente, e nuove iniziative vedono la luce ogni mese. Esistono alcuni siti Web che offrono indici di testi elettronici ed elenchi di biblioteche virtuali. Ne ricordiamo due.

Alex è un gopher server che contiene un catalogo generale di 1800 testi elettronici, organizzato per autore, data, titolo, host, lingua e soggetto; il catalogo è dotato di un motore di ricerca locale. Purtroppo da due anni non viene aggiornato regolarmente per mancanza di finanziamenti, ma rimane comunque il più completo strumento di ricerca di testi elettronici su Internet. Alex è raggiungibile tramite l'indirizzo http://www.lib.ncsu.edu/stacks/alex-index.html.

L'altro indice si chiama The On-Line Books Page, ed è realizzato dalla Carnegie Mellon University. Questo sito, basato completamente su tecnologia Web, offre un catalogo ricercabile di testi, organizzato per autore, titolo e soggetto. Il catalogo elenca 1400 testi, ma solo in lingua inglese. Oltre al catalogo dei libri, è presente anche un buon elenco delle biblioteche virtuali e di progetti settoriali di editoria elettronica presenti su Internet, sia in lingua inglese sia in altre lingue. L'indirizzo è http://www.cs.cmu.edu/Web/books.html. Una ulteriore fonte di informazioni è lo Internet Book Information Center, il cui indirizzo è http://sunsite.unc.edu/ibic/IBIC-homepage.html.

Invitiamo il lettore a consultare direttamente questi indici per avere una idea della quantità e qualità di risorse presenti su Internet nel campo delle biblioteche virtuali. Nei prossimi paragrafi dedicheremo un breve approfondimento ad alcune che ci sembrano a vario titolo esemplari.

Progetto Gutenberg

Il Progetto Gutenberg è la prima biblioteca digitale della storia, ed è ancora oggi la più nota ed estesa. Questo progetto, dedicato alla letteratura anglosassone, è nato nel 1971 per iniziativa di Michael Hart, uno dei pionieri del settore.

Il primo testo inserito è stata la Dichiarazione di indipendenza americana, digitata manualmente al computer. Attualmente il progetto comprende molte centinaia di testi - prevalentemente classici della letteratura inglese e americana - e una notevole quantità di collaboratori volontari, che si sono posti l'obiettivo di raggiungere i diecimila titoli entro il 2001.

La biblioteca è conservata su un server principale presso la University of Illinois di Urbana, il cui indirizzo è ftp://uiarchive.cso.uiuc.edu/pub/etext/gutenberg/. Ma il progetto Gutenberg per la sua notorietà è replicato (mirroring) su moltissimi altri server FTP.

I testi sono programmaticamente in formato ASCII standard. Michael Hart, infatti, ha sempre affermato di volere realizzare una banca dati che potesse essere utilizzata da chiunque, su qualsiasi sistema operativo, e in qualsiasi epoca: tale universalità è a suo avviso garantita solo dal formato ASCII.

Il progetto Gutenberg ha una pagina Web il cui indirizzo è http://jg.cso.uiuc.edu/PG/welcome.html, e che contiene il catalogo completo della biblioteca. Al progetto sono anche dedicate una mail list ed un newsgroup, denominato bit.listserv.gutenberg, tramite i quali si possono avere informazioni sui titoli inseriti nella biblioteca, essere aggiornati sulle nuove edizioni, e si possono seguire i dibatti che intercorrono tra i suoi moltissimi collaboratori.

Progetto Manuzio

Il Progetto Manuzio è la più importante biblioteca virtuale di testi in lingua italiana. Questa iniziativa trae nome dal noto editore Aldo Manuzio, considerato uno dei massimi tipografi del Rinascimento e inventore del carattere corsivo (che per questo motivo è noto all'estero come italico).

Il progetto Manuzio è gestito da una associazione culturale denominata Liber Liber, che coordina il lavoro offerto - a titolo del tutto gratuito e volontario - da numerose persone. Grazie a questo sostegno il progetto ha potuto acquisire in poco tempo numerosi testi, fra i quali grandi classici quali La Divina Commedia, i Promessi sposi, i Malavoglia; il ritmo di crescita della biblioteca è notevolmente aumentato nell'ultimo anno.

L'archivio del progetto è costituito per la maggior parte da testi in formato standard ISO Latin 1, ma alcuni titoli sono disponili anche in formati proprietari, o sono codificati in formato HTML per la consultazione diretta tramite World Wide Web. La biblioteca è accessibile attraverso la rete Internet presso il server FTP dell'Università di Milano, all'indirizzo ftp://sunsite.dsi.unimi.it/pub/culture/Manuzio/. Tutti i testi possono essere prelevati gratuitamente. Il catalogo completo dei testi disponibili è consultabile, insieme ad informazioni sull'iniziativa, sulle pagine Web della associazione Liber Liber, all'indirizzo http://www.liberliber.it.

Il catalogo è diviso per settori tematici02, e offre per ogni titolo una breve scheda informativa nella quale, oltre ai dati bibliografici essenziali e una breve nota di commento, sono indicati l'autore del riversamento, i formati di file disponibili e il livello di affidabilità del testo. Il progetto, infatti, ha l'obiettivo di fornire testi completi e filologicamente corretti, compatibilmente con la natura volontaria del lavoro di edizione.

Il progetto Manuzio è nato come biblioteca di classici della letteratura italiana. In questo ambito l'archivio conta attualmente oltre cento titoli, tra cui opere di Dante, Boccaccio, Ariosto, Leopardi, Manzoni, Verga. Attualmente il progetto sta evolvendo verso un modello di biblioteca generale; sono infatti state accolte anche alcune traduzioni di testi non italiani e una serie di opere di saggistica, oltre agli Atti della Commissione parlamentare antimafia. La biblioteca ospita anche una importante rivista scientifica, Studi storici, edita dall'Istituto Gramsci.

L'acquisizione dei testi avviene o attraverso la loro trascrizione al computer, o attraverso l'uso combinato di scanner e programmi di riconoscimento automatico di caratteri: in entrambi i casi, essa viene seguita da una fase di controlli e correzioni. Alcuni titoli della biblioteca, ancora coperti da diritti d'autore, sono stati donati direttamente da case editrici o da privati che ne possedevano la proprietà intellettuale. Questo esempio di collaborazione tra editoria elettronica ed editoria tradizionale dimostra come i supporti elettronici non debbano essere necessariamente pensati come in contrasto con i libri a stampa. Proprio in questi casi anzi la libera disponibilità e circolazione dei testi elettronici si trasforma in uno strumento di promozione per il libro stampato e, in ultima analisi, in un potente veicolo di diffusione culturale.

Oxford Text Archive

Tra i progetti sviluppati presso sedi universitarie e centri di ricerca istituzionali, quello che spicca per prestigio, autorevolezza e tradizione (se di tradizione si può parlare in questo campo) è l'Oxford Text Archive (OTA), realizzato dallo Oxford University Computing Services (OUCS).

L'OTA, mette a disposizione una notevole quantità di testi attraverso un server FTP il cui indirizzo è ftp://ota.ox.ac.uk./pub/ota/; possiede inoltre una base dati testuale non pubblica, cui possono avere accesso localmente ricercatori e studiosi.

L'archivio dell'OTA contiene testi elettronici di ambito letterario e saggistico, oltre ad alcune opere di riferimento standard per la lingua inglese (ad esempio il British National Corpus, il Roget Thesaurus).

I testi pubblicati dall'OTA sono in massima parte collocabili nell'area culturale anglosassone, ma non mancano testi latini, greci e in altre lingue nazionali (tra cui l'italiano). I testi che vengono distribuiti liberamente su Internet sono tutti codificati in formato SGML, e sono stati tutti uniformati alle specifiche della TEI. Si tratta di edizioni altamente qualificate dal punto di vista filologico, che rappresentano una importante risorsa di carattere scientifico, specialmente per la comunità umanistica.

L'OTA ospita circa 1300 testi, solo una parte dei quali, come si è accennato, distribuiti tramite FTP server. Degli altri, alcuni possono essere ordinati tramite posta normale, fax o e-mail (informazioni e modulo di richiesta sono nel file 'textarchive.info' reperibile presso l'archivio); altri, per motivi di copyright, possono essere consultati solo presso il centro informatico di Oxford. Il catalogo dell'OTA è presente sul sito FTP, e specifica per ogni testo il tipo di disponibilità (il nome del file, in formato ASCII, è 'textarchive.list').

Electronic Text Center

L'Electronic Text Center (ETC) ha sede presso la University of Virginia. Si tratta di un centro di ricerca che ha lo scopo di creare archivi di testi elettronici in formato SGML, e di promuovere lo sviluppo e l'applicazione di sistemi di analisi informatizzata dei testi. Tra le varie iniziative lo ETC ha realizzato una biblioteca on-line, che ospita molte migliaia di testi. La biblioteca consiste di diversi progetti, non tutti liberamente consultabili al di fuori della rete universitaria.

Lo ETC usa una tecnologia molto avanzata per realizzare la sua biblioteca. I testi sono tutti memorizzati in formato SGML/TEI, in modo da garantire il livello scientifico delle basi di dati, e vengono gestiti da un sistema software molto potente, PAT, un motore per la ricerca di informazioni specificamente creato per testi codificati attraverso SGML. Per permettere la consultazione e la ricerca delle basi dati su World Wide Web, viene usato un gateway tra PAT e il server Web, che traduce istantaneamente i testi dal formato SGML/TEI al formato HTML. In questo modo è possibile mettere a disposizione degli utenti di Internet un sistema di pubblicazione e di analisi dei testi elettronici che la classica tecnologia Web non sarebbe assolutamente in grado di offrire.

La biblioteca contiene testi in diverse lingue: inglese, francese, tedesco, latino; di recente sono stati resi disponibili anche testi in giapponese. Come detto, solo alcune collezioni sono liberamente consultabili al di fuori dell'Università: tra queste la Modern English Collection, con oltre 1500 titoli, che contiene anche illustrazioni e immagini di parte dei manoscritti; la Middle English Collection; la Special Collection, dedicata ad autori afro-americani; la raccolta British Poetry 1780-1910.

Tutte le risorse offerte dallo ETC, oltre ad una serie di informazioni scientifiche, sono raggiungibili attraverso la home page su World Wide Web, il cui indirizzo è http://etext.lib.virginia.edu. Il sito ospita anche una versione elettronica delle tremila pagine di specifiche della Text Encoding Initiative, della quale la biblioteca digitale dell'ETC è una delle migliori applicazioni.

Alcuni altri progetti

Sulla spinta del capostipite Gutenberg, sono nati una serie di progetti simili, dedicati ad altre letterature nazionali.

L'omonimo progetto Gutenberg per la letteratura tedesca, ad esempio, si trova all'indirizzo http://gutenberg.informatik.uni-amburg.de/gutenb/home.htm.

Il progetto Runeberg per le letterature scandinave è uno dei maggiori archivi europei di testi elettronici. Contiene infatti oltre cento tra classici letterari e testi folcloristici provenienti da Svezia, Norvegia e Danimarca. I testi sono consultabili on-line su World Wide Web all'indirizzo http://www.lysator.liu.se/runeberg/Main.html.

Il progetto ABU (Association des Bibliophiles Universels, nome anche dell'associazione che lo cura, tratto dal romanzo di Umberto Eco Il pendolo di Foucault) sta realizzando un archivio di testi della letteratura francese. Fino ad ora possiede un archivio di 42 classici tra cui opere di Molière, Corneille, Voltaire, Stendhal, Zola, nonché una trascrizione della Chanson de Roland, nel manoscritto di Oxford. ABU, come il progetto Manuzio, sta accogliendo contributi originali donati da autori viventi, e alcune riviste. Il progetto ABU ha una pagina Web all'indirizzo http://www.cnam.fr/ABU/, dalla quale è possibile consultare on-line parte dei testi archiviati; la stessa pagina contiene anche un elenco di altre risorse su Internet dedicate alla cultura ed alla letteratura francese. L'intera biblioteca è invece reperibile sul server FTP ftp.cnam.fr nella directory ABU.

Vi sono poi molte iniziative in ambito accademico volte alla creazione di archivi di testi elettronici con finalità di ricerca, per la massima parte gestite da università o centri di ricerca negli Stati Uniti. Il Center for Electronic Texts in the Humanities (CETH), fondato dalle università statunitensi di Rutgers e di Princeton con lo scopo di coordinare le ricerche e gli investimenti nell'utilizzazione dei testi elettronici in ambito umanistico, sta realizzando una grande biblioteca virtuale di testi della letteratura anglosassone in formato SGML, e cura anche un catalogo di testi elettronici (Rutgers Inventory of Electronic Texts in the Humanities). Il CETH e il Rutgers Inventory of Electronic Texts in the Humanities sono su Web all'indirizzo http://cethmac.princeton.edu.

Molto importante è anche lo Institute for Advanced Technology in the Humanities (IATH), con sede presso la University of Virginia at Charlottesville, uno dei maggiori centri di ricerca per l'informatica umanistica. Il server Web dello IATH, il cui indirizzo è http://jefferson.village.virginia.edu/, ospita diversi progetti, tra i quali il Rossetti Archive, dedicato al pittore e poeta preraffaellita, nonché una importante rivista culturale pubblicata interamente in formato elettronico sulla quale torneremo in seguito, Postmodern Culture.

Tra i grandi archivi testuali in area anglosassone possiamo ancora ricordare lo Women Writers Project, sviluppato presso la Brown University, che raccoglie testi della letteratura femminile inglese dal Trecento all'epoca vittoriana, anch'essi interamente in formato TEI. L'indirizzo è http://www.stg.brown.edu/projects/wwp/wwp_home.html.

La Humanities Text Initiative, con sede presso la University of Michigan, cura una serie di progetti, tra i quali l'American Verse Project, che contiene testi di poeti americani precedenti al 1920. Le opere, in formato SGML, possono essere consultate on-line su pagine Web, o trasferite su disco per essere lette con browser SGML come Panorama. L'indirizzo dello HTI è http://www.hti.umich.edu.

Per la letteratura francese è invece di grande importanza il progetto ARTFL (Project for American and French Research on the Treasury of the French Language), supportato dal Centre National de la Recherche Scientifique e dalla University of Chicago, che permette la consultazione on-line di un database contenente oltre duemila testi sia letterari che non letterari, sui quali è possibile effettuare ricerche e spogli lessicali (non è invece possibile prelevare i file contenenti i testi). L'indirizzo Web del progetto ARTFL è http://tuna.uchicago.edu/ARTFL.htm.

Ricordiamo, infine, il Dartmouth Dante Project, un progetto tra i più antichi, che, come si evince dal nome, è dedicato specificamente agli studi danteschi. Il database contiene allo stato attuale, insieme all'opera omnia del poeta, i testi di molti fra i commenti danteschi redatti prima del nostro secolo. La banca dati è raggiungibile via telnet, all'indirizzo library.dartmouth.edu: per consultare il Dante Project bisogna digitare nella schermata iniziale 'CONNECT DANTE'.

Editoria elettronica in rete

L'esperienza delle biblioteche virtuali di cui abbiamo parlato in questi paragrafi rappresenta una esemplificazione paradigmatica di un più vasto fenomeno, quello della editoria elettronica in rete. E se le biblioteche digitali hanno lo scopo di trasportare il patrimonio testuale delle varie culture nel nuovo medium di diffusione digitale, si vanno moltiplicando anche gli esempi di pubblicazioni che nascono direttamente su Internet.

Alcuni settori specializzati dell'editoria, come l'editoria scientifica, trovano in questa tecnologia una risposta a problemi come la velocità di circolazione e la necessità di una diffusione il più ampia possibile. Per questa ragione moltissime pubblicazioni specializzate affiancano edizioni elettroniche alle tradizionali versioni stampate. In molti casi queste ultime svolgono esclusivamente la funzione di sanzionare ufficialmente i lavori pubblicati, mentre la vera comunicazione scientifica è delegata alle edizioni in rete.

Ma accanto a queste esperienze più propriamente scientifiche, su World Wide Web esistono anche esempi di scrittura creativa, alcuni dei quali sono dei veri e propri tentativi di creazione collettiva, simile alle sperimentazioni delle avanguardie letterarie di questo secolo. Per averne un'idea, si può consultare uno dei cataloghi più completi sulla narrativa ipertestuale in rete, la pagina Hyperizons (http://www.duke.edu/~mshumate/hyperfic.html) realizzata da Michael Shumate. Certamente non tutte queste sperimentazioni offrono delle esperienze estetiche particolarmente esaltanti, ma alcune sono senz'altro interessanti.

Ma accanto alle possibilità e alle promesse sopra delineate, l'editoria elettronica presenta anche limiti e problemi che è bene aver presenti.

In primo luogo, la leggibilità di un testo su schermo è - allo stato attuale - poco soddisfacente e non prolungabile per i tempi necessari alla consultazione o alla lettura di opere complete. Inoltre i computer (anche quelli portatili) sono scomodi da trasportare. Insomma: per la lettura tradizionale di un testo è per ora assai meglio un buon libro.

In secondo luogo, la tecnologia utilizzata attualmente su World Wide Web non consente una adeguata rappresentazione di fenomeni testuali complessi, anche se la diffusione della codifica SGML costituisce una prima risposta a questo tipo di problemi. Le applicazioni SGML sono state finora scarsamente diffuse a causa dell'ingente costo dei programmi in grado di sfruttarne le caratteristiche (Dynatext, e PAT sono i rappresentanti più noti di questa classe di strumenti). Si può prevedere che la sua inclusione tra i protocolli standard su Internet e la diffusione di programmi come SoftQuad Panorama possano contribuire a modificare la situazione.

Un ultimo aspetto problematico da sottoporre alla riflessione è costituito dalla certificazione del testo elettronico. Il problema della identificazione univoca di un testo elettronico in un ambiente di rete come Internet è assai complesso da risolvere. La tecnologia di riferimento attuale, basata sull'indirizzo URL, non è infatti in grado di identificare propriamente un documento: quella che viene identificata è piuttosto una locazione logica su un certo computer. È stata proposta una soluzione più evoluta, basata sull'uso di uno Uniform Resource Number, ma attualmente si trova ancora in fase sperimentale.

Il problema tecnico della certificazione di un testo elettronico è strettamente collegato a quello normativo ed economico della proprietà intellettuale. Il sistema tradizionale di copyright infatti, nato ed evolutosi con la stampa, non è applicabile ad un ambiente in cui la riproduzione di un testo e la sua diffusione sono, a costi irrisori, alla portata di tutti. Si tratta di questioni complesse, attualmente oggetto di grande interesse e di molteplici iniziative da parte di enti internazionali di standardizzazione, grandi associazioni come l'IFLA ed aziende che intendono far uscire l'editoria elettronica on-line dalla sua fase sperimentale.

L'edicola: giornali e riviste elettroniche

Una finestra su Internet per i giornali tradizionali

Da leggere, in rete, non ci sono solo libri; esiste ormai un vasto panorama di pubblicazioni di tipo giornalistico realizzate e diffuse attraverso Internet: riviste amatoriali, notiziari, ma anche riviste accademiche ed addirittura quotidiani. Sono sempre più numerose le testate giornalistiche che fanno la scelta di distribuire in rete una versione elettronica del proprio prodotto. Fra i soli quotidiani italiani possiamo citare: "Alto Adige", "l'Avvenire", il "Corriere della Sera", la "Gazzetta dello Sport", "Il Giornale", "Il Giorno", "Libertà", "il Manifesto", "la Repubblica", il "Sole 24 Ore", "la Stampa", "l'Unione Sarda", "l'Unità"; fra i periodici troviamo, oltre a testate specialistiche e di settore, riviste quali "L'Espresso", "Panorama", "Famiglia Cristiana", "Internazionale"; una lista aggiornata di quotidiani e riviste on-line, sia italiani che stranieri, è ospitata dalla "Città Invisibile" all'indirizzo http://www.citinv.it/iniziative/info/edicola.html.

Che cosa spinge un editore a promuovere la pubblicazione elettronica del proprio giornale, considerando che la maggior parte dei giornali presenti in rete sono fruibili gratuitamente?

In parte, la spiegazione è senz'altro nel fenomeno-Internet: apparire su Internet significa essere all'avanguardia, con un immediato ritorno d'immagine. Ma questa spiegazione 'pubblicitaria' non basta: dietro questo immediato vantaggio le ulteriori potenzialità sono molte e tali da far prevedere, in un prossimo futuro, una radicale trasformazione della distribuzione e della commercializzazione dell'informazione giornalistica. Non è un azzardo ipotizzare che con la continua espansione del bacino d'utenza della rete, e con l'avvento della moneta elettronica, Internet aprirà nuove frontiere commerciali anche all'editoria. La possibilità di accumulare esperienze preziose per poter affrontare con le giuste competenze le leggi di un nuovo mercato è sicuramente, allo stato attuale, uno degli stimoli più forti per l'editore elettronico.

Ma che cosa cambierà con l'avvento del giornale elettronico? Basta una rapida riflessione per rendersi conto di alcune conseguenze di estremo rilievo: i costi di pubblicazione saranno ad esempio ridotti sensibilmente, e gran parte della mastodontica organizzazione distributiva necessaria alla diffusione capillare di un giornale diventerà inutile. Inoltre, il giornalista della carta stampata potrà recuperare gran parte del terreno perduto rispetto a media più tempestivi come la televisione e la radio. Aggiornare le notizie in tempo reale non comporterà più i gravi problemi di impaginazione presenti nel giornale tradizionale; e la preparazione di un'edizione speciale dedicata ad un evento improvviso non implicherà più un ritardo obbligato rispetto alle testate radiotelevisive. Se consideriamo anzi che spesso i radiogiornali e i telegiornali presuppongono una stesura scritta delle notizie lette (e che queste stesure sono normalmente redatte in formato elettronico), i giornali via Internet - in grado di integrare automaticamente, ad esempio, notizie di agenzia - potrebbero rivelarsi addirittura più immediati della radio e della televisione. E non stupisce, anche in questa luce, la sempre più massiccia presenza di agenzie stampa on-line (ricordiamo gli esempi della Reuter e in Italia dell'ANSA).

Ma i vantaggi decisivi sono forse quelli dell'integrazione multimediale e dell'interattività. Finora, nella distribuzione dell'informazione giornalistica, il testo scritto è stato accompagnato solo dalle poche immagini, statiche, rese possibili dall'impaginazione di un giornale. E d'altro canto la televisione e la radio sono state penalizzate dalla sequenzialità del messaggio: mentre il lettore di un giornale poteva scegliere con un colpo d'occhio quali articoli leggere e quali tralasciare, lo spettatore di un telegiornale poteva al massimo usare il telecomando, aspettando di trovare trattato da qualcuno l'argomento di suo interesse. Lo strumento elettronico non ha nessuno di questi limiti: testo, parlato e immagini (statiche e in movimento) possono essere integrate senza fatica, e a disposizione dell'utente possono essere messe quantità enormi di informazione, a condizione di fornire strumenti di navigazione e di selezione agili e amichevoli.

Va sottolineato, infine, il vantaggio ambientale derivante dal non dover ricorrere alla cellulosa vegetale e agli sbiancanti chimici necessari per la pubblicazione dei giornali tradizionali, utilizzando invece risorse tecnologiche preesistenti, e quindi in un certo senso 'riciclate'.

Varare la versione Internet di un giornale rappresenta dunque al momento soprattutto una prima presa di contatto e una prima sperimentazione di tecnologie che rivoluzioneranno il mercato dell'informazione.

Giornali nati per la rete

Se è vero che la rete potrà in un prossimo futuro aprirsi a una nuova forma di editoria, dotata di risvolti commerciali di primaria importanza, va anche detto che l'editoria elettronica in rete, proprio grazie all'annullamento dei grossi costi di distribuzione e realizzazione tipografica, rappresenta un modo per dar voce a realtà sociali, politiche e culturali che avrebbero difficoltà ad emergere nel panorama editoriale tradizionale. La possibilità di raggiungere un grande pubblico con investimenti minimi ha stimolato la nascita di periodici del tutto nuovi, nati esclusivamente o principalmente per la diffusione telematica. Una delle più famose è la ormai notissima "Postmodern Culture" (http://jefferson.village.virginia.edu/pmc/contents.all.html) edita dalla Oxford University Press. PMC è una delle prime riviste elettroniche di fama internazionale (la sua distribuzione è iniziata nel settembre del 1990 attraverso BitNet).

figura 75
figura 75: L'edizione WWW di "Postmodern Culture", giornale di critica letteraria ed estetica contemporanea

In Italia è particolarmente apprezzata la rivista "By The Wire" (http://www.inet.it/btw/home.html), che compie una analisi attenta delle innovazioni tecnologiche della rete e delle loro implicazioni sociologiche. "Beta" (http://www.mclink.it/n/beta/home/index.html) è invece una rivista tecnica on-line che fornisce preziosi consigli sull'uso e sulla programmazione dei computer. "Delos" è una pubblicazione editorialmente molto curata e dedicata agli appassionati di fantascienza (l'indirizzo è http://www.mclink.it/n/delos/index.htm). Ricordiamo infine che da pochissimo ha affiancato alla edizione cartacea una edizione in rete la rivista "Studi Storici", (http://www.liberliber.it/biblioteca/riviste/studistorici/), che affronta con rigoroso taglio scientifico importanti problemi storiografici.

Giornali on demand

Uno dei nuovi orizzonti offerto dall'editoria in rete è la possibilità di personalizzare - nel senso più stretto del termine - la vendita dell'informazione. Grazie all'interattività consentita dagli strumenti telematici, l'utente potrà 'costruire' il proprio giornale in maniera da acquistare, e quindi leggere, solo le notizie che lo interessano realmente, senza perdersi nel 'rumore di fondo' di decine di articoli non pertinenti. E potrà farlo attingendo a più fonti giornalistiche (a più testate) contemporaneamente.

Un esempio interessante, anche se ancora abbondantemente al di sotto delle potenzialità del mezzo telematico, è offerto (gratuitamente) dal servizio Crayon. Si tratta di un progetto sperimentale curato da due ricercatori della Bucknell University, Dave Maher e Jeff Boulter. Attraverso un modulo in linea (raggiungibile all'indirizzo http://crayon.net) l'utente può scegliere a quali fonti informative attingere (naturalmente scelte fra quelle disponibili su Internet): tra quelle americane sono comprese ad esempio "CNN", "New York Times", "USA Today", "ABC"; sono poi presenti giornali e riviste locali, fonti di informazione internazionali (dai giornali Neozelandesi a quelli Islandesi, dal "Financial Times" al "Jerusalem Post"), agenzie, giornali e riviste specializzate in campo culturale o sportivo, servizi di previsioni del tempo, singoli editorialisti, e addirittura la cronaca rosa e le strisce di fumetti.

Una volta completata la selezione, viene generata automaticamente una pagina HTML, che può essere salvata e utilizzata come 'trampolino di lancio' verso tutte le fonti informative indicate: una sorta di 'indice di risorse' costruito interattivamente. Tuttavia, la navigazione all'interno di questi siti è lasciata all'utente: il programma non permette una vera e propria selezione dell'informazione.

Un tipo diverso di giornale on demand - più vicino a quelli che potranno essere gli sviluppi futuri di questo tipo di offerta informativa - è offerto dall'"Unione Sarda" (alla URL http://www.vol.it/UNIONE/personal_UNIONE.html). In questo caso, la selezione si basa su un elenco di parole chiave fornite dall'utente attraverso un file di filtro. Si realizza in tal modo una sorta di 'Eco della stampa' personale: tutti gli articoli nei quali compare almeno una delle parole chiave citate entreranno a far parte del nostro giornale personalizzato. Il limite dell'iniziativa è nel fatto che la selezione riguarda solo gli articoli pubblicati dall'"Unione Sarda".

Il futuro di questo tipo di applicazioni è nella fusione di queste due possibilità: scelta delle fonti di informazione, e contemporaneamente scelta (ad esempio attraverso parole chiave) degli argomenti che ci interessano. Un giornale personalizzato di questo tipo non è troppo lontano: i problemi principali da risolvere sono da un lato quelli relativi al ritorno economico (per sopravvivere, il servizio dovrebbe probabilmente essere a pagamento, anche se la vastità del pubblico potenziale garantirebbe costi assai limitati per l'utente finale), dall'altro quelli relativi all'adozione di standard uniformi nei database delle varie risorse informative (condizione indispensabile perché un singolo motore di ricerca possa interrogarli tutti in maniera efficiente). Ma ci sentiamo di prevedere che nel prossimo futuro gli esperimenti in questo campo cresceranno di numero e di interesse.

Segnaliamo soltanto, per chiudere, che una strategia alternativa può essere costituita dalla predisposizione di programmi client da installare sul nostro computer (anziché da raggiungere attraverso World Wide Web), in grado di effettuare per noi collegamenti e ricerca di informazioni. Un esempio davvero interessante, apparso all'inizio del 1996, è il client Pointcast Network (è possibile scaricarlo gratuitamente alla URL http://www.pointcast.com/). Il programma mette a disposizione una interfaccia grafica assai piacevole, e lavora 'in sottofondo' (possiamo usarlo mentre facciamo altre navigazioni) per creare e tenere aggiornato un database di notizie di agenzia nei campi più disparati, dalla politica internazionale alle previsioni del tempo. Le possibilità di selezione sono ancora piuttosto rudimentali, ma chi volesse farsi un'idea del futuro dell'informazione giornalistica personalizzata dovrebbe senz'altro provare PCN.

Ricerche d'archivio

Altro grande vantaggio dei giornali in rete è la possibilità di fare ricerche full text sugli articoli pubblicati, compresi quelli dei numeri arretrati. Archivi elettronici di questo tipo sono offerti ad esempio in Italia dall'"Unione Sarda" (all'indirizzo http://www.vol.it/UNIONE/wais_UNIONE.html) o dal "Manifesto" (http://www2.mir.it/cgi-bin/wwwwais.it ; il servizio riguarda solo l'ultima settimana del giornale), in entrambi i casi basati su in sistema di ricerca di tipo WAIS. L'archivio on-line dell'Unità (http://www.mclink.it/unita/) si basa invece sul motore di ricerca fornito dal servizio Excite!, del quale si è già parlato discutendo della ricerca su World Wide Web. I quotidiani del gruppo Rizzoli-Corriere della Sera mettono a disposizione un servizio, denominato "Globnet" (http://globnet.rcs.it), che comprende un motore di ricerca in grado di lavorare su un archivio assai ampio (dal 1984 in poi). Per utilizzarlo è però prevista una registrazione piuttosto cara (nell'aprile 1996, i prezzi variavano fra 750.000 e 2.500.000 lire l'anno a seconda del numero di ricerche previste per ogni mese). Gratuita è invece, al solito, la consultazione degli ultimi numeri. Il "Sole 24 Ore" prevede anch'esso di rendere accessibile attraverso Internet la propria banca dati BIG on-line: per informazioni, tenete d'occhio la pagina http://www.sole24ore.iol.it/big/ . È probabile che lo stesso farà "La Stampa" (http://www.lastampa.it/). A regime, entrambi i servizi dovrebbero essere a pagamento.

In ambito internazionale, estremamente interessante è il progetto della UMI (una società del gruppo Bell&Howell fra le più importanti nel settore della documentazione elettronica). Forte di un database di diciassettemila periodici, settemila giornali e tredicimila articoli scientifici, che include il full-text di quotidiani quali "New York Times" e "Financial Times", la UMI ha sviluppato un software proprietario, denominato ProQuest Direct, in grado di effettuare ricerche assai sofisticate (che includono la visualizzazione di grafici e fotografie inserite nel database). Grazie ad un accordo con la Netscape Communication, ProQuest Direct dovrebbe essere integrato (come plug-in o direttamente a livello di programma) nelle versioni finali di Netscape 3.0. Anche in questo caso, l'accesso alle informazioni più recenti della base dati UMI sarà probabilmente gratuito, e funzionerà da richiamo promozionale per l'accesso (a pagamento) alla base dati completa. Per saperne di più, la URL è http://www.umi.com.

Sicuramente, anche questo settore - che offre notevoli potenzialità economiche- conoscerà un rapido sviluppo nei prossimi mesi; le brevi indicazioni fin qui fornite non costituiscono dunque in alcun modo un elenco esaustivo di risorse, ma hanno invece un valore prevalentemente esemplificativo e di indicazione di possibili linee di tendenza.

Il museo: mostre e gallerie in rete

Nel panorama della rete si può incontrare, accanto alle biblioteche, alle edicole e agli shop-center di vario tipo, anche un'altra importantissima tipologia di edifici virtuali: i musei e le gallerie d'arte.

I musei che dispongono di pagine su Internet sono molti (un elenco aggiornato è accessibile all'indirizzo http://www.comlab.ox.ac.uk/archive/other/museums/world.html). Fra gli esempi a noi più vicini sono i musei ospitati dalla Selfin (http://www.selfin.it/musei/; l'elenco comprende il Museo di Capodimonte, la Galleria nazionale dell'Umbria, il Museo nazionale di arti e tradizioni popolari) e il sito, fra i più visitati della rete, dei Musei Vaticani (http://www.christusrex.org/).

Il Louvre (http://mistral.culture.fr/louvre/) è stato fra i primi grandi musei di fama mondiale ad affacciarsi su Internet, anche sotto la spinta di un bellissimo sito non ufficiale che riprendeva le immagini di alcuni fra i capolavori del museo parigino (http://www.paris.org.:80/Musees/Louvre/). I dirigenti del Louvre, constatata l'efficacia promozionale che poteva derivare da Internet, hanno diffidato gli organizzatori del sito non ufficiale (ne è nata una fra le prime controversie sul diritto alla diffusione delle immagini in rete) ed hanno investito in questa nuova tecnologia, curando di mettere sotto copyright le immagini elettroniche utilizzate e realizzando una serie di mirror dell'host ufficiale (peraltro, graficamente assai meno riuscito di quello 'ufficioso': una dimostrazione interessante del ruolo centrale che hanno in rete alcune risorse nate in ambito amatoriale). Su questa strada si sono poi incamminati decine di musei e gallerie d'arte di tutto il mondo.

figura 76
figura 76: I Musei Vaticani, uno dei siti più visitati di Internet

Naturalmente, accanto ai siti Web di musei già affermati non mancano le gallerie d'arte aperte all'opera di autori contemporanei, nelle quali i singoli artisti hanno la possibilità di promuovere le proprie opere esponendo in un ambiente virtuale accessibile al vasto pubblico della rete. In Italia una delle prime è stata la 'Galleria virtuale Roma 2001' ospitata da MC-link.

Vi sono poi - come nel caso delle riviste elettroniche - iniziative nate interamente in rete e prive di qualsiasi corrispettivo nel mondo 'reale'. E in alcuni casi è Internet stessa - e attraverso Internet la vasta tematica di riflessione collegata al ruolo dell'arte digitale e alla sua infinita riproducibilità e modificabilità - a diventare non solo luogo ma anche oggetto del lavoro artistico. Interessante in proposito l'iniziativa del Design Research Centre (DRC) di Derby (http://dougal.derby.ac.uk:80/gallery/), suggestiva raccolta di opere interamente frutto della rielaborazione di materiale reperito in rete.

figura 77
figura 77: il sito WWW del Design Research Centre offre interessanti spunti di riflessione sul rapporto fra l'immaginario digitale e quello analogico


Note:
01 Nell'ambito degli studi di trattamento automatico dei testi viene usata questa espressione per indicare un testo archiviato su un qualsiasi supporto elettronico in forma digitale.
02 La suddivisione attuale è la seguente: Arte, Atti pubblici, Classici, Giornali e riviste, Letteratura contemporanea, Letteratura per l'infanzia, Saggistica e manuali, Tesi di laurea.

torna a inizio pagina