Vai alla home page ufficiale di 'Internet, manuale per l'uso della rete'

Indice Premessa
Introduzione La telematica
Come funziona Il collegamento
Come si naviga E-mail
Newsgroup FTP
Telnet Gopher
WWW Tempo reale
Nuove frontiere La ricerca
Risorse Il sociale
Mercato globale HTML
Glossario Bibliografia

vai alla parte 2... Risorse e percorsi di ricerca parte 1 di 2

16 Risorse e percorsi di ricerca

  • La biblioteca
  • Internet come fonte di informazione bibliografica
  • I cataloghi bibliotecari accessibili attraverso la rete
  • Il Servizio Bibliotecario Nazionale
  • Un sistema alternativo per trovare la biblioteca che cercate: Hytelnet
  • I cataloghi editoriali
  • Strumenti alternativi di diffusione selettiva dell'informazione: il servizio Uncover
  • Altre risorse di interesse bibliotecario
  • Internet e le biblioteche digitali
  • Dal testo elettronico alla biblioteca digitale
  • Le biblioteche digitali su Internet
  • Progetto Gutenberg
  • Progetto Manuzio
  • Altri progetti volontari
  • Oxford Text Archive
  • Electronic Text Center
  • Altri progetti accademici
  • L'edicola: giornali e riviste elettroniche
  • Una finestra su Internet per i giornali tradizionali
  • Ricerche d'archivio
  • Il giornale 'on-demand'
  • Le pubblicazioni nate per la rete
  • Il museo: l'arte in rete
  • Musei e gallerie virtuali
  • I siti creativi

  • Questo capitolo del libro vuole fornire al lettore, ormai abile navigatore, quella che potremmo descrivere come una carta nautica in cui sono segnati alcuni dei porti principali nell'oceano informativo della rete.

    Per molte ragioni, non ultima quella dello spazio, abbiamo preferito evitare le solite 'pagine gialle' della rete, rassegne più o meno complete dei siti più interessanti presenti su Internet nei vari settori disciplinari. Rassegne di questo tipo invecchiano immediatamente, e il numero delle risorse da segnalare impedisce comunque ogni approfondimento. Ci è sembrato più utile individuare alcune metarisorse che potessero risultare di interesse generale, che potessero cioè attirare l'attenzione di tutti, indipendentemente dagli interessi specifici di studio e di lavoro.

    Nel fare questa scelta abbiamo pensato di usare come punti di riferimento tre istituzioni che, nel mondo degli atomi, per usare la metafora resa celebre da Nicholas Negroponte, svolgono la funzione di organizzare e divulgare il sapere e le informazioni agli individui ed alla società: la biblioteca, l'edicola e il museo.

    Come si trasformano questi luoghi della comunicazione sociale quando si trasferiscono nel mondo dei bit? Non intendiamo certamente affrontare il dibattito sulle biblioteche digitali, o sui musei virtuali, dal punto di vista teorico. Ciascuno di questi argomenti è così vasto, e solleva tali e tante questioni, che richiederebbe un libro intero. Più modestamente abbiamo cercato di individuare in che modo, qui e ora, su Internet singoli individui, organizzazioni e istituzioni stanno concretamente sperimentando le possibilità che la rete apre per la diffusione del sapere. Nel farlo, abbiamo anche cercato di evidenziare gli aspetti che, a nostro parere, sembrano più interessanti, e di accennare ai grandi temi sollevati dalle esperienze attualmente in corso.

    La biblioteca

    Una delle metafore ricorrenti per descrivere il fenomeno Internet è quella della biblioteca. Come una biblioteca, lo spazio digitale della rete contiene una quantità enorme di testi, documenti, informazioni; come una biblioteca ha i suoi cataloghi, i suoi soggettari; più di una biblioteca, è dotato di potenti strumenti di ricerca dell'informazione.

    Internet insomma, sembra realizzare, per mezzo della tecnologia, il mito della biblioteca universale, che accompagna l'umanità da diversi secoli. Ancora di più, Internet assomiglia alla fantastica Biblioteca di Babele immaginata da Jorge Luis Borges in uno dei suoi racconti più belli, una biblioteca che coincide con l'universo stesso. In effetti, in un senso importante, l'universo della rete è l'informazione che contiene.

    Sebbene sembri un gioco di parole, tra le risorse informative che sono disponibili in questa nuova Alessandria digitale fanno bella mostra di sé proprio le biblioteche, quelle del mondo reale. L'incontro tra Internet e biblioteche ha ormai una storia assai lunga, ed è stato fortemente agevolato dallo stretto legame che la rete ha avuto con il mondo universitario.

    Si possono individuare due momenti, distinti dal punto di vista logico e cronologico (anche se non mancano le eccezioni), in cui questo rapporto si è articolato. In una prima fase, ad essere immessi sulla rete sono stati quei servizi bibliotecari già sottoposti a processi di automazione più o meno avanzata, a partire dalla consultazione dei cataloghi. Attualmente moltissime biblioteche, grandi e piccole, universitarie e pubbliche, hanno un loro sito su Internet, e danno agli utenti la possibilità di consultare online i cataloghi dei testi disponibili.

    Il secondo momento del rapporto tra Internet e biblioteche ha portato invece alla nascita delle prime biblioteche digitali. Con questa suggestiva denominazione ci si riferisce alle varie esperienze e progetti che producono, organizzano e mettono a disposizione sulla rete, in vario modo, trascrizioni elettroniche dei documenti che la nostra cultura ha prodotto nel passato, produce nel presente e (auspicabilmente) continuerà a produrre in futuro.

    Oggi il tema delle biblioteche digitali è al centro dell'interesse della comunità scientifica internazionale, e, specialmente negli Stati Uniti, attira grandi progetti di ricerca e notevoli finanziamenti. Ma in questo settore, come spesso è avvenuto su Internet, le prime iniziative sono nate al di fuori di luoghi istituzionali, ad opera del volontariato telematico. Novelli copisti, che, nell'era digitale, hanno ripercorso le orme dei monaci medievali, i quali salvarono il patrimonio culturale dell'antichità, e dei primi grandi stampatori che, a cavallo tra Quattro e Cinquecento, diedero inizio all'era della stampa. E non è un caso che alcuni di questi progetti abbiano scelto di onorare questa ascendenza, intitolandosi con i nomi di quei lontani maestri: Johannes Gutenberg, Aldo Manuzio.

    Internet come fonte di informazione bibliografica

    La consultazione dei cataloghi informatizzati è, senza dubbio, il più diffuso tra i servizi che le biblioteche offrono ai loro utenti attraverso Internet. La rete è diventata ormai la più preziosa fonte di informazioni bibliografiche. Oggi è possibile stilare una bibliografia ragionevolmente completa, su qualsiasi argomento, stando comodamente seduti a casa davanti al proprio computer. Questo ha trasformato le modalità di lavoro della comunità scientifica, e più in generale di tutti coloro che per passione o professione debbano reperire notizie su libri e periodici.

    Un catalogo bibliotecario consultabile attraverso i canali di comunicazione telematici viene comunemente definito Online Public Access Catalog (OPAC). La diffusione di queste risorse è facilitata dal fatto che, ormai da molti anni, un gran numero di biblioteche ha adottato sistemi di catalogazione informatizzata, affiancandoli o, talvolta, sostituendoli ai tradizionali schedari cartacei.

    L'introduzione dei sistemi informatici ha anche stimolato la collaborazione e l'interscambio tra le biblioteche, evidenziando la necessità di standard di riferimento nella costruzione di risorse su supporto digitale. La comunità internazionale dei bibliotecari ha dunque definito una serie di specifiche per facilitare la rappresentazione, lo scambio e la consultazione da parte degli utenti delle informazioni bibliografiche. La più importante tra queste specifiche riguarda senza dubbio la struttura logica e il formato dei record catalografici.

    Come alcuni lettori sapranno, un database è costituito da una serie di schede (record), divise in campi. Ogni scheda contiene la descrizione, organizzata per campi, di un oggetto: nel nostro caso un libro. Il formato standard internazionale per i record catalografici si chiama UNIMARC (Universal Machine Readable Catalogue).

    Purtroppo per gli utenti, non esistono delle raccomandazioni altrettanto unitarie sulle caratteristiche dell'interfaccia di interrogazione. In generale tutti gli OPAC permettono di effettuare ricerche usando come chiavi le principali intestazioni presenti in una normale scheda catalografica: autore, titolo, soggetto. Alcuni forniscono anche altre chiavi o filtri di ricerca, quali data o luogo di pubblicazione, editore, classificazione (nei vari sistemi Dewey, CDU, LC, etc.), codice ISBN.

    Accanto ai cataloghi, su Internet sono disponibili molte altre risorse di interesse bibliotecario. Si va dai siti che offrono documentazione e manualistica su tematiche di biblioteconomia e documentalistica, ai servizi specialistici come i servizi di catalogazione centralizzata e i servizi di rassegna delle pubblicazione periodiche, come il progetto Uncover.

    I cataloghi bibliotecari accessibili attraverso la rete

    I servizi bibliotecari accessibili attraverso Internet sono oltre un migliaio, ed è ovviamente impossibile elencarli tutti. La maggiore concentrazione di biblioteche dotate di accessi tramite Internet è sicuramente negli Stati Uniti, ma ci sono anche molte biblioteche europee, un certo numero delle quali italiane.

    Dal punto di vista delle tecnologie di rete, fino a poco tempo fa la maggior parte degli OPAC erano accessibili solo tramite sessioni telnet. Attualmente moltissime biblioteche hanno sviluppato dei gateway tra i loro database catalografici e i server gopher o HTTP. Queste tecnologie permettono di consultare le banche dati direttamente dalle pagine grafiche di World Wide Web, attraverso moduli interattivi, o dai menu di un client gopher.

    Alcune reti di biblioteche, specialmente quelle del circuito universitario degli Stati Uniti, permettono all'utente (studente o ricercatore) di accedere anche ai servizi di prestito interbibliotecario. Inoltre, accanto agli OPAC veri e propri, moltissime biblioteche hanno attivato siti su Web che offrono informazioni aggiuntive, come indirizzi, orari di accesso, descrizione delle collezioni, notizie sulle iniziative culturali organizzate nei locali dell'istituzione.

    Un elenco aggiornato delle biblioteche di tutto il mondo che offrono sevizi OPAC è il 'metacatalogo' Libweb realizzato alla University of Berkeley, in California. L'indirizzo è http://sunsite.berkeley.edu/Libweb. L'elenco è diviso per aree geografiche (Stati Uniti, Africa, Asia, Australia, Europa, Sud America, Canada), ed offre anche un motore di ricerca locale.

    Come detto, è impossibile rendere conto di queste risorse in modo sistematico. Ne ricordiamo dunque alcune di particolare rilievo. Senza dubbio la più importante biblioteca presente in rete è la Library of Congress di Washington. Si tratta della maggiore biblioteca degli Stati Uniti, la più grande del mondo. Nei suoi edifici sono conservati milioni di documenti e pubblicazioni in 450 lingue, oltre ad una sterminata mediateca. Il catalogo elettronico della Library of Congress è accessibile sia tramite telnet (all'indirizzo locis.loc.gov), dove mette a disposizione circa 27 milioni di record; sia attraverso Web (all'indirizzo http://www.loc.gov), sebbene in questa modalità non dia accesso a tutte le collezioni della biblioteca. La home page della Library of Congress, oltre al catalogo fornisce anche un'ingente mole di informazioni su norme e tecnologie di catalogazione e classificazione.

    Rimanendo negli Stati Uniti, segnaliamo al lettore che le biblioteche di tutte le più importanti Università sono collegate ad Internet, e offrono servizi OPAC. Ricordiamo qui, per esempio, la biblioteca di Dartmouth, raggiungibile via telnet all'indirizzo library.dartmounth.edu. In alcuni casi sono stati realizzati anche dei cataloghi interbibliotecari unificati. Ad esempio il progetto, Melvyl (il cui sito Web, molto ricco di informazioni, è all'indirizzo http://www.dla.ucop.edu) unifica i cataloghi della California State Library e di tutte le biblioteche universitarie della California. L'archivio catalografico contiene circa 9 milioni di record, ed è accessibile solo tramite telnet (melvyl.ucop.edu), ma permette all'utente di ricevere i risultati di una ricerca direttamente al proprio indirizzo di posta elettronica.

    Un altro esempio di grande risorsa bibliotecaria accessibile via Internet, questa volta situato in Europa, è il catalogo unico delle biblioteche dell'università di Oxford. Il sistema informativo di Oxford, denominato OLIS (Oxford University Libraries System) raccoglie i cataloghi informatizzati di oltre cento tra biblioteche generali, di college e di facoltà. Si può raggiungere tramite Web all'indirizzo http://www.lib.ox.ac.uk/, sebbene la consultazione dei cataloghi veri e propri per il momento possa avvenire solo tramite telnet (l'indirizzo diretto è library.ox.ac.uk). Tra le varie biblioteche di questa prestigiosa università ricordiamo la Bodleian Library, una delle maggiori biblioteche del mondo per le scienze umane, il cui catalogo elettronico è, però, limitato alle accessioni posteriori al 1988. Al momento in cui scriviamo, invece, non è ancora pubblico il catalogo OPAC della grande British Library, di recente allestito; il suo sito Web è alla URL http://www.bl.uk.

    Per quanto riguarda la Francia, ricordiamo che è accessibile via telnet il catalogo della monumentale Bibliothèque Nationale di Parigi (opale02.bnf.fr). Il sito Web di questa biblioteca, il cui indirizzo è http://www.bnf.fr, permette anche la navigazione fra mille bellissime miniature tratte da manoscritti del periodo di Carlo V (1338-1380).

    Il Servizio Bibliotecario Nazionale

    Anche in Italia esistono alcuni servizi OPAC. Il più importante in assoluto è senza dubbio il Servizio Bibliotecario Nazionale (SBN). Gestito dall'Istituto Centrale per Catalogo Unico (ICCU), SBN raccoglie e unifica i cataloghi di trecento biblioteche, suddivise in venticinque poli cittadini. Al progetto partecipano molte biblioteche universitarie, la Biblioteca Nazionale di Roma, e quella di Firenze.

    Il servizio SBN è suddiviso in diverse banche dati catalografiche, divise per tipologia di documenti, che vengono incrementate continuamente. Ricordiamo in particolare:

    • la Base Dati Indice, che è il catalogo dei testi a stampa; contiene al momento circa due milioni di record dei titoli pubblicati dal 1831 ai giorni nostri, e settecentomila record di autori;
    • il catalogo dei beni musicali, che contiene le schede relative a circa duecentomila tra edizioni e manoscritti musicali, conservati in cento tra biblioteche e archivi pubblici, ecclesiastici e privati;
    • il catalogo dei manoscritti, per ora limitato a cinquecento schede.

    Sono inoltre disponibili altri cataloghi specializzati, come quello della 'letteratura grigia', quello della Discoteca di Stato, e l'elenco di tutte le biblioteche italiane.

    Le informazioni relative al sistema SBN sono disponibili su Web all'indirizzo http://www.cineca.it/sbn/. I cataloghi generali, invece, possono essere consultati, per ora, solo tramite collegamento con emulazione di terminale TN3270; in alternativa è possibile accedere ad SBN attraverso una normale sessione telnet collegandosi all'host del Centro Interfacoltà per le Biblioteche (CIB) di Bologna, all'indirizzo biblio.cib.unibo.it, e digitando 'sbn' alla richiesta 'username' (si veda comunque la pagina http://liber.cib.unibo.it/sbn.html per ulteriori informazioni).

    Purtroppo avvertiamo il lettore che l'interfaccia del sistema SBN è assolutamente poco 'amichevole', e richiede una buona dose di pazienza per chi non sia un bibliotecario professionista (ma anche questi ultimi non si troveranno certo a loro agio!).

    Per facilitare la consultazione, alcuni dei poli cittadini di SBN hanno realizzato dei gateway tra il database SBN locale e World Wide Web. Ricordate che in questo caso non si può accedere all'intero catalogo unico, ma solo alle sezioni realizzate direttamente dal polo in questione. Ad esempio, ricordiamo qui il polo universitario bolognese, il cui indirizzo Web è http://www.cib.unibo.it/, che ha sviluppato una maschera di interrogazione molto efficace e di semplice utilizzo. Anche il polo triestino (http://www.biblio.univ.trieste.it) ha realizzato un suo gateway. Al di là di queste iniziative locali, è auspicabile che si riesca a creare anche a livello centrale un sistema di accesso al catalogo SBN tramite World Wide Web.

    Alcune biblioteche italiane hanno realizzato dei propri sistemi OPAC, dotati in taluni casi di accesso mediante Web. Un elenco di queste biblioteche, il Repertorio dei cataloghi OPAC, è ospitato presso il server Web dell'Associazione italiana biblioteche, all'indirizzo http://www.aib.it/aib/lis/opac1.htm. Nel momento in cui scriviamo, le biblioteche italiane che prevedono un accesso via Internet ai loro cataloghi e che sono riportate in questo elenco sono quasi centoventi.

    Un sistema alternativo per trovare la biblioteca che cercate: Hytelnet

    Hytelnet (in Italia è talvolta chiamato Ipertelnet) è un programma creato in Canada da Peter Scott, che permette di navigare attraverso un catalogo strutturato di siti telnet, attivando direttamente le connessioni delle quali dovessimo aver bisogno. Si tratta di un programma nato su Unix, e fornito quindi originariamente di una interfaccia a caratteri, del quale esistono versioni per tutti i principali sistemi operativi. All'inizio, Hytelnet era nato come un database generale; col passare del tempo, tuttavia, si è andato sempre più specializzando in campo bibliotecario, anche perché le biblioteche costituiscono la grande maggioranza dei siti telnet aperti all'accesso esterno.

    Cosa mette a disposizione Hytelnet? Sostanzialmente, un menu gerarchico di risorse (simile, per intendersi, a quello di un gopher), attraverso il quale si può 'scendere' all'indirizzo della singola risorsa che ci interessa. Una volta selezionate le risorse bibliotecarie, ad esempio, si può passare a quelle americane, poi a quelle statunitensi, poi ai consorzi bibliotecari, e infine al singolo catalogo — ad esempio quello del South Dakota Library Network. A questo punto, Hytelnet ci informa (ed è questa una delle sue funzioni più preziose) di quale sia la password necessaria per l'accesso pubblico al catalogo, e ci consente — se vogliamo — di collegarci direttamente alla risorsa selezionata.

    Come arrivare ad Hytelnet? Se vi collegate a Internet attraverso la shell Unix di una università, probabilmente basterà digitare 'hytelnet' al prompt. In caso contrario, dovrete installare sul vostro computer una versione del software, o (più semplicemente) raggiungere un sito pubblico che vi dia accesso. Tenete presente che Hytelnet è messo a disposizione dei propri abbonati da MC-link e da Agorà, e che in ogni caso i 'ponti' pubblici non mancano, in alcuni casi anche su World Wide Web. L'università di Cambridge ha realizzato ad esempio un gateway Hytelnet alla URL http://www.cam.ac.uk/Hytelnet/, e una ricerca con chiave 'Hytelnet' su AltaVista o su Lycos permetterà di raggiungerne molti altri.

    I cataloghi editoriali

    Accanto agli OPAC delle biblioteche, su Internet si trova anche un altro tipo di archivi che contengono informazioni bibliografiche: i cataloghi online delle case editrici. I cataloghi editoriali sono uno strumento essenziale per il bibliotecario, ma possono essere molto utili anche per uno studioso, o per un normale lettore. Essi infatti consentono di essere costantemente aggiornati sui vari titoli pubblicati.

    I tradizionali cataloghi editoriali su carta vengono rilasciati con frequenza prefissata, e molto spesso contengono informazioni molto succinte sui titoli disponibili, anche a causa degli elevati costi di stampa. I cataloghi editoriali su World Wide Web possono invece esser aggiornati in tempo reale, e sono in grado di offrire una informazione molto più completa su ciascun titolo: si va dall'immagine della copertina a riassunti o estratti di interi capitoli di un libro. Queste informazioni mettono in grado il lettore di disporre di un quadro assai aggiornato sulla qualità o sulla rilevanza di un testo. Recentemente, alcune case editrici hanno affiancato ai servizi informativi online anche dei servizi di vendita diretta on-line.

    Le case editrici che dispongono di versioni elettroniche dei loro cataloghi sono moltissime. Un elenco molto esteso degli editori che dispongono di un sito Web è consultabile attraverso Yahoo!, all'indirizzo http://www.yahoo.com/Business_and_Economy/Companies/Publishing/.

    Segnaliamo per qualità ed efficienza il catalogo della grande casa editrice statunitense Prentice Hall (http://www.prenhall.com). Le notizie bibliografiche ed editoriali sono molto complete. Inoltre dalla pagina relativa ad un titolo si può direttamente ordinare il volume, mediante il servizio di vendita della più grande libreria telematica del mondo, Amazon, su cui torneremo parlando del commercio in rete.

    Molto ben fatto anche il catalogo editoriale della O'Reilly Associates (http://www.ora.com), specializzata nelle editoria tecnica nel settore informatico; o quello della MIT Press (http://www-mitpress.mit.edu), casa editrice universitaria legata al prestigioso ateneo di Boston.

    Per quanto riguarda l'Italia, ricordiamo che anche la casa editrice Laterza, che pubblica questo manuale, ha inserito in rete il proprio catalogo (all'indirizzo http://www.laterza.it). Anche in questo caso, è possibile ordinare direttamente i volumi. La Laterza è stata anche la prima casa editrice in Italia a sperimentare l'integrazione tra testo elettronico su Web e edizione a stampa.

    Strumenti alternativi di diffusione selettiva dell'informazione: il servizio Uncover

    Fra le risorse bibliografiche accessibili attraverso Internet, una menzione particolare merita il servizio Uncover. Si tratta di una base di dati contenente lo spoglio completo di circa 17.000 riviste scientifiche internazionali, in tutti i campi dello scibile umano. Il servizio è stato avviato da un consorzio di università americane (CARL) che si è in seguito trasformato in una vera e propria società, con sede a Denver nel Colorado. Nell'agosto 1995 CARL e Uncover sono stati acquisiti dalla Knight-Ridder Information, la società responsabile di DIALOG (uno dei principali servizi per l'accesso remoto a data base in linea).

    Complessivamente la banca dati consta di circa 7 milioni di articoli, schedati per autore e titolo (in alcuni casi è presente anche un breve abstract), e cresce a un ritmo quotidiano di circa 5.000 articoli.

    La banca dati è accessibile via World Wide Web (http://www.carl.org/uncover/) e via telnet partendo dai menu principali di oltre mille biblioteche inglesi e americane (il sito telnet principale è database.carl.org). Il sito Web spiega dettagliatamente natura, finalità e costi di questo servizio. È disponibile anche un software (Personal Uncover Navigator) che si comporta come un client specifico per la consultazione di Uncover in un ambiente grafico e user-friendly.

    Il servizio di base fornito (gratuitamente) da Uncover è la ricerca sulla base dati di articoli, ricerca che può svolgersi per autore, rivista, parole chiave nel titolo o nell'abstract. Ma la caratteristica che rende Uncover una risorsa informativa davvero unica è la possibilità, una volta individuato l'articolo o gli articoli che ci interessano, di riceverne una copia in tempi brevissimi (normalmente entro 24 ore) via fax. Considerando che il progetto effettua lo spoglio delle riviste al momento della loro uscita, spesso Uncover permette di reperire e ricevere articoli molto prima dell'arrivo nelle biblioteche italiane della relativa rivista.

    Farsi trasmettere via fax un articolo ha naturalmente un costo, che si aggira in genere, fra spese fax e diritti d'autore, attorno ai 20 dollari (il pagamento è automatico, via carta di credito).

    Un altro servizio di grande interesse offerto da Uncover è la possibilità di ricevere via posta elettronica l'indice completo di ogni fascicolo delle riviste di nostro interesse, al momento dell'uscita del fascicolo stesso. In questo caso il prezzo è di 20 dollari l'anno, e permette di 'abbonarsi' all'indice elettronico di 50 riviste a nostra scelta.

    Altre risorse di interesse bibliotecario

    Su Internet esistono molte altre risorse di interesse bibliotecario. Una fonte di informazione preziosa per chi lavora in questo ambito è il sito Web della International Federation of Library Associations and Institutions (IFLA), all'indirizzo http://www.nlc-bnc.ca/ifla/home.html.

    Il server della IFLA offre una quantità enorme di notizie e documenti sulle attività di questa associazione, che coordina gli enti bibliotecari nazionali di tutto il mondo. Si possono trovare i testi delle pubblicazioni, gli atti delle conferenze internazionali, e la documentazione relativa agli standard di catalogazione e classificazione in ambito biblioteconomico e documetalistico, con particolare riguardo ad UNIMARC, del cui sviluppo l'IFLA è responsabile.

    La IFLA mantiene anche tre liste di discussione alle quali partecipano bibliotecari di tutto il mondo e che sono dedicate ai problemi relativi alla gestione e alla classificazione, sia con metodi tradizionali sia mediante strumenti informatici, dei patrimoni di biblioteche e centri di documentazione.

    Un'altra iniziativa di grande interesse per i bibliotecari, e per chi con i libri ha un rapporto professionale, è rappresentata dall'Online Computer Library Center (OCLC). Si tratta di un consorzio che raccoglie oltre ventiduemila biblioteche in tutto il mondo, e offre servizi informativi e supporto tecnologico ai suoi associati.

    OCLC fu fondato nel 1967 come centro servizi informatici centralizzato per le biblioteche dello stato americano dell'Ohio (da cui il primo nome, Ohio College Library Center). Nel 1977 ha cambiato ragione sociale, diventando una società di servizi bibliotecari internazionale, con particolare riguardo alla applicazione di tecnologie informatiche nella gestione e catalogazione delle risorse librarie e documentali.

    I servizi che OCLC offre ai suoi associati sono molti. Ma senza dubbio il più rilevante è l'OCLC Online Union Catalog (OLUC), un enorme catalogo elettronico unitario che contiene dati bibliografici su ogni genere di documento e risorsa informativa: libri, periodici, audiovisivi, mappe e materiali cartografici, manoscritti, materiali audio e file digitali. I record del catalogo sono complessivamente più di trentuno milioni (di cui oltre ventisei relativi a libri), e sono memorizzati in formato UNIMARC.

    Alla creazione del catalogo concorrono tutte le biblioteche associate. Ciascuna di esse, a sua volta, ha la possibilità di esportare sul suo sistema locale i record già presenti su OLUC. In questo modo, quando una biblioteca associata acquisisce un testo o un documento, è in grado di aggiornare il suo catalogo elettronico locale senza dover effettuare di nuovo la catalogazione (operazione lunga e costosa). Un altro servizio molto importante è l'Authority Control, che permette alle biblioteche di correggere o ammodernare le voci dei loro cataloghi informatizzati.

    L'organizzazione inoltre fornisce supporto all'acquisto di materiali dai fornitori (case editrici, librai, etc.) e un vasto spettro di servizi di consulenza per le biblioteche che vogliono aggiornare i loro sistemi informativi, o tradurre i record da formati proprietari ai formati di catalogazione standard.

    Infine, oltre a fornire servizi alle biblioteche associate, OCLC promuove una serie di progetti di ricerca nell'ambito delle tecnologie informatiche e dei sistemi telematici per la gestione dei documenti e dei relativi metadati. Tra questi abbiamo già avuto modo di illustrare il sistema PURL per l'indirizzamento delle risorse su Internet. I risultati di queste ricerche, tutte le informazioni sui prodotti e sui servizi offerti, e una grande quantità di documentazione nel settore bibliotecario, sono disponibili sul sito Web dell'organizzazione, il cui indirizzo è http://www.oclc.org.

    Internet e le biblioteche digitali

    Lo creazione delle biblioteche digitali costituisce quella che abbiamo definito la 'seconda fase' del rapporto tra Internet e la biblioteca. Nel gergo degli specialisti, al posto del termine 'digitale', spesso viene utilizzato l'aggettivo 'virtuale', più evocativo e suggestivo, ma potenzialmente fuorviante. Qualunque sia la formula utilizzata, il riferimento è un archivio informatico di testi in formato elettronico, al cui contenuto è possibile accedere attraverso canali telematici.

    Diversi fattori tecnologici concorrono allo sviluppo di questo fenomeno. Da una parte l'evoluzione nel settore dei nuovi media verificatasi a partire dagli anni ottanta ha conferito ai supporti digitali lo status di possibili o probabili sostituti del libro. Il testo elettronico, o testo in Machine Readable Form (MRF), ha assunto in molte applicazioni di text processing una funzione autonoma. Dall'altra lo sviluppo delle tecnologie di distribuzione dell'informazione su sistemi telematici in generale, e su Internet in particolare, ha favorito la progressiva digitalizzazione della comunicazione scientifica e culturale.

    Il sogno della biblioteca universale ha attraversato la storia, assumendo varie forme in relazione al variare delle tecnologie di registrazione e diffusione del sapere testualizzato. Non stupisce dunque che la disponibilità di un formidabile sistema di diffusione dell'informazione come Internet abbia non solo rinnovato tale sogno, ma anche stimolato la realizzazione dei molteplici sperimentazioni pratiche.

    Dal testo elettronico alla biblioteca digitale

    La disponibilità di sistemi evoluti per la digitalizzazione e codifica informatica dei testi, unita alla diffusione della comunicazione telematica, hanno determinato il passaggio dalla biblioteca informatizzata alla biblioteca digitale. Un ruolo fondamentale in questo processo va attribuito ad Internet, che ormai ospita un ingente numero di banche dati testuali, di varia tipologia, ed alla sua comunità di utenti.

    Probabilmente queste esperienze sono ancora lontane dall'incarnare esattamente il progetto delle biblioteca digitale universale nel suo senso più pieno. I limiti tecnologici imposti dalla attuale architettura della rete non permettono di implementare tutte le funzionalità che ci si aspetterebbe da un sistema bibliotecario elettronico (basti ricordare, ad esempio, il problema della identificazione univoca dei documenti). Ma allo stesso tempo esse dimostrano la enorme potenzialità della rete come strumento di diffusione dell'informazione e come laboratorio di un nuovo spazio comunicativo, lasciando prefigurare una nuova forma nella diffusione e fruizione del sapere.

    Le biblioteche digitali presenti su Internet possono essere divise in due tipologie sulla base delle modalità di accesso e di consultazione dei testi elettronici in esse contenuti:

    • banche dati dai quali l'utente può prelevare testi memorizzati in vari formati digitali;
    • banche dati di testi consultabili direttamente in linea, eventualmente dotate di strumenti di ricerca full text.

    La prima classe generalmente si basa su tecnologie di trasferimento dei file mediante protocollo FTP, o HTTP, eventualmente con la mediazione di pagine Web che svolgono la funzione di interfaccia utente (di norma sotto forma di catalogo ipertestuale). Le seconde invece nella maggior parte si basano su tecnologia World Wide Web.

    Una seconda distinzione può essere tracciata sulla base dei formati con cui i testi vengono archiviati alla fonte e distribuiti agli utenti (non necessariamente coincidenti). Si va dagli archivi che contengono testi in semplice formato testuale (ASCII o ISO Latin), o in vari formati proprietari, a quelli in cui i testi sono codificati mediante opportuni linguaggi di marcatura, in particolare mediante linguaggi SGML/TEI.

    Infine, un ultimo criterio distintivo riguarda il tipo di ente organizzazione o struttura che costruisce e cura la manutenzione della biblioteca digitale. Molte delle biblioteche digitali presenti sulla rete nascono in ambito accademico. Normalmente queste risorse sono il frutto di progetti di ricerca specializzati, che possono disporre di strumenti tecnologici e di competenze specifiche molto qualificate, a garanzia della qualità scientifica delle edizioni digitalizzate. Tuttavia non sempre i materiali archiviati sono liberamente disponibili alla utenza esterna. Infatti vi si trovano assai spesso materiali coperti da diritti di autore.

    Il tema del copyright è fondamentale per lo sviluppo delle biblioteche digitali nel prossimo futuro. Le attuali legislazioni, modellate sulla tecnologia della stampa, sono state estese per analogia alla distribuzione telematica. Tuttavia, in un nuovo mezzo di comunicazione in cui la riproduzione delle risorse è alla portata di chiunque e non costa nulla, questa estensione rischia di imporre dei vincoli troppo rigidi, e di avere un effetto di freno allo sviluppo. D'altra parte non si può dimenticare che i diritti intellettuali sono la fonte di sostentamento degli autori. Meno giustificata la durata dei diritti, attualmente fissata a settanta anni dalla morte dell'autore, che tutela piuttosto le case editrici. Un soluzione di carattere 'libertario' potrebbe essere la diminuzione della durata dei diritti, limitata alla distribuzione telematica senza scopo di lucro. In alternativa si potrebbe studiare un meccanismo di micropagamenti che verrebbero addebitati all'utente nel momento in cui accede ad un documento (il sistema pay per view). In tale direzione sono in corso molti studi e progetti, ma per il momento nessuna tecnologia di questo tipo è effettivamente operativa.

    Accanto alle biblioteche digitali realizzate da soggetti istituzionali, si collocano una serie di progetti, sviluppati e curati da organizzazioni ed associazioni private di natura volontaria. In realtà, come abbiamo già rilevato, le prime esperienze di biblioteche digitali su Internet nascono proprio sotto la spinta di questi soggetti, animati dallo spirito collaborativo e libertario che ha caratterizzato lo sviluppo della rete. Queste banche dati contengono testi che l'utente può prelevare liberamente e poi utilizzare sulla propria stazione di lavoro; chiaramente tutti i testi sono liberi da diritti d'autore. Le edizioni elettroniche contenute in questi archivi non hanno sempre un grado di affidabilità filologica elevato. Tuttavia si tratta di iniziative che, basandosi sullo sforzo volontario di moltissime persone, possono avere buoni ritmi di crescita, e che già oggi mettono a disposizione di un vasto numero di utenti una notevole mole di materiale altrimenti inaccessibile.

    L'interesse sulle biblioteche digitali negli ultimi anni è andato crescendo. La digitalizzazione progressiva dei sistemi di comunicazione e di archiviazione dell'informazione comincia a porre all'ordine del giorno il problema della 'migrazione' dell'intero patrimonio culturale dell'umanità nel nuovo medium. Consapevoli dell'importanza di questa transizione, alcune grandi istituzioni hanno dato vita a grandiosi progetti di digitalizzazione.

    La nuova Bibliotèque Nationale di Francia ha iniziato l'archiviazione elettronica dell'intero patrimonio librario sin dal 1992; un progetto simile è in corso presso la Library of Congress. Anche la Biblioteca Vaticana, in collaborazione con la IBM, ha avviato un progetto sperimentale per distribuire le immagini digitalizzate del suo inestimabile patrimonio di manoscritti. Da poco è stata conclusa la prima fase, che ha riguardato circa cento manoscritti, ora a disposizione di un selezionato gruppo di studiosi in tutto il mondo.

    Ancora negli Stati Uniti, segnaliamo la Digital Libraries Initiative. Si tratta di un importante programma nazionale di ricerca finanziato da tre enti governativi: NSF, DARPA e NASA (per informazioni si può visitare il sito Web http://www.grainger.uiuc.edu/dli/national.htm). Vi partecipano sei università, che hanno avviato altrettanti progetti sperimentali con il fine di sviluppare e testare tecnologie avanzate per la creazione di biblioteche digitali multimediali distribuite su rete geografica, di studiare modelli di archiviazione e conservazione delle risorse documentali, e di individuare modelli di accesso da parte dell'utenza.

    Un interessante osservatorio sugli sviluppi in corso nel settore delle biblioteche digitali è la rivista telematica D-lib Magazine, sponsorizzata dalla DARPA nell'ambito del programma DLI. Con periodicità mensile, D-Lib ospita articoli teorici e tecnici, ed aggiorna circa l'andamento dei progetti di ricerca in corso. Il sito Web, il cui indirizzo è http://www.dlib.org, contiene, oltre all'ultimo numero uscito, anche l'archivio di tutti numeri precedenti.

    Le biblioteche digitali su Internet

    Il numero di biblioteche digitali presenti su Internet è oggi assai consistente, e nuove iniziative vedono la luce ogni mese. Nella maggior parte dei casi questi archivi contengono testi letterari o saggistici in lingua inglese, ma non mancano archivi di testi in molte altre lingue occidentali, archivi di testi latini e greci, e biblioteche speciali con fondi dedicati a particolari autori o temi.

    Nei prossimi paragrafi ci occuperemo di alcune iniziative che ci sembrano a vario titolo esemplari. Per il resto, invitiamo il lettore a consultare i seguenti siti, che offrono cataloghi di testi elettronici ed elenchi di biblioteche virtuali.

    Alex è un gopher server che contiene un catalogo generale di 1800 testi elettronici, organizzato per autore, data, titolo, host, lingua e soggetto; il catalogo è dotato di un motore di ricerca locale. Purtroppo da due anni non viene aggiornato regolarmente per mancanza di finanziamenti, ma rimane comunque un ottimo strumento di ricerca di testi elettronici su Internet. Alex è raggiungibile tramite l'indirizzo http://www.lib.ncsu.edu/stacks/alex-index.html.

    Un altro sito molto importante è The On-Line Books Page, realizzato dalla Carnegie Mellon University. Questo sito, basato completamente su tecnologia Web, offre un catalogo automatizzato di testi elettronici in rete, organizzato per autore, titolo e soggetto. Il catalogo elenca 3000 testi, solo in lingua inglese. Oltre al catalogo dei testi, è presente anche un buon elenco delle biblioteche virtuali e di progetti settoriali di editoria elettronica presenti su Internet, sia in lingua inglese sia in altre lingue. L'indirizzo è http://www.cs.cmu.edu/Web/books.html. Una ulteriore fonte di informazioni è il sito Internet Book Information Center, il cui indirizzo è http://sunsite.unc.edu/ibic/IBIC-homepage.html.

    Per i progetti di biblioteche digitali sviluppati in ambito accademico molto utile è la Directory of Electronic Text Centers compilata da Mary Mallery del Center for Electronic Texts in the Humanities (CETH). Si tratta di un inventario ragionato di archivi testuali suddiviso per enti di appartenenza. Per ognuno dei centri elencati, oltre ad un link diretto, vengono forniti gli estremi dei responsabili scientifici, l'indirizzo dell'ente, e una breve descrizione delle risorse contenute.

    Anche la Text Encoding Initiative, sul suo sito Web, ha realizzato un elenco dei vari progetti di ricerca ed archivi testuali basati sulle sue fondamentali norme di codifica. La 'Application List' (il cui indirizzo Web esatto è http://www-tei.uic.edu/orgs/tei/app) fornisce informazioni e link diretti alle home page di più di cinquanta iniziative, tra si annoverano alcune tra le più interessanti ed avanzate esperienze di biblioteche digitali attualmente in corso. Una altra decisiva fonte di informazione circa le applicazioni delle tecnologie SGML in ambito scientifico, è costituita dalla sezione 'Academic Projects and Applications' delle SGML Web Pages curate da Robin Cover (http://www.sil.org/sgml/acadapps.html).

    Progetto Gutenberg

    Il Progetto Gutenberg è senza dubbio la più nota, importante ed estesa biblioteca digitale attualmente esistente su Internet. Non solo: è anche stata la prima. Le sue origini, infatti, risalgono al lontano 1971, quando l'allora giovanissimo Michael Hart, ebbe la possibilità di accedere al mainframe Xerox Sigma V della University of Illinois. Hart decise che tanta potenza poteva essere veramente utile solo se fosse stata usata per diffondere il patrimonio culturale dell'umanità al maggior numero di persone possibile. E digitò manualmente al suo terminale il testo della Dichiarazione di indipendenza degli Stati Uniti.

    Nel giro di pochi anni il Progetto Gutenberg, nome scelto da Hart in omaggio all'inventore della stampa, le cui orme stava ripercorrendo, attirò decine e poi centinaia di volontari, che iniziarono a contribuire all'obiettivo individuato dal fondatore: raggiungere i diecimila titoli entro il 2001. Per lungo tempo l'iniziativa ha anche goduto dell'esiguo supporto finanziario e logistico di alcune università, supporto che è venuto a mancare nel dicembre 1996. Malgrado il periodo di difficoltà, Michael Hart non si è perso d'animo; anzi è riuscito a potenziare ulteriormente la sua incredibile creatura.

    Infatti, accanto al patrimonio testuale in lingua inglese, che costituisce il fondo originario e tuttora portante della biblioteca, recentemente sono state aggiunti insiemi di testi in molte altre lingue, tra cui il francese, lo spagnolo e l'italiano. Nel momento in cui scriviamo l'archivio è complessivamente costituito da ottocento testi — prevalentemente classici della letteratura inglese e americana. Circa settecento volontari in tutto il mondo collaborano all'incremento con un tasso di quaranta nuovi titoli al mese.

    I testi sono programmaticamente in formato ASCII a sette bit (il cosiddetto Plain Vanilla ASCII). Michael Hart, infatti, ha sempre affermato di volere realizzare una banca dati che potesse essere utilizzata da chiunque, su qualsiasi sistema operativo, e in qualsiasi epoca: tale universalità è a suo avviso garantita solo da questo formato. Lo stesso Hart ha più volte declinato gli inviti a realizzare edizioni scientifiche dei testi. Infatti lo spirito del progetto Gutenberg è quello di rivolgersi al novantanove per cento degli utenti fornendo loro in maniera del tutto gratuita testi affidabili al novantanove per cento. Come ha più volte affermato, fare un passo ulteriore richiederebbe dei costi che non sono alla portata di un progetto interamente basato sul volontariato, e sarebbe al di fuori degli obiettivi di questa iniziativa.

    Il sito di riferimento del progetto Gutenberg su Web è all'indirizzo http://promo.net/pg/, e contiene il catalogo completo della biblioteca, organizzato per anno di pubblicazione, da cui è possibile scaricare direttamente i file (compressi nel classico formato zip), oltre a una serie di informazioni sull'iniziativa. L'archivio principale è conservato sul server ftp della University of Illinois di Urbana, il cui indirizzo è ftp://uiarchive.cso.uiuc.edu/pub/etext/gutenberg/. Ma il progetto Gutenberg per la sua notorietà è replicato su moltissimi altri server FTP, e viene anche distribuito su CDROM dalla Walnut Creek. Al progetto Gutenberg sono anche dedicate una mail list ed un newsgroup, denominato bit.listserv.gutenberg, tramite i quali si possono avere informazioni sui titoli inseriti nella biblioteca, essere aggiornati sulle nuove edizioni, e si possono seguire i dibattiti che intercorrono tra i suoi moltissimi collaboratori.

    continua...

    Indietro Avanti
    Torna su
    torna su
    Internet facile con E-text!