L'ipertesto globale: World Wide Web[ Sezione 01 ] [ vai a Sezione 02 ] [ vai a Sezione 03 ] IntroduzioneWorld Wide Web (cui ci si riferisce spesso con gli acronimi WWW o W3) è stato l'ultimo servizio informativo a venire alla ribalta su Internet. Ma il successo della 'ragnatela mondiale' è stato tale che attualmente, per la maggior parte degli utenti, essa coincide con la rete stessa. Sebbene questa convinzione sia tecnicamente scorretta, è indubbio che gran parte dell'esplosione del 'fenomeno Internet' a cui abbiamo assistito in questi ultimi anni sia legata proprio alla diffusione di questo strumento. La storia di World Wide Web inizia nel maggio del 1990, quando Tim Berners Lee, un ricercatore del CERN di Ginevra - il noto centro ricerche di fisica delle particelle - presenta ai dirigenti dei laboratori una relazione intitolata "Information Management: a Proposal". La proposta di Berners Lee ha l'obiettivo di sviluppare un sistema di pubblicazione e reperimento dell'informazione distribuito su rete geografica che tenesse in contatto la comunità internazionale dei fisici. Nell'ottobre di quello stesso anno iniziano le prime sperimentazioni. Per alcuni anni, comunque, World Wide Web resta uno strumento alquanto esoterico. L'impulso decisivo al suo sviluppo, infatti, viene solo agli inizi del 1993, dal National Center for Supercomputing Applications (NCSA) dell'Università dell'Illinois. Basandosi sul lavoro del CERN, Marc Andressen (che pochi anni dopo fonderà con Jim Clark la Netscape Communication) ed Eric Bina sviluppano una interfaccia grafica multipiattaforma per l'accesso ai documenti presenti su World Wide Web, il famoso Mosaic, e la distribuiscono gratuitamente a tutta la comunità di utenti della rete. World Wide Web, nella forma in cui oggi lo conosciamo, è il prodotto di questa virtuosa collaborazione a distanza. Con l'introduzione di Mosaic, in breve tempo il Web si impone come il servizio più usato dagli utenti della rete, e inizia ad attrarne di nuovi. Il successo di World Wide Web ha naturalmente suscitato l'interesse di una enorme quantità di nuovi autori ed editori telematici, interesse che ha determinato dei ritmi di crescita più che esponenziali. Nel 1993 esistevano solo duecento server Web: oggi ce ne sono milioni. Su World Wide Web è possibile trovare le pagine di centri di ricerca universitari che informano sulle proprie attività e mettono a disposizione in tempo reale pubblicazioni scientifiche con tanto di immagini, grafici, registrazioni; quelle dei grandi enti che gestiscono Internet, con le ultime notizie su protocolli e specifiche di comunicazione, nonché le ultime versioni dei software per l'accesso alla rete o per la gestione di servizi; ma è possibile trovare anche riviste letterarie, gallerie d'arte telematiche, musei virtuali con immagini digitalizzate dei quadri, biblioteche che mettono a disposizione rari manoscritti altrimenti inaccessibili; ed ancora informazioni sull'andamento della situazione meteorologica, con immagini in tempo reale provenienti dai satelliti, fototeche, notizie di borsa aggiornate in tempo reale e integrate da grafici... ma è meglio fermarci qui, perché parlando di World Wide Web ci troviamo nella situazione di Achille nel ben noto paradosso di Zenone: ogni giorno nasce una nuova fonte di informazioni, ed ogni enumerazione sarebbe incompleta non appena terminata. Naturalmente si sono accorte delle potenzialità del Web anche le grandi e piccole imprese: per molti analisti economici Internet è la nuova frontiera del mercato globale. Prima sono arrivate le grandi ditte produttrici di hardware e software, dotate ormai tutte di un proprio sito Web attraverso il quale fornire informazioni ed assistenza sui propri prodotti, annunciare novità, e (cosa assai utile dal punto di vista degli utenti) rendere disponibili aggiornamenti del software. Poi sono arrivate anche pizzerie e negozi di dischi, agenti immobiliari ed artigiani della ceramica, librerie e cataloghi di alimentazione naturale... si vende via Internet, si acquista (in genere) con carta di credito. Ma di questo parleremo in un prossimo capitolo. Le caratteristiche che hanno fatto di World Wide Web una vera e propria rivoluzione nel mondo della telematica possono essere riassunte nei seguenti punti:
Dal punto di vista dell'utente finale Web si presenta come un illimitato universo di documenti multimediali integrati ed interconnessi tramite una rete di collegamenti dinamici. Uno spazio informativo in cui è possibile muoversi facilmente alla ricerca di informazioni, testi, immagini, dati, curiosità, prodotti. Non solo: come abbiamo avuto modo di imparare nei capitoli precedenti, un client Web è in grado di accedere in maniera del tutto automatica a tutte le risorse e i servizi presenti su Internet: gopher, FTP, collegamenti telnet, newsgroup... è insomma il più potente e amichevole strumento di navigazione nel ciberspazio. Dal punto di vista dei fornitori di informazione il Web è uno strumento per la diffusione telematica di documenti elettronici multimediali, decisamente semplice da utilizzare, poco costoso e dotato del canale di distribuzione più vasto e ramificato del mondo. Due concetti importanti: multimedia e ipertestoTra i diversi aspetti innovativi di World Wide Web, come si accennava, i più notevoli sono decisamente l'organizzazione ipertestuale e la possibilità di trasmettere informazioni integralmente multimediali. Ipertesto e multimedia: ormai da diversi anni queste due parole, uscite dal ristretto ambiente specialistico degli informatici, ricorrono sempre più spesso negli ambiti più disparati, dalla pubblicistica specializzata fino alle pagine culturali dei quotidiani. Questo paragrafo intende fornire, in poche righe, una breve introduzione a questi concetti: alcuni minimi strumenti terminologici e teorici necessari per poter comprendere il funzionamento di World Wide Web. In primo luogo è bene distinguere il concetto di multimedialità da quello di ipertesto. I due concetti sono spesso confusi, ma mentre il primo si riferisce agli strumenti della comunicazione, il secondo riguarda la sfera più complessa della organizzazione dell'informazione. Con multimedialità, dunque, ci si riferisce alla possibilità di utilizzare contemporaneamente, in uno stesso messaggio comunicativo, più media e più linguaggi044. È evidente che una certa dose di multimedialità è intrinseca in tutte le forme di comunicazione che l'uomo ha inventato ed utilizzato, a partire dalla complessa interazione tra parola e gesto, fino alla invenzione della scrittura, dove il linguaggio verbale si fonde con l'iconicità del linguaggio scritto (si pensi anche - ma non unicamente - alle scritture ideografiche), e a tecnologie comunicative come il cinema o la televisione. Nondimeno l'informatica - e la connessa riduzione di linguaggi diversi alla 'base comune' rappresentata dalle catene di 0 e 1 del mondo digitale - ha notevolmente ampliato gli spazi 'storici' della multimedialità. Infatti attraverso la codifica digitale si è oggi in grado di immagazzinare in un unico oggetto informativo, che chiameremo documento, pressoché tutti i media e i linguaggi comunicativi: testo, immagine, suono, parola, video. I documenti multimediali sono oggetti informativi complessi e di grande impatto. Ma più che nella possibilità di integrare in un singolo oggetto diversi media, il nuovo orizzonte aperto dalla comunicazione su supporto digitale risiede nella possibilità di dare al messaggio una organizzazione molto diversa da quella a cui siamo abituati da ormai molti secoli. È in questo senso che la multimedialità informatica si intreccia profondamente con gli ipertesti, e con l'interattività. Vediamo dunque cosa si intende con il concetto di ipertesto. La definizione di questo termine potrebbe richiedere un volume a parte (ed esistono realmente decine di volumi che ne discutono!). La prima formulazione moderna dell'idea di ipertesto si trova in un articolo del tecnologo americano Vannevar Bush, As We May Think, apparso nel 1945, dove viene descritta una complicata macchina immaginaria, il Memex (contrazione di Memory extension). Si trattava di una sorta di scrivania meccanizzata dotata di schermi per visualizzare e manipolare documenti microfilmati, e di complicati meccanismi con cui sarebbe stato possibile costruire legami e collegamenti tra unità informative diverse. Secondo Bush un dispositivo come questo avrebbe aumentato la produttività intellettuale perché il suo funzionamento imitava il meccanismo del pensiero, basato su catene di associazioni mentali. La sintesi tra le suggestioni di Bush e le tecnologie informatiche è stata opera di Ted Nelson, che ha anche coniato il termine 'ipertesto', agli inizi degli anni sessanta. Nel suo scritto più famoso e importante, Literary Machines - un vero e proprio manifesto dell'ipertestualità - questo geniale ed anticonformista guru dell'informatica statunitense descrive un potente sistema ipertestuale, battezzato Xanadu045. Nella utopica visione di Nelson, Xanadu era la base di un universo informativo globale ed orizzontale - da lui definito docuverse (docuverso) - costituito da una sconfinata rete ipertestuale distribuita su una rete mondiale di computer. Il progetto Xanadu non è mai stato realizzato concretamente, malgrado i molti tentativi a cui Nelson ha dato vita. Ma le sue idee sono confluite molti anni più tardi nella concezione di World Wide Web. In questa sede non possiamo affrontare compiutamente tutti gli aspetti teorici e pratici connessi con questo tema, ma solo fornire alcuni elementi esplicativi. In primo luogo, per comprendere cosa sia un ipertesto è opportuno distinguere tra aspetto logico-astratto e aspetto pratico-implementativo. Dal punto di vista logico un ipertesto è un sistema di organizzazione delle informazioni (testuali, ma non solo) in una struttura non sequenziale, bensì reticolare. Nella cultura occidentale, a partire dalla invenzione della scrittura alfabetica, e in particolare da quella della stampa, l'organizzazione dell'informazione in un messaggio, e la corrispondente fruizione della stessa, è essenzialmente basata su un modello lineare sequenziale, su cui si può sovrapporre al massimo una strutturazione gerarchica. Per capire meglio cosa intendiamo basta pensare ad un libro, il tipo di documento per eccellenza della modernità: un libro è una sequenza lineare di testo, eventualmente organizzato come una sequenza di capitoli, che a loro volta possono essere organizzati in sequenze di paragrafi, e così via. La fruizione del testo avviene pertanto in modo sequenziale, dalla prima all'ultima pagina. Certo sono possibili deviazioni (letture 'a salti', rimandi in nota), ma si tratta di operazioni 'innestate' in una struttura nella quale prevale la linearità. L'essenza stessa della razionalità e della retorica occidentale riposa su una struttura lineare dell'argomentazione. Un ipertesto invece si basa su un'organizzazione reticolare dell'informazione, ed è costituito da un insieme di unità informative (i nodi) e da un insieme di collegamenti (detti nel gergo tecnico link) che da un nodo permettono di passare ad uno o più altri nodi. Se le informazioni che sono collegate tra loro nella rete non sono solo documenti testuali, ma in generale informazioni veicolate da media differenti (testi, immagini, suoni, video), l'ipertesto diventa multimediale, e viene definito ipermedia. Una idea intuitiva di cosa sia un ipertesto multimediale può essere ricavata dalla figura seguente.
I documenti, l'immagine e il filmato sono i nodi dell'ipertesto, mentre le linee rappresentano i collegamenti (link) tra i vari nodi: il documento in alto, ad esempio, contiene tre link, da dove è possibile saltare ad altri documenti o alla sequenza video. Il lettore (o forse è meglio dire l'iper-lettore), dunque, non è vincolato dalla sequenza lineare dei contenuti di un certo documento, ma può muoversi da una unità testuale ad un'altra (o ad un blocco di informazioni veicolato da un altro medium) costruendosi ogni volta un proprio percorso di lettura. Naturalmente i vari collegamenti devono essere collocati in punti in cui il riferimento ad altre informazioni sia semanticamente rilevante: per un approfondimento, per riferimento tematico, per contiguità analogica. In caso contrario si rischia di rendere inconsistente l'intera base informativa, o di far smarrire il lettore in peregrinazioni prive di senso. Dal punto di vista della implementazione concreta, un ipertesto digitale si presenta come un documento elettronico in cui alcune porzioni di testo o immagini presenti sullo schermo, evidenziate attraverso artifici grafici (icone, colore, tipo e stile del carattere), rappresentano i diversi collegamenti disponibili nella pagina. Questi funzionano come dei pulsanti che attivano il collegamento e consentono di passare, sullo schermo, al documento di destinazione. Il pulsante viene 'premuto' attraverso un dispositivo di input, generalmente il mouse o una combinazioni di tasti, o un tocco su uno schermo touch-screen. In un certo senso, il concetto di ipertesto non rappresenta una novità assoluta rispetto alla nostra prassi di fruizione di informazioni testuali. La struttura ipertestuale infatti rappresenta una esaltazione 'pluridimensionale' del meccanismo testo/nota/riferimento bibliografico/glossa, che già conosciamo sia nei manoscritti sia nelle pubblicazioni a stampa. In fondo, il modo di lavorare di uno scrittore nella fase di preparazione del suo materiale è quasi sempre ipertestuale, così come l'intertestualità soggiacente alla storia della letteratura ed allo sviluppo dei generi (dove "letteratura" e "generi" vanno presi nel loro senso ampio di produzione testuale, non esclusivamente dotata di valore estetico) costituisce un ipertesto virtuale che si genera nella mente di autore e lettore. Tuttavia, le tecnologie informatiche consentono per la prima volta di portare almeno in parte in superficie questo universo pre-testuale e post-testuale, per farlo diventare una vera e propria forma del discorso e dell'informazione. L'altro aspetto che fa dell'ipertesto elettronico uno strumento comunicativo dalle enormi potenzialità è la interattività che esso consente al fruitore, non più relegato nella posizione di destinatario più o meno passivo del messaggio, ma capace di guidare e indirizzare consapevolmente il suo atto di lettura. L'incontro tra ipertesto, multimedialità e interattività rappresenta dunque la nuova frontiera delle tecnologie comunicative. Il problema della comprensione teorica e del pieno sfruttamento delle enormi potenzialità di tali strumenti, specialmente in campo didattico, pedagogico e divulgativo (così come in quello dell'intrattenimento e del gioco), è naturalmente ancora in gran parte aperto: si tratta di un settore nel quale vi sono state negli ultimi anni - ed è legittimo aspettarsi negli anni a venire - innovazioni di notevole portata. World Wide Web è una di queste innovazioni: si tratta infatti di un sistema ipermediale; con la particolarità che i diversi nodi della rete ipertestuale sono distribuiti sui vari host che costituiscono Internet. Attivando un singolo link si può dunque passare a un documento che si trova su un qualsiasi computer della rete. In questo senso utilizzare uno strumento come Web permette di effettuare una vera e propria navigazione nel ciberspazio, una navigazione che riconsegna il timone nelle mani del (iper)lettore. Come funziona World Wide WebIl funzionamento di World Wide Web non differisce molto da quello delle altre applicazioni Internet. Anche in questo caso il sistema si basa su una interazione tra un client ed un server. Il protocollo di comunicazione che i due moduli utilizzano per interagire si chiama HyperText Transfer Protocol (HTTP). L'unica - ma importante - differenza specifica è la presenza di un formato speciale in cui debbono essere memorizzati i documenti inseriti su Web, denominato HyperText Markup Language (HTML). I client Web sono gli strumenti di interfaccia tra l'utente ed il sistema; le funzioni principali che svolgono sono:
Nel gergo telematico questi programmi vengono chiamati anche browser, dall'inglese to browse, scorrere, poiché essi permettono appunto di scorrere i documenti. In occasione del rilascio delle specifiche ufficiali dell'HTML 4.0, il W3C (World Wide Web Consortium, http://www.w3c.org) ha promosso il termine, più generico, user agent, che l'associazione culturale Liber Liber, http://www.liberliber.it, che si è occupata della traduzione in italiano delle specifiche del W3C, ha reso con programma interprete o più semplicemente interprete. Nel momento in cui l'utente attiva un collegamento - agendo su un link o specificando esplicitamente l'indirizzo di un documento - il client invia una richiesta ('request') ad un determinato server con l'indicazione del file che deve ricevere. Il server Web, o più precisamente server HTTP, per contro si occupa della gestione, del reperimento e del recapito dei singoli documenti richiesti dai client. Naturalmente esso è in grado di servire più richieste contemporaneamente. Ma un server può svolgere anche altre funzioni. Una tipica mansione dei server HTTP è l'interazione con altri programmi, interazione che permette di produrre documenti in modo dinamico. Vediamo di capire meglio di cosa si tratta. Un documento Web è ovviamente un file, che una volta preparato e messo in linea rimane a disposizione degli utenti 'così com'è', fino a quando il gestore di sistema non decide di modificarlo o di rimuoverlo. Ci sono però dei casi in cui sarebbe necessario poter cambiare il contenuto di un documento in maniera dinamica, a scadenze prefissate o come risultato di una determinata operazione: ad esempio ogni volta che si verifica un accesso, o aggiornando automaticamente i dati contenuti in una tabella dopo che un programma di calcolo ha ricalcolato le corrispettive funzioni; o quando si devono inviare, inseriti in un opportuno contesto, i risultati di una ricerca su un database. Il server Web è in grado di effettuare queste operazioni attraverso la cosiddetta Common Gateway Interface (CGI), ovvero una serie di comandi standard grazie ai quali può comunicare con altre applicazioni e programmi (ad esempio fare una ricerca automatica su un database) e produrre istantaneamente dei documenti Web adeguati alla operazione compiuta (ad esempio, contenenti i risultati della ricerca). Naturalmente questo avviene in modo del tutto trasparente all'utente finale. Un'altra tipica funzione svolta dal server è la gestione di transazioni economiche, quali la registrazione di un acquisto fatto con carta di credito. Dal punto di vista tecnico questa operazione non differisce molto dalla normale consultazione o aggiornamento di un database. Ma ovviamente i problemi di affidabilità e di sicurezza in questo caso sono molto più rilevanti: in fondo sentirsi dire che Manzoni ha scritto il Decameron sarebbe considerato da molti meno grave che ritrovarsi un addebito di un milione di dollari per l'acquisto di un libro, o scoprire che il nostro numero di carta di credito è finito nelle mani di un abile truffatore informatico. Per questo sono stati sviluppati dei server HTTP specializzati nella gestione di transazioni economiche sicure attraverso complesse tecnologie di cifratura di dati (ne tratteremo più avanti). HyperText Markup LanguageHyperText Markup Language (HTML) è il formato in cui sono memorizzati i documenti ipermediali del Web. Si tratta di un linguaggio di marcatura (markup language), appositamente orientato alla descrizione di documenti testuali. HTML si basa sulla sintassi dello Standard Generalized Markup Language (SGML), un metalinguaggio per la definizione di sistemi di markup, di cui parleremo più diffusamente in seguito. Ma cosa vuol dire 'linguaggio di marcatura'? L'idea di 'markup' in un documento elettronico si ricollega alla simbologia che scrittori e correttori di bozze utilizzano nella stampa tradizionale per indicare al compositore ed al tipografo come trattare graficamente le parti di testo che svolgono funzioni particolari: ad esempio, la sottolineatura per indicare il corsivo. In modo simile, i linguaggi di marcatura sono costituiti da un insieme di istruzioni, dette tag (marcatori), che servono a descrivere la struttura, la composizione e l'impaginazione del documento. I marcatori sono sequenze di normali caratteri ASCII, e vengono introdotti, secondo una determinata sintassi, all'interno del documento, accanto alla porzione di testo cui si riferiscono. Un documento HTML è dunque un file in formato testo che include, insieme al contenuto testuale vero e proprio, i marcatori che ne descrivono la struttura. Ad esempio è possibile indicare i diversi livelli dei titoli di un documento, lo stile dei caratteri (corsivo, grassetto...), i capoversi, la presenza di liste (numerate o no). Volendo realizzare un documento ipermediale, avremo a disposizione anche marcatori specifici per la definizione dei link ipertestuali e per l'inserimento di immagini. Naturalmente le immagini non sono parte integrante del file HTML, che in quanto tale è un semplice file di testo. I file grafici vengono inviati come oggetti autonomi dal server, ed inseriti in una pagina Web solo durante l'operazione di visualizzazione effettuata dal browser. I formati di immagini digitali standard su Web sono il GIF ed il JPEG. Si tratta di sistemi di codifica grafica in grado di comprimere notevolmente la dimensione del file, e pertanto particolarmente adatti ad un uso su rete. Attraverso i comandi HTML è possibile anche specificare alcune strutture interattive come moduli di immissione attraverso cui l'utente può inviare comandi e informazioni al server ed attivare speciali procedure (ricerche su database, invio di posta elettronica ed anche pagamenti attraverso carta di credito!); oppure disegnare tabelle. Un utente di Internet che desiderasse solo consultare e non produrre informazione in rete potrebbe fare a meno di preoccuparsi del funzionamento di HTML. Attenzione, però: una delle caratteristiche fondamentali di Internet è proprio l'estrema facilità con la quale è possibile diventare protagonisti attivi dello scambio informativo. Se si vuole compiere questo salto decisivo, un minimo di familiarità con HTML è necessaria. Non occorre avere timori reverenziali: HTML non è un linguaggio di programmazione, e le sue istruzioni di base sono semplicissime: imparare i primi rudimenti di HTML non è più complicato che imparare a usare e a interpretare le principali sigle ed abbreviazioni usate dai correttori di bozze. Per questi motivi nella sezione "Mettere informazione in rete" torneremo approfonditamente sull'HTML, fornendo una introduzione al linguaggio. HTML è nato e si è sviluppato insieme a World Wide Web. Nella prima versione, il linguaggio non prevedeva la possibilità di rappresentare fenomeni testuali ed editoriali complessi. Di conseguenza le sue specifiche hanno subito diverse revisioni ed estensioni, che hanno dato origine a diverse versioni ufficiali, nonché ad una serie di estensioni introdotte dai vari produttori di Web browser commerciali. Le revisioni ufficiali vengono gestite attualmente da una organizzazione in cui confluiscono rappresentanti di oltre quaranta tra enti di ricerca e imprese interessate allo sviluppo di sistemi informativi su Internet, il W3C (World Wide Web Consortium), fondato da Tim Berners Lee. Questi raffinamenti successivi, accogliendo le sollecitazioni provenienti da una comunità di utenti sempre più vasta e variegata, hanno progressivamente introdotto elementi dedicati al controllo formale del testo. Tuttavia, mentre le commissioni ufficiali lavoravano lentamente alla revisione dello standard, l'esplosione del fenomeno Internet, e la diffusa richiesta di strumenti capaci di rendere spettacolari (più che 'documentalmente' ben strutturate) le pagine Web, hanno indotto le industrie produttrici di browser, ad introdurre una serie di estensioni individuali al linguaggio. La speranza (nel caso di Netscape, coronata da un certo successo nei primi anni) era anche quella di conquistare una posizione di monopolio di fatto nel mercato, dato che le estensioni introdotte da una determinata industria erano, almeno in prima istanza, riconosciute e interpretate correttamente solo dal relativo browser. La più recente versione ufficiale del linguaggio rilasciata dal W3C, denominata HTML 4.0, ha riportato un certo ordine, accogliendo molte delle innovazioni più interessanti. Nondimeno, l'evoluzione dei sistemi di codifica dei documenti su Web è uno dei temi più stimolanti nel dibattito sul futuro della rete: ce ne occuperemo nel paragrafo dedicato alle nuove frontiere di Internet. Uniform Resource LocatorUn aspetto particolare del funzionamento di World Wide Web è la tecnica di indirizzamento dei documenti, ovvero il modo in cui è possibile far riferimento ad un determinato documento tra tutti quelli che sono pubblicati sulla rete. La soluzione che è stata adottata per far fronte a questa importante esigenza si chiama Uniform Resource Locator (URL)046. La 'URL' di un documento corrisponde in sostanza al suo indirizzo in rete; ogni risorsa informativa (computer o file) presente su Internet viene rintracciata e raggiunta dai nostri programmi client attraverso la sua URL. Prima della introduzione di questa tecnica non esisteva alcun modo per indicare formalmente dove fosse una certa risorsa informativa su Internet. Una URL ha una sintassi molto semplice, che nella sua forma normale si compone di tre parti: tiposerver://nomehost/nomefile La prima parte indica con una parola chiave il tipo di server a cui si punta (può trattarsi di un server gopher, di un server http, di un server FTP, e così via); la seconda indica il nome simbolico dell'host su cui si trova il file indirizzato; al posto del nome può essere fornito l'indirizzo numerico; la terza indica nome e posizione ('path') del singolo documento o file a cui ci si riferisce. Tra la prima e la seconda parte vanno inseriti i caratteri '://'. Un esempio di URL è il seguente: http://www.liberliber.it/index.html La parola chiave 'http' segnala che ci si riferisce ad un server Web, che si trova sul computer denominato 'www.liberliber.it', dal quale vogliamo che ci venga inviato il file in formato HTML il cui nome è 'index.html'. Mutando le sigle è possibile fare riferimento anche ad altri tipi di servizi di rete Internet:
Occorre notare che questa sintassi può essere utilizzata sia nelle istruzioni ipertestuali dei file HTML, sia con i comandi che i singoli client, ciascuno a suo modo, mettono a disposizione per raggiungere un particolare server o documento. È bene pertanto che anche il normale utente della rete Internet impari a servirsene correttamente. Alcuni programmi per l'uso di World Wide WebLo strumento principale per la navigazione nelle pagine del World Wide Web è, abbiamo ricordato più volte, un 'browser', ovvero un programma in grado di richiedere la pagina che desideriamo raggiungere al server remoto che la ospita, riceverla e visualizzarla correttamente (testo, immagini, collegamenti ipertestuali, sfondi... il tutto impaginato seguendo le istruzioni fornite, sotto forma di marcatori HTML, da chi ha creato quella determinata pagina). I primi browser Web (come Mosaic) sono nati nei laboratori di ricerca delle università. L'esplosione del fenomeno Internet, in gran parte legata proprio a World Wide Web, ha determinato il moltiplicarsi delle iniziative per sviluppare nuovi programmi, o migliorare quelli esistenti, e in particolare ne ha mostrato le potenzialità commerciali. Questo ha attirato l'attenzione di molte case produttrici di software, e ha indotto moltissimi dei pionieri universitari a fondarne di nuove (il caso più clamoroso è quello della più volte citata Netscape Corporation). Attualmente in questo settore si sta combattendo una delle battaglie strategiche per il futuro dell'informatica e della telematica. Conseguentemente i programmi per accedere a World Wide Web oggi disponibili sono abbastanza numerosi, alcuni gratuiti, altri venduti con particolari formule commerciali. Come per gli altri servizi di rete visti finora, esistono browser per tutte le più diffuse piattaforme e sistemi operativi. L'utilizzazione di questi programmi, in linea di massima, è piuttosto facile: basta un semplice click del mouse, per collegarsi con un computer che è all'altro capo del mondo. Inoltre, come abbiamo già visto, un buon client Web può accedere in maniera del tutto trasparente ai server FTP e gopher, mostrare i messaggi dei newsgroup, gestire la posta elettronica e, come vedremo, le versioni più recenti possono anche ricevere automaticamente 'canali' informativi attraverso il meccanismo dell'information push. Un client Web può insomma integrare fra loro le principali funzionalità messe a disposizione da Internet. Ricordiamo che è possibile usare un browser grafico solo se si dispone di una connessione diretta alla rete, oppure di un collegamento con i protocolli PPP o SLIP047. Una volta attivato il collegamento alla rete, basta avviare il client sul proprio computer e iniziare la navigazione tra i milioni di server Web sparsi su Internet. Nelle pagine che seguono passeremo in rassegna alcuni tra i più diffusi browser, mostrandone le funzionalità principali. La nostra scelta è stata orientata dal livello tecnologico e dalla diffusione dei programmi rilevata al momento di scrivere il manuale. Ma ricordate che in questo campo qualsiasi tentativo di sistematizzazione è vano. Ogni consiglio su quale client scegliere, ogni illustrazione particolareggiata di uno di essi, rischia una rapidissima obsolescenza. L'unico consiglio che ci sentiamo di dare senza timore è questo: la via migliore per imparare ad utilizzare tutti gli strumenti del mondo di Internet è quella di usarli, spinti da una buona dose di curiosità. O, per dirla con Galilei, "provando e riprovando". Programmi con interfaccia a caratteriOvviamente, per utilizzare un sistema informativo come World Wide Web e per sfruttare pienamente le sue caratteristiche ipertestuali e multimediali, è necessario adoperare un client con una interfaccia grafica. Ma l'esperienza di navigare su World Wide Web, sebbene in maniera estremamente limitata, può essere provata anche da chi non dispone di collegamenti diretti o SLIP/PPP. Esistono infatti dei browser basati su interfaccia a caratteri che possono essere utilizzati anche attraverso una semplice connessione terminale ad un host di Internet. È sufficiente un qualsiasi programma di comunicazione con VT100 o VT102, due emulazioni terminale diffusissime, ed un modem, anche non particolarmente veloce, per collegarsi con l'host. Naturalmente è necessario che sull'host al quale ci si connette sia installata una versione del client. Per sapere se il proprio fornitore di accesso alla rete ne dispone, occorre chiedere direttamente al sistemista, o all'assistenza clienti nel caso di un provider commerciale. Se non fosse disponibile un client locale, si può ricorrere ad alcuni host che consentono un libero accesso, attraverso una semplice connessione telnet, ad un client Web. Potete ad esempio collegarvi via telnet all'indirizzo telnet.w3.org. Vi troverete il client WWW a caratteri sviluppato nei laboratori del CERN di Ginevra. Ma il miglior client a caratteri per muoversi su World Wide Web è probabilmente Lynx. Il programma è stato scritto da tre programmatori dell'Università del Kansas, Michael Grobe, Lou Montulli e Charles Rezac, e ne esistono versioni per molte piattaforme, compresa una per DOS. Vediamolo un po' più da vicino. Nella figura seguente potete vedere una schermata di Lynx in ambiente Unix, di gran lunga la versione più usata.
Come si può notare alcune parole sono in grassetto: sono altrettanti bottoni di voci attive. A seconda della configurazione del terminale i link potrebbero essere visualizzati in reverse, o con un colore diverso. Nella parte bassa dello schermo c'è un elenco dei comandi principali. Il posizionamento del cursore su un link avviene con i tasti 'Freccia su' e 'Freccia giù', e l'attivazione con il tasto 'Invio' oppure 'Freccia a destra'. Se volete tornare a una delle pagine Web già visitate basta premere il tasto 'Freccia a sinistra', e Lynx farà un passo indietro. Ci sono anche altri comandi molto utili: il tasto 'Canc' o 'Backspace', ad esempio, visualizza un elenco di tutti i link raggiunti durante la sessione. Il tasto '/' consente di effettuare una ricerca nel testo della pagina Web; è molto utile se la struttura della pagina è complessa e lunga. Con il tasto 'H' (help), vengono visualizzati manuali, e quanto altro possa servire per saperne di più. Abbiamo detto che per attivare una voce contenuta in una pagina WWW basta selezionarla con la tastiera. Il client provvederà a prelevare le informazioni associate alla voce, collegandosi automaticamente con un altro computer se le informazioni richieste sono memorizzate altrove. Se conosciamo già l'indirizzo della pagina alla quale ci vogliamo collegare, con il comando 'G' (go) possiamo attivare direttamente il collegamento. Premuto il tasto non dovremo fare altro che fornire la URL del documento o della risorsa con cui vogliamo collegarci. Questo modo di navigare su WWW non ha certamente le potenzialità dei browser grafici, che permettono la ricezione di immagini, mappe sensibili, suoni, video, oltre a presentare il testo su schermate grafiche con cui si può interagire attraverso il mouse. Va considerato, inoltre, che l'uso sempre più diffuso di schermate divise in più riquadri (frame) mette spesso i browser testuali del tutto fuori gioco. Un client a caratteri consente - in caso di necessità - un primissimo avvicinamento all'affascinante mondo di World Wide Web, ma, una volta iniziata l'esplorazione, vorrete sicuramente proseguirla dotandovi di strumenti più adeguati. La famiglia dei browser graficiLa famiglia dei browser grafici è ormai numerosissima. Nella nostra rassegna esamineremo i due programmi attualmente più evoluti e diffusi: Netscape Navigator (che prende il nome di Communicator quando integrato dal programma per la posta elettronica e i newsgroup), prodotto dalla omonima azienda americana, che è il browser di maggiore successo in questo momento (si calcola che venga usato da quasi il 60% degli utenti di Internet), e Microsoft Internet Explorer, il browser sviluppato dalla potente azienda di Bill Gates, che sta conquistando rapidamente una importante fetta di mercato e la cui versione 4, altamente innovativa, ha costituito una delle maggiori novità del 1997. In Internet '96 avevamo inserito in questa rassegna anche Mosaic,
sviluppato dallo NCSA, il capostipite dei browser grafici. A inizio 1997 ne era uscita la
versione 3; come le precedenti, tuttavia, anch'essa non era in grado di visualizzare
alcune caratteristiche ormai entrate a far parte di moltissimi siti Web: dalle pagine con
frames alle gif animate. E poche settimane dopo l'uscita di Mosaic 3, dalla NCSA arrivava
la ferale notizia: lo sviluppo di Mosaic sarebbe stato sospeso. Abbiamo quindi deciso di
non dedicare più a Mosaic una sezione autonoma; va comunque ricordato che Mosaic continua
ad essere un buon programma, con soluzioni talvolta assai innovative. Nell'ultima
versione, ad esempio, è possibile salvare separatamente intere sessioni di navigazione,
assegnando un nome a ciascuna; sono inoltre disponibili il 'Presentation Mode', che
permette di allargare la finestra del documento a tutto schermo trasformando Mosaic in un
vero e proprio proiettore di presentazioni, e il 'Mosaic Autosurf', che permette di
effettuare la navigazione automatica di uno o più siti, specificando attraverso una
finestra di dialogo fino a quale profondità seguire i link. Per ulteriori informazioni su
Mosaic, il riferimento d'obbligo è la home page ufficiale del programma, disponibile alla
URL http://www.ncsa.uiuc.edu/SDG/Software/Mosaic/
Altri due browser che sicuramente vale la pena citare sono Opera (http://www.operasoftware.com/) e Amaya (http://www.w3c.org/Amaya/). Il primo è caratterizzato soprattutto dalla compattezza del codice048 e dal fatto che richiede poche risorse di sistema. Opera perciò è il browser adatto a chi non ha un computer molto recente: i requisiti minimi per un uso accettabile sono un PC con microprocessore 386 e 8 Mb di memoria. Sia pure rinunciando a qualcosa (Opera, ad esempio, non supporta alcune funzionalità avanzate come Java) il programma garantisce un'ottima velocità operativa. Troviamo inoltre apprezzabile che la Opera Sofware, la ditta norvegese che ha realizzato il programma, si sia preoccupata di tradurlo in varie lingue, italiano compreso (vedere a tale proposito: http://www.promo.net/opera/italian/). A differenza di Microsoft Internet Explorer o di Netscape, Opera è a pagamento. Bisogna tuttavia considerare che la Opera Software non ha altri mezzi per continuare a sviluppare il programma. Il costo è del resto molto ridotto: 35$, con un forte sconto per scuole, istituti educativi e studenti. Il programma è disponibile in versione per Windows 95/98/NT 4 e Windows 3.x/NT 3.51. Amaya è, invece, un browser realizzato dal W3C (World Wide Web Consortium) e come tale promette la piena compatibilità con le specifiche e gli standard promossi dallo stesso W3C. È perciò lo strumento ideale per gli sviluppatori di pagine HTML che vogliono verificare la piena aderenza agli standard del loro lavoro. Una peculiarità di Amaya consiste nel fatto che è sia un browser, sia un editor; ovvero mentre si sta visualizzando una qualsiasi pagina Internet è possibile modificarla, anche se - ovviamente - le modifiche avranno effetto solo sulla copia della pagina che viene memorizzata nel nostro computer. In questa ottica, può anche essere visto come un ottimo editor per chi vuole crearsi delle pagine Web nel pieno rispetto delle direttive del W3C. Di Netscape e Internet Explorer abbiamo già avuto occasione di parlare, esaminandone le notevoli funzionalità di programmi 'multiuso', capaci di offrire efficienti moduli client per la gestione della posta elettronica e dei newsgroup, e per il trasferimento di file via FTP. In queste pagine ci occuperemo finalmente della loro caratteristica più importante, quella di strumento di consultazione delle pagine Web. Entrambi i programmi sono in grado di interpretare uniformemente la maggior parte delle istruzioni previste nelle più recenti specifiche del linguaggio HTML. Invece esiste una certa difformità sul supporto delle estensioni a questo insieme, alimentata dalla guerra commerciale esistente fra Microsoft e Netscape. Prima di vedere più da vicino il funzionamento dei due programmi, esamineremo alcune caratteristiche che sono comuni a tutti i browser grafici dell'ultima generazione, compresi naturalmente quelli che citeremo in questo manuale.
Cominciamo con gli elementi dell'interfaccia utente; l'immagine (figura 52) si riferisce a Netscape, ma quanto diremo si applica nelle grandi linee agli altri browser. In primo luogo la barra del titolo, nella parte superiore della finestra, permette di leggere il titolo del documento. Ci sono poi la consueta barra dei menu, quella dei pulsanti, a cui si aggiungono una barra che mostra la URL del documento visualizzato, e una barra dei siti di uso frequente. Il documento Web viene reso nella finestra principale in modalità grafica. Le varie sezioni del testo sono formattate con stili e tipi di carattere diversi. In particolare le porzioni di testo che attivano i link sono evidenziate dal cambiamento di colore del carattere, eventualmente associato alla sottolineatura. Il colore standard dei link disponibili in una pagina è il blu; ma la maggior parte dei browser è in grado di interpretare le istruzioni del linguaggio HTML che consentono di ridefinire il colore dei link. Per attivare un collegamento è sufficiente posizionare il puntatore su una porzione di testo o su un'immagine attivi (e cioè collegati ipertestualmente ad altri documenti in rete), e premere il tasto sinistro del mouse (l'unico tasto nel caso dei computer Macintosh). In genere, nel momento in cui il cursore transita su una porzione di testo o su un'immagine attivi, la sua forma cambia da quella di una freccia a quella di una manina che indica. Oltre ai link ipertestuali all'interno del documento, i browser mettono a disposizione una serie di strumenti di supporto alla navigazione. Le altre operazioni fondamentali che l'utente può effettuare sono le seguenti:
Queste funzioni sono attivabili attraverso la barra di pulsanti o i comandi dei menu a tendina. La lista dei segnalibri, che abbiamo già visto nei client gopher, è uno degli strumenti più utili. Si tratta di una lista di puntatori che può essere richiamata, in qualsiasi client, tramite un menu a tendina o una apposita finestra. Le voci dei segnalibri contenute nel menu corrispondono ai titoli delle pagine nella barra del titolo. Ogni utente dovrebbe avere cura di costruire una lista adatta alle proprie esigenze, e dovrebbe sfoltirla periodicamente dalle voci non più interessanti, per preservarne la natura di strumento di rapida consultazione. Sia Netscape che Internet Explorer consentono di personalizzare la propria lista di segnalibri, strutturandola in cartelle e sottocartelle. Oltre ai comandi per la navigazione sono disponibili anche alcune funzionalità standard: la memorizzazione su disco del documento corrente, la stampa, la visualizzazione del file sorgente in formato HTML. In generale i browser, oltre al formato HTML, sono in grado di visualizzare autonomamente i file di testo in semplice formato ASCII non marcato, ed almeno i due formati di file grafici più diffusi su Internet: il GIF e il JPEG, integrando le immagini all'interno del documento. Se il file che viene ricevuto dalla rete è in un formato che il browser non sa interpretare direttamente, ma che comunque 'conosce' perché associato a un altro programma disponibile nel sistema, esso può avviare automaticamente delle applicazioni di supporto in grado di interpretarlo: se si tratta di un file sonoro verrà avviato un riproduttore di suoni, se si tratta di un video verrà avviato un programma di riproduzione video, e così via. L'utente può aggiungere quanti visualizzatori esterni desidera, attraverso le procedure di configurazione di ogni singolo browser. Qualora non fosse disponibile un programma per un dato formato, è possibile memorizzare il file sull'hard disk locale. Una ulteriore possibilità nella gestione di formati di file non standard è stata introdotta da Netscape e ripresa da Internet Explorer: si tratta dei plug-in, dei moduli software che si integrano pienamente con il browser. La maggior parte dei browser condividono anche alcune caratteristiche tecnologiche che rendono più efficiente l'accesso on-line alle pagine, specialmente per chi usa una linea telefonica:
La prima caratteristica si riferisce al modo in cui il browser gestisce i file che vengono inviati dal server remoto, e alle precedenze nella composizione a video della pagina. Come abbiamo detto i file HTML sono dei semplici file in formato ASCII. Questo significa che un documento testuale su Web, anche se molto lungo, ha una dimensione in byte molto contenuta. I file grafici invece, anche se usano uno dei cosiddetti algoritmi di compressione, sono molto più esosi nell'occupazione di spazio. Quando una pagina Web viene inviata, il file di testo arriva quindi molto più velocemente dei file grafici eventualmente a corredo. Per evitare tempi morti, e poiché si può assumere che un utente sia, in genere, interessato alla lettura del testo prima che alla visione delle immagini, molti browser cominciano subito a visualizzare il testo, anche prima che tutte le immagini vengano ricevute completamente. E il testo stesso viene visualizzato progressivamente, man mano che arrivano i dati, senza aspettarne la ricezione completa. Questo meccanismo aumenta notevolmente la velocità di una navigazione. La memoria di deposito, o cache memory, è invece una sorta di duplicato locale di piccole sezioni del World Wide Web. L'uso della cache permette di velocizzare un eventuale nuovo accesso a pagine già visitate precedentemente, o a file già caricati. Ogni volta che il browser riceve dalla rete una pagina, fa una copia di tutti i file che la compongono sul disco rigido locale. Se nel seguito della navigazione l'utente contatta di nuovo quella medesima pagina, il programma carica i file memorizzati nella cache, piuttosto che richiederli al server remoto. Il meccanismo funziona anche se lo stesso file ricorre in più pagine: ad esempio le icone che si ripetono su tutte le pagine di un certo sito. La disponibilità e la dimensione della memoria cache sono modificabili attraverso i comandi di configurazione del browser (lo vedremo nei casi specifici). Dopo un determinato periodo di tempo, o quando lo spazio disponibile sul disco viene esaurito, il browser cancella i file più vecchi, per fare spazio a quelli nuovi. Windows 98permette di effettuare automaticamente questa operazione di 'pulizia', a intervalli prefissati. I proxy server estendono il meccanismo della memoria cache locale. Un proxy server è un software che viene di norma installato su uno dei computer di una rete locale collegata ad Internet. La sua funzione è quella di conservare in un apposito archivio una copia di ogni file richiesto dagli utenti che accedono alla rete (l'archivio può avere dimensioni variabili a seconda della capacità di memoria del sistema su cui risiede). Quando un utente richiede di accedere ad una data risorsa, il suo browser contatta in primo luogo il proxy server (come dice il nome, prossimo, e dunque molto più veloce): se le informazioni sono già presenti nella memoria locale, il proxy le invia senza stabilire il collegamento con i computer remoti (o stabilendo un collegamento assai rapido al solo scopo di verificare che i file richiesti non siano nel frattempo stati modificati); altrimenti effettua la normale procedura di trasferimento remoto, e prima di recapitare i dati al computer chiamante ne conserva una copia. L'uso del proxy server ha naturalmente senso solo se esso si trova sulla stessa sottorete del client. Si dimostra particolarmente utile per i provider che forniscono collegamenti PPP, poiché consente di aggirare in parte i rallentamenti della rete Internet, garantendo nel contempo un'alta velocità di utilizzo all'utente finale e un minore flusso di dati sui canali pubblici, con vantaggio per tutti. Per il momento solo alcuni fornitori commerciali offrono questo tipo di servizio. Per fare in modo che il browser sfrutti questa tecnologia, qualora fosse disponibile, occorre configurarlo adeguatamente: vedremo in seguito come farlo nel caso dei due programmi presi in considerazione in questa sede. L'ipertesto globale: World Wide Web |