|
Lo scanner (vedi figura a lato) è un apparecchio che, similmente ad una fotocopiatrice, è in grado di riprodurre una immagine o un testo. Differentemente da quanto fa una fotocopiatrice, però, lo scanner non stampa ciò che riproduce, ma lo trasmette - in formato digitale - al computer al quale è collegato. Se l'immagine acquisita dallo scanner è, ad esempio, la pagina di un libro, un computer dotato di un programma OCR è in grado di trasformare tale immagine in testo.
Si noti la differenza tra "immagine" di una pagina e "testo" in essa contenuto. Come noto, un computer non è in grado di "leggere" (cioè di trasformare l'immagine dei caratteri in parole di senso compiuto), così ha bisogno di programmi specifici (gli OCR) per svolgere una funzione che a noi esseri umani appare semplice.
Quando la qualità dell'immagine di una pagina acquisita via scanner è buona e l'impaginazione del documento non è troppo complessa, il computer riesce a interpretarne il contenuto con un indice di affidabilità superiore al 99%. Non si riesce, purtroppo, ad avere una affidabilità del 100% perché il computer non è in grado di "capire" ciò che sta leggendo, così notiamo a volte che in testi acquisiti via scanner ci sono degli "1" in luogo delle "i" o delle "l", degli "0" in luogo delle "O" e così via. In altri termini, un essere umano capisce immediatamente che la parola "alber0" (cioè "alber" seguito dal numero zero) non ha senso, e corregge istintivamente in "albero". Un computer, ovviamente, no.
Esistono anche scanner manuali (o handy scanner, come quello raffigurato qui a sinistra). Sono di piccole dimensioni ed hanno costi solitamente contenuti. Purtroppo questi modelli non sono adatti al lavoro di acquisizione digitale di testi, perché danno luogo a troppi errori di interpretazione da parte dei programmi OCR.
Torna alla pagina "2] Note tecniche".
Se noti errori di qualsiasi tipo, per favore segnalaceli tramite la pagina "segnalazione degli errori". |
 |