Letture - Home Page
Lingua e...

LA NOSTRA CULTURA
CAMBIA CASA

di Claudio Marazzini


Letture n. 11 novembre 1997 - Home Page

Le università stanno realizzando la Biblioteca Telematica Italiana: tutti i testi dalle origini a oggi su Internet. Una trasformazione epocale paragonabile al passaggio dal manoscritto alla stampa.

Comincia finalmente a essere operativo il "Ci-Bit", il Consorzio Interuniversitario Biblioteca Italiana Telematica (chi volesse avere informazioni, oltre a quelle che daremo qui, potrà consultarne il sito Web, di cui riproduciamo il logo qui accanto, all’indirizzo http://cibit.unipi.it). Il Consorzio è nato un anno fa dalla collaborazione di tredici università, L’Aquila, Ferrara, Genova, Messina, Napoli, Padova, Pavia, Pisa, Roma "La Sapienza", Torino, Trento, Udine, Venezia (si sono poi aggiunte unità di ricerca dell’Università di Catania e dell’Università per stranieri di Siena, e sta per essere firmata una convenzione con la Rai, che offrirà spazio nel suo sito Web).

L’obiettivo di questa task-force accademica è la creazione e la diffusione in Internet di una ricchissima base-dati testuale multimediale relativa alla cultura italiana, comprendente lingua, letteratura, storia, filosofia, politica, diritto, religione, arte, musica, su di un arco cronologico dalle origini al Novecento. I fondatori del Ci-Bit, un anno fa, erano mossi da una preoccupazione profonda: sentivano il dovere, in quanto intellettuali immersi nell’attuale società telematica, alle soglie del nuovo Millennio, di trovare i mezzi per trasferire il patrimonio nazionale italiano (secoli di ricchezza incomparabile) nei nuovi canali della comunicazione, di cui Internet è il simbolo e anche l’approdo.

Il compito assunto può essere davvero inteso solo se viene paragonato, per impegno e responsabilità, a quanto accadde all’avvento dell’èra della stampa, tra Quattro e Cinquecento, quando una generazione di studiosi umanisti, lavorando a fianco di tipografi (anch’essi, spesso, umanisti, oltre che imprenditori e tecnici), trasferì nel libro stampato a caratteri mobili l’intero patrimonio che prima circolava nei manoscritti. L’impresa non fu un mero fatto meccanico. Fu, piuttosto, una trasformazione epocale, che richiese prima di tutto un immane sforzo filologico. Oltre al resto, essa si accompagnò a tutta una serie di notevolissimi effetti collaterali, tra i quali ci fu persino la normalizzazione grafica e grammaticale della lingua italiana, prima d’allora molto più libera e oscillante nelle convenzioni scrittorie dei vari centri culturali, scarsamente omologati.

Come rivela questo raffronto con l’avvento dell’èra della stampa, il progetto Ci-Bit nasce da una grande ambizione e da grandi speranze nell’interesse che possono suscitare i testi della cultura italiana. Questi testi potranno essere letti, ma anche studiati e sottoposti, per così dire, a processi analitici complessi: si tratta di organizzare una grande base-dati, una biblioteca di fonti primarie in edizioni attendibili e in testo integrale, la cui consultazione sarà straordinariamente rapida ed efficace grazie a un potente motore di ricerca, il Dbt di Eugenio Picchi. Il Dbt (Data Base Testuale) è nato per "girare" sui normali personal computer. Poiché l’interrogazione della Biblioteca Italiana avverrà attraverso Internet, occorre adeguare il Dbt alle nuove esigenze.

L’elettronica a sostegno della ricerca

A questo fine si sta elaborando, presso l’Istituto di Linguistica Computazionale di Pisa, il nuovo Dbt-Net, dedicato appunto alla gestione in rete di una base-dati full text di grandi dimensioni con architettura biblioteconomica. Questo programma sarà dotato di potenti funzioni di information retrieval e di speciali strumenti di analisi linguistica e concettuale (e, cosa non secondaria, il software risponderà alle direttive internazionali della Tei, Text Encoding Initiative, e ai parametri del linguaggio Sgml, Standard Generalized Murkup Language).

Il corpus dei testi raccolti sarà accompagnato da un catalogo generale elettronico capillarmente indicizzato, da apparati filologici, da strumenti bibliografici ed enciclopedici di consultazione, da elaborazioni linguistiche (concordanze lemmatizzate con etichettatura grammaticale, strumenti di statistica linguistica), da thesauri per l’interrogazione concettuale di testi specialistici.

Il Ci-Bit nasce sotto la direzione di Mirko Tavoni (professore di Storia della lingua italiana nell’Università di Pisa), e gli storici della lingua sono fortemente presenti nell’iniziativa. Ne consegue che gli strumenti di analisi linguistica saranno curati in modo speciale. Ne è garanzia anche la collaborazione del prof. Zampolli, direttore del Centro di Linguistica Computazionale del Cnr. La Biblioteca Italiana Telematica sarà insomma un’infrastruttura potente, posta a sostegno della ricerca, al servizio dell’italianistica di tutto il mondo.

Consultabile da tutto il mondo

Poiché Internet concede un accesso largo, non limitato agli specialisti, è prevedibile una ricaduta sul pubblico largo, sulle scuole. Alla costruzione della Biblioteca Italiana Telematica si affiancherà, certo, una riflessione sulle valenze scientifiche dei corpora testuali ai fini di analisi linguistiche e lessicografiche, ma nel progetto vi sono anche importanti valenze didattiche, evidenti nell’uso di biblioteche digitali in rete. Vi è poi una prospettiva "promozionale" che riguarda la diffusione della lingua e della cultura italiana nel mondo. Si pensi che la Biblioteca Italiana Telematica sarà consultabile anche là dove i libri e gli insegnanti di italiano non arrivano, o sono pochi e insufficienti. Un effetto collaterale, ma non secondario, sarà inoltre la promozione sempre maggiore della conoscenza degli strumenti informatici ai fini della ricerca e della didattica umanistica in molte università italiane, e la valorizzazione internazionale della nostra tecnologia linguistico computazionale, visto che il Dbt (il "motore" di ricerca) è nato nel nostro Paese e con finanziamenti pubblici (soldi ben spesi, una volta tanto, vien da dire).

Si tratta dunque di costituire qualche cosa di più di una serie di concordanze. Una caratteristica peculiare del progetto Biblioteca Italiana Telematica è volersi costituire come vera biblioteca digitale, affiancando alle fonti primarie una gran quantità di strumenti di consultazione integrati in un’architettura bibliografico-biblioteconomica complessa. Per questo gli specialisti dei testi (filologi, studiosi di letteratura, lingua, storia, filosofia, politica, diritto eccetera) lavoreranno a fianco dei linguisti computazionali e ai bibliotecari-biblioteconomi.

Se si allarga lo sguardo al di là dei confini italiani, si vede che il trasferimento nei canali informatici di grandi corpora è ormai un fatto urgente e necessario. Non a caso, sullo sfondo del progetto Ci-Bit, stanno le competenze maturate in imprese relative alla costruzione di basi-dati full text, tanto in rete (per l’Italia, il Tesoro della lingua italiana delle origini dell’Opera del Vocabolario italiano; per la Francia il Tresor de la langue française dell’Institut National de la langue française eccetera), quanto su Cd-Rom (ancora, per l’Italia, la Letteratura Italiana Zanichelli; per la Spagna, l’Archivo Digital de Manuscritos y Textos Españoles; per il latino medievale, la Patrologia latina di Chadwick-Healey e il Cetedoc dell’Università di Lovanio). Questa base di partenza è arricchita dalle esperienze di digitalizzazione di patrimoni librari avviate in vari Paesi sotto l’egida del progetto G7 "Bibliotheca Universalis", e dagli sviluppi teorici e applicativi legati alle digital libraries.

Il Ci-Bit va al di là dei confini della lingua e della linguistica. È notevole, però, che l’iniziativa nasca con il contributo determinante di storici della lingua e di filologi. Le ragioni linguistiche, infatti, sono state e sono tuttora determinanti nell’elaborazione stessa degli obiettivi e nella loro definizione qualitativa. Si tratta di un’iniziativa di tale respiro che (tanto per fare un esempio), tra i 257 progetti del settore umanistico (nell’area disciplinare delle Scienze dell’antichità, filologico-letterarie e storico-artistiche) presentati al Ministero dell’Università nel luglio scorso, quello del CiBit è risultato il primo in ordine di grandezza per numero di unità di ricerca. Anche gli umanisti, insomma, stanno imparando a muoversi bene nella società tecnologica.

Claudio Marazzini
   
   

   Letture - Home Page
Periodici San Paolo - Home Page
Letture n. 11 novembre 1997 - Home Page