Tutte le notizie

L’OVI visto dall’OVI

scheda di autovalutazione dell’attività del 2012
presentata al CNR con il piano di gestione 2013-2015

 

 

L'OVI è l'organo del CNR deputato alla lessicografia istituzionale, cioè alla lessicografia che ha come priorità l'orientamento alla ricerca per fini di politica culturale, non finalizzata al ritorno economico (tipicamente, ma non necessariamente gestita da enti pubblici, com'è in Francia l'ATILF del CNRS, ma si veda in Gran Bretagna il diverso caso dell' "Oxford English Dictionary"). Il compito, di natura in sé permanente, è l'elaborazione e, successivamente, la manutenzione e l'aggiornamento del vocabolario storico nazionale (anche per la parte antica, che si aggiorna con i progressi della ricerca filologica).

Attualmente l'OVI lavora al vocabolario storico dell'italiano antico (fino alla fine del Trecento), denominato "Tesoro della Lingua Italiana delle Origini" (TLIO). La scelta di separare il TLIO dal resto del vocabolario, e di elaborare intanto solo questo, è motivata da sempre (a) da una valutazione delle risorse e (b) dal fatto che, anche potendo elaborare il vocabolario nel suo insieme, la parte antica richiederebbe metodi e strumenti propri, e sarebbe comunque necessaria come base dell'intera costruzione, date le caratteristiche della storia della lingua italiana.

Il lavoro al TLIO si svolge come un insieme di attività collegate, comprendente, accanto alla redazione propriamente detta, l'elaborazione degli strumenti: banche dati testuali, indispensabili alla ricerca lessicografica moderna; programmi informatici specifici per le esigenze delle banche dati e della redazione del vocabolario. I collaboratori del TLIO, inquadrati con varie qualifiche, sono studiosi che intorno all'elaborazione del vocabolario conducono proprie ricerche di filologia, storia della lingua e letteratura, per le quali sono anche coinvolti in progetti diversi dal TLIO, ma in sinergia con esso:

1) DiVo - "Dizionario dei Volgarizzamenti. Il lessico di traduzione dal latino nell'italiano delle origini: bibliografia filologica, corpus bilingue lemmatizzato, dizionario storico settoriale", FIRB - Futuro in ricerca, con coordinamento centrale all'OVI e unità di ricerca all'OVI e alla Scuola Normale Superiore di Pisa. Banca dati dei testi volgarizzati allineati con gli originali latini, e una serie di prodotti filologici, bibliografici e lessicografici coordinati.

2) "Formazione e evoluzione della lingua poetica italiana delle origini: database ipertestuale, lemmatizzazione e elaborazione di un lessico della poesia delle origini", PRIN 2008, con coordinamento centrale all'Università di Roma La Sapienza. Corpus dei testi italiani in versi dalle origini alla fine del Trecento, con lemmatizzazione tematica del lessico dell'affettività e voci afferenti a tale lessico, integrate nel TLIO, che verranno inoltre pubblicate in un volume autonomo.

3) LiRio - "Corpus della lirica italiana delle origini su CD-ROM", in collaborazione con la Fondazione Ezio Franceschini e l'Università di Siena. Prima parte, dagli inizi al 1337 (morte di Bindo Bonichi) pubblicata nel 2011, la seconda in pubblicazione nel 2013 (senza finanziamento specifico, parallelo di fatto al progetto PRIN).

4) LIVS - "Lingua italiana e vocabolario storico: metodi antichi e moderni", PAR-FAS Regione Toscana, per la rielaborazione parallela dell'archivio filologico del TLIO e dell'archivio lessicografico storico delle cinque edizioni del Vocabolario degli Accademici della Crusca.

Anche la redazione del TLIO è stata sostenuta da un progetto FIRB (bando 2006, decorrenza 2009-2012) avente come oggetto l'avanzamento del vocabolario, con banche dati e software, e la sua divulgazione in ambito internazionale.

I prodotti dei lavori del vocabolario sono tipicamente stati di avanzamento; al 30 novembre 2012:

(a) del TLIO sono state redatte circa 27.000 voci, di cui 25.639 edite online al 30.11.2012, le altre in fase di revisione per la pubblicazione online entro l’anno. Una valutazione grossolanamente quantitativa dell'opera si ricava dallo stato di avanzamento di fine maggio 2011 (23.509 voci), stampato in pdf per la rendicontazione FIRB, che conta quasi 11.000 pagine per quasi 60 milioni di caratteri (esattamente 10.987 pagine per 59.892.785 caratteri);

(b) il Corpus OVI dell'Italiano antico consiste di 2320 testi per circa 23,2 milioni di occorrenze, di cui 2001 testi per circa 21,9 milioni di occorrenze nel Corpus TLIO lemmatizzato e il resto nel Corpus TLIO aggiuntivo, di testi in attesa di lemmatizzazione. L’insieme viene regolarmente aggiornato in rete ogni quattro mesi (aggiunte di testi, correzioni, evoluzione della lemmatizzazione), come non avviene per nessun altro corpus testuale in rete;

(c) è ulteriormente avanzata la preparazione della versione 4 di GATTO, il sofware dell'OVI per la creazione, gestione, lemmatizzazione e interrogazione di banche dati testuali, operativo nella versione 3.3; la versione 4 è XML compatibile e dotata di un lemmatizzatore 'semiautomatico' di nuova concezione, prodotto anch'esso dall'OVI e in fase di sperimentazione, e di un lemmatizzatore automatico per la lingua moderna integrato grazie alla collaborazione con l'ILC di Pisa;

(d) è avanzata la preparazione di un nuovo editor per la redazione del TLIO (adattabile anche ad altri dizionari storici);

In sede di autovalutazione, si propongono in sintesi all'attenzione i punti seguenti:

(1) La continuità del lavoro svolto negli anni. Dal 1998 a oggi, senza scarti apprezzabili, il prodotto corrispondente alla missione dell'Istituto è correlabile alle risorse impiegate. Il TLIO, in particolare, è avanzato a un ritmo di circa 2000 voci per anno, con l'eccezione del biennio 2007-2008, ed i prodotti correlati (banche dati e software) sono regolarmente progrediti da un anno all'altro. In regime di risorse ottimali (improbabili, ma non impensabili) potrebbero essere prodotte fino a 4000 voci per anno; per andare oltre si dovrebbero introdurre cambiamenti strutturali non desiderabili, per es. rimuovere il principio che, per omogeneità, tutte le voci, nuove o aggiornate, devono essere riviste almeno una volta dalle stesse due-tre persone e, in particolare, tutte dal direttore.

(2) Il notevole apprezzamento ottenuto e consolidato nel tempo da parte della comunità scientifica nazionale e internazionale. Per esempio il "Lessico Etimologico Italiano" (LEI) di Saarbrücken, diretto da Max Pfister, impresa di assoluto prestigio internazionale che riceve dall'Università italiana ampia e partecipe collaborazione, utilizza da anni sistematicamente il TLIO (dizionario e banca dati, siglata TLIOMat) fra le sue fonti. Il direttore del "Nuevo diccionario histórico de la lengua española" (NDHE) della Real Academia Española, José Antonio Pascual annovera il TLIO fra i migliori dizionari storici da cui prendere esempio, accanto all'Oxford English Dictionary, al Trésor de la Langue Française, al Woordenboek der Nederlandsche Taal (in "Perspectives on Lexicography in Italy and Europe", Cambridge Scholars, 2009, p. 13). Attesta l'uso negli studi del TLIO e ancor più del Corpus OVI dell'Italiano antico l'elenco di citazioni in contributi scientifici leggibile nel sito dell'OVI, cospicuo sebbene raccolto in modo quasi casuale senza alcuna sistematicità.

(3) Le ricadute 'nascoste' del TLIO sulla lessicografia italiana dell'uso, poiché oggi il TLIO, insieme con la banca dati, si affianca agli strumenti tradizionali consultati (spesso senza citazione esplicita) dai dizionari dell'uso, e costituisce, in particolare, una fonte di valore unico per le prime attestazioni, che da qualche tempo i dizionari dell'uso hanno cominciato a indicare (in particolare, numerosissime retrodatazioni rispetto al GDLI, o Battaglia, che per i dizionari degli ultimi due decenni è stato la fonte principale). In questo senso la funzione del TLIO è analoga a quella esercitata in Francia dal Trésor de la Langue Française e dalle banche dati dell'ATILF del CNRS.

(4) La presa del TLIO su un pubblico più ampio dei soli specialisti, dimostrata dall'accesso ogni mese di varie migliaia di visitatori unici. Il pubblico più interessante sarebbe quello della scuola, come si è messo in evidenza alla Giornata di studi su CNR e Scuola organizzata dal Dipartimento IC il 2.10.2009. Il TLIO è spendibile nell'insegnamento dei licei, dato che copre il periodo dei grandi classici fondatori della lingua oltre che della letteratura italiana. Iniziative di raccordo con la Scuola potrebbero essere prese con il necessario aiuto del Dipartimento.

(5) Il fatto che, nonostante la propria natura di Istituto che necessariamente si identifica con un solo progetto 'interno', l'OVI sia stato in grado, negli ultimi anni, di affacciarsi con successo sul mercato dei finanziamenti competitivi: cfr. sopra per quanto riguarda FIRB, FIRB - Futuro in ricerca, PRIN, PAR-FAS Regione Toscana.

Sull'ultimo punto bisogna però tornare a ripetere, come ogni anno, che l'OVI è titolare di una missione di carattere permanente e tipicamente pubblica, il cui futuro dovrebbe essere assicurato da un adeguato finanziamento ordinario, piuttosto che affidato al mercato dei progetti, per il quale, nonostante i successi citati, l'Istituto non ha le caratteristiche strutturali. L'impegno nei progetti, al quale si viene sempre più sollecitati per reperire finanziamenti alternativi al fondo ordinario, rende inevitabilmente più complesso l'impegno rivolto al vocabolario, per quanto si cerchi di elaborare progetti sinergici con esso. È questa una criticità di medio periodo che dovrebbe essere attentamente considerata.

A sostegno della missione dell'Istituto, si avverte inoltre la necessità di una piena valorizzazione del lavoro al vocabolario, necessariamente collettivo e in parte oscuro (soprattutto per quanto riguarda il contributo alla banca dati), in funzione delle carriere del personale, che rischia altrimenti di essere demotivato, e di un più aperto coinvolgimento del CNR in un progetto che è dell'Ente, non di un Istituto e nemmeno del suo direttore.