Opera del Vocabolario Italiano

Istituto del Consiglio Nazionale delle Ricerche

News

L'OVI AGGIORNA I SUOI CORPORA

01-10-2023

L’OVI pubblica una nuova versione dei suoi corpora, il Corpus TLIO per il vocabolario e il Corpus OVI dell’italiano antico, in linea con l’assetto elaborato nell’ambito del progetto «RENOVO. Rigenerare il corpus OVI: rinnovo e ottimizzazione di metodi, contenuti, strumenti» (PRIN 2017), mirato al rinnovamento filologico e testuale dei due corpora in continuità con il progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015). Si vedano i  criteri per l’aggiornamento .
Corpus TLIO per il vocabolario

Corpus lemmatizzato, è il corpus di riferimento per la redazione del TLIO. Con gli aggiornamenti del 2  agosto e del 18 settembre sono stati inseriti 37 testi nuovi, finora assenti, ma 2 erano già nel Corpus OVI (vedi elenco qui). 

La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 3.210 testi (con un incremento di 37 unità rispetto alla versione del 2 ottobre 2022), per un totale di ​23.814.549 occorrenze (con un incremento di 128.915 occorrenze), ​494.385 forme grafiche distinte, ​126.208 lemmi e ​4.622.327 occorrenze lemmatizzate (con un incremento di ​96.236 occorrenze).

Corpus OVI dell’italiano antico

Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GATTOWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico. 

La nuova versione del Corpus OVI che oggi si pubblica on line comprende 3.447 testi (con un incremento di 35 unità - gli stessi testi inseriti nel Corpus TLIO - rispetto alla versione ​del 2 ottobre 2022,  gli stessi inclusi nel Corpus TLIO - vedi elenco qui), per un totale di ​30.245.108 occorrenze (con un incremento di ​​68.480 occorrenze) e ​553.868 forme grafiche distinte.