Opera del Vocabolario Italiano

Istituto del Consiglio Nazionale delle Ricerche

News

L'OVI AGGIORNA I SUOI CORPORA

22-06-2025

L’OVI pubblica una nuova versione dei suoi corpora, il Corpus TLIO per il vocabolario e il Corpus OVI dell’italiano antico, in linea con l’assetto elaborato nell’ambito del progetto «RENOVO. Rigenerare il corpus OVI: rinnovo e ottimizzazione di metodi, contenuti, strumenti» (PRIN 2017), mirato al rinnovamento filologico e testuale dei due corpora in continuità con il progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015). Si vedano i  criteri per l’aggiornamento.
Corpus TLIO per il vocabolario

Corpus lemmatizzato, è il corpus di riferimento per la redazione del TLIO. Con l'aggiornamento del 16  giugno sono stati inseriti 58 testi nuovi, finora assenti (vedi elenco qui). 

La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 3.353 testi (con un incremento di 58 unità rispetto alla versione del 9 settembre 2024), per un totale di 24.160.197 occorrenze (con un incremento di111.476 occorrenze), ​500.446 forme grafiche distinte, ​​​127.579 lemmi e ​​4.856.664 occorrenze lemmatizzate (con un incremento di ​45.783 occorrenze).

Corpus OVI dell’italiano antico

Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GattoWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico. 

La nuova versione del Corpus OVI che oggi si pubblica on line comprende ​​3.725 testi (con un incremento di ​74 unità rispetto alla versione ​del 9 settembre 2024, vedi elenco qui), per un totale di  ​30.825.286 occorrenze (con un incremento di ​​​​​143.288 occorrenze) e ​​​562.342 forme grafiche distinte.