Opera del Vocabolario Italiano

Istituto del Consiglio Nazionale delle Ricerche

News

L'OVI AGGIORNA I SUOI CORPORA (settembre 2025)

15-09-2025

L’OVI pubblica una nuova versione dei suoi corpora, il Corpus TLIO per il vocabolario e il Corpus OVI dell’italiano antico, in linea con l’assetto elaborato nell’ambito del progetto «RENOVO. Rigenerare il corpus OVI: rinnovo e ottimizzazione di metodi, contenuti, strumenti» (PRIN 2017), mirato al rinnovamento filologico e testuale dei due corpora in continuità con il progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015). Si vedano i  criteri per l’aggiornamento.
Corpus TLIO per il vocabolario

Corpus lemmatizzato, è il corpus di riferimento per la redazione del TLIO. Con l'aggiornamento dell'8 settembre ​Sono state aggiornate le edizioni di 8 testi già presenti nel Corpus TLIO in edizioni superate (vedi elenco qui) e sono stati inseriti 95 testi nuovi, finora assenti (vedi elenco qui). La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 3.452 testi (con un incremento di 99 unità rispetto alla versione del 16 giugno 2025), per un totale di 24.285.827 occorrenze (con un incremento di 125.630 occorrenze), 503.539 forme grafiche distinte, 128.196 lemmi e 4.904.409 occorrenze lemmatizzate (con un incremento di 47.745 occorrenze).

Corpus OVI dell’italiano antico

Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GattoWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico. 

Vi si sono inseriti 16 testi finora assenti, che non rientrano nei criteri di inclusione nel Corpus TLIO (vedi elenco qui). La nuova versione del Corpus OVI che oggi si pubblica on line comprende 3.840 testi (con un incremento di 115 unità rispetto alla versione del 16 giugno 2025), per un totale di 31.222.521 occorrenze (con un incremento di 397.235 occorrenze) e 566.393 forme grafiche distinte.