Opera del Vocabolario Italiano

Istituto del Consiglio Nazionale delle Ricerche

News

L'OVI AGGIORNA I SUOI CORPORA

15-04-2026

L’OVI pubblica una nuova versione dei suoi corpora, il Corpus TLIO per il vocabolario e il Corpus OVI dell’italiano antico, in linea con l’assetto elaborato nell’ambito del progetto «RENOVO. Rigenerare il corpus OVI: rinnovo e ottimizzazione di metodi, contenuti, strumenti» (PRIN 2017), mirato al rinnovamento filologico e testuale dei due corpora in continuità con il progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015). Si vedano i  criteri per l’aggiornamento.
Corpus TLIO per il vocabolario

Corpus lemmatizzato, è il corpus di riferimento per la redazione del TLIO. Con l'aggiornamento dell'8 aprile ​sono state aggiornate le edizioni di 36 testi già presenti nel Corpus TLIO in edizioni superate (vedi elenco qui) e sono stati inseriti 77 testi nuovi, finora assenti (vedi elenco qui).

La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 3.531 testi ​(con un incremento di 79 unità rispetto alla versione dell'8 settembre 2025), per un totale di ​​​​​24.388.719 occorrenze (con un incremento di ​102.892​ occorrenze), ​504.880 forme grafiche distinte, ​​​128.381 lemmi e​ 
4.​947.034 occorrenze lemmatizzate (con un incremento di ​42.625 occorrenze).

Corpus OVI dell’italiano antico

Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GattoWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico. 

Vi si sono inseriti 2 testi finora assenti, che non rientrano nei criteri di inclusione nel Corpus TLIO (vedi elenco  qui ). La nuova versione del Corpus OVI che oggi si pubblica on line comprende ​3.921 testi (con un incremento di ​81 unità rispetto alla versione ​dell'8 settembre 2025, per un totale di  ​​​31.386.970 occorrenze (con un incremento di ​​​​​​164.449 occorrenze) e ​​​​568.964 forme grafiche distinte.