Opera del Vocabolario Italiano

Istituto del Consiglio Nazionale delle Ricerche

News

L'OVI AGGIORNA I SUOI CORPORA

30-09-2024

L’OVI pubblica una nuova versione dei suoi corpora, il Corpus TLIO per il vocabolario e il Corpus OVI dell’italiano antico, in linea con l’assetto elaborato nell’ambito del progetto «RENOVO. Rigenerare il corpus OVI: rinnovo e ottimizzazione di metodi, contenuti, strumenti» (PRIN 2017), mirato al rinnovamento filologico e testuale dei due corpora in continuità con il progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015). Si vedano i  criteri per l’aggiornamento .
Corpus TLIO per il vocabolario

Corpus lemmatizzato, è il corpus di riferimento per la redazione del TLIO. Con l'aggiornamento del 9  settembre sono stati inseriti 47 testi nuovi, finora assenti (vedi elenco qui). 

La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 3.295 testi (con un incremento di 50 unità rispetto alla versione del 4 aprile 2024), per un totale di ​​​24.048.721 occorrenze (con un incremento di ​35.999 occorrenze), ​498.403 forme grafiche distinte, ​​127.151 lemmi e ​4.810.881 occorrenze lemmatizzate (con un incremento di ​102.854 occorrenze).

Sono state inoltre aggiornate le edizioni di 12 testi (vedi l'elenco qui)

Corpus OVI dell’italiano antico

Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GATTOWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico. 

La nuova versione del Corpus OVI che oggi si pubblica on line comprende ​3.651 testi (con un incremento di 139 unità rispetto alla versione ​del 4 aprile 2024, vedi elenco qui), per un totale di  30.681.998 occorrenze (con un incremento di ​​​​238.718 occorrenze) e ​​559.940 forme grafiche distinte.