Opera del Vocabolario Italiano

Istituto del Consiglio Nazionale delle Ricerche

News

L'OVI AGGIORNA I SUOI CORPORA

04-04-2024

L’OVI pubblica una nuova versione dei suoi corpora, il Corpus TLIO per il vocabolario e il Corpus OVI dell’italiano antico, in linea con l’assetto elaborato nell’ambito del progetto «RENOVO. Rigenerare il corpus OVI: rinnovo e ottimizzazione di metodi, contenuti, strumenti» (PRIN 2017), mirato al rinnovamento filologico e testuale dei due corpora in continuità con il progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015). Si vedano i  criteri per l’aggiornamento .
Corpus TLIO per il vocabolario

Corpus lemmatizzato, è il corpus di riferimento per la redazione del TLIO. Con l'aggiornamento del 4  aprile sono stati inseriti 35 testi nuovi, finora assenti (vedi elenco qui). 

La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 3.245 testi (con un incremento di 35 unità rispetto alla versione del 18 settembre 2023), per un totale di ​​24.012.722 occorrenze (con un incremento di ​198.173 occorrenze), ​496.445 forme grafiche distinte, ​126.575 lemmi e ​4.708.027 occorrenze lemmatizzate (con un incremento di ​85.700 occorrenze).

Corpus OVI dell’italiano antico

Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GATTOWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico. 

La nuova versione del Corpus OVI che oggi si pubblica on line comprende 3.512 testi (con un incremento di 35 unità - gli stessi testi inseriti nel Corpus TLIO - rispetto alla versione ​del 18 settembre 2023,  gli stessi inclusi nel Corpus TLIO - vedi elenco qui), per un totale di  30.443.280 occorrenze (con un incremento di ​​​198.173 occorrenze) e ​555.757 forme grafiche distinte.