Opera del Vocabolario Italiano

Istituto del Consiglio Nazionale delle Ricerche

News

Nuova versione dei Corpora OVI

L’OVI pubblica una nuova versione dei suoi corpora, il Corpus TLIO per il vocabolario e il Corpus OVI dell’italiano antico, in linea con l’assetto elaborato nell’ambito del progetto «RENOVO. Rigenerare il corpus OVI: rinnovo e ottimizzazione di metodi, contenuti, strumenti» (PRIN 2017), mirato al rinnovamento filologico e testuale dei due corpora in continuità con il progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015). 

Si vedano i criteri per l’aggiornamento

Corpus TLIO per il vocabolario

Corpus lemmatizzato, è il corpus di riferimento per la redazione del TLIO. Sono state aggiornate le edizioni di 55 testi già presenti nel Corpus TLIO in edizioni superate (vedi elenco) ​​e sono stati inseriti 39 testi nuovi, finora assenti (vedi elenco). ​ 
La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 2.991 testi (con un incremento di 43 unità rispetto alla versione precedente), per un totale di 23.496.746 occorrenze (con un incremento di 61.301 occorrenze), 488.227 forme grafiche distinte, 124.736 lemmi e 4.448.764 occorrenze lemmatizzate (con un incremento di 48.047 occorrenze).

Corpus OVI dell’italiano antico

Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GATTOWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico. 
La nuova versione del Corpus OVI che oggi si pubblica on line comprende 3.261 testi (con un incremento di 43 unità rispetto alla versione precedente), per un totale di 29.987.740 occorrenze (con un incremento di 61.302 occorrenze) e 548.826 forme grafiche distinte.