Tutte le notizie

L’OVI pubblica una nuova versione dei suoi corpora, il Corpus TLIO e il Corpus OVI, in linea con il nuovo assetto elaborato nell’ambito del progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015), mirato al rinnovamento filologico e testuale dei due corpora.

Corpus TLIO. Corpus lemmatizzato, è il corpus di riferimento del vocabolario.
Sono state aggiornate le edizioni di 2 testi già presenti nel Corpus TLIO in edizioni superate (vedi elenco qui) e sono stati inseriti 65 testi nuovi, finora assenti (vedi elenco qui). Sono state inoltre eliminate le edizioni meno affidabili di 8 testi finora presenti nel corpus in doppia edizione (in un caso tripla; vedi elenco qui).
La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 2.324 testi (con un incremento di 56 unità rispetto alla versione precedente), per un totale di 22.567.996 occorrenze, 460.881 forme grafiche distinte, 120.331 lemmi e 4.007.895 occorrenze lemmatizzate.

Corpus OVI. Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GATTOWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico.
Vi si sono inseriti dei testi finora assenti, che non rientrano nei criteri di inclusione nel Corpus TLIO (vedi elenco qui).
La nuova versione del Corpus OVI che oggi si pubblica on line comprende 2.446 testi (con un incremento di 60 unità rispetto alla versione precedente), per un totale di 23.874.376 occorrenze e 479.915 forme grafiche distinte.