Tutte le notizie
Logo definitivo

L’OVI pubblica una nuova versione dei suoi corpora, il Corpus TLIO e il Corpus OVI, in linea con il nuovo assetto elaborato nell’ambito del progetto «RENOVO. Rigenerare il corpus OVI: rinnovo e ottimizzazione di metodi, contenuti, strumenti» (PRIN 2017), mirato al rinnovamento filologico e testuale dei due corpora in continuità con il progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015). Si vedano i criteri per l’aggiornamento.

Corpus TLIO per il vocabolario. Corpus lemmatizzato, è il corpus di riferimento per la redazione del TLIO.

Sono state aggiornate le edizioni di 20 testi già presenti nel Corpus TLIO in edizioni superate (vedi elenco qui) e sono stati inseriti 42 testi nuovi, finora assenti (vedi elenco qui).

La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 2.729 testi (con un incremento di 29 unità rispetto alla versione precedente), per un totale di 23.029.916 occorrenze (con un incremento di 391.802 occorrenze), 479.510 forme grafiche distinte, 123.046 lemmi e 4.243.012 occorrenze lemmatizzate (con un incremento di 153.934 occorrenze).

Corpus OVI dell’italiano antico. Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GATTOWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico.

Vi si sono inseriti dei testi finora assenti, che non rientrano nei criteri di inclusione nel Corpus TLIO (vedi elenco qui).

La nuova versione del Corpus OVI che oggi si pubblica on line comprende 2.948 testi (con un incremento di 32 unità rispetto alla versione precedente), per un totale di 29.208.359 occorrenze (con un incremento di 700.713 occorrenze) e 536.261 forme grafiche distinte.