Tutte le notizie

L’OVI pubblica una nuova versione dei suoi corpora, il Corpus TLIO per il vocabolario e il Corpus OVI dell’italiano antico, in linea con l’assetto elaborato nell’ambito del progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015), mirato al rinnovamento filologico e testuale dei due corpora (si vedano qui i criteri per l’aggiornamento).

Corpus TLIO per il vocabolario. Corpus lemmatizzato, è il corpus di riferimento del vocabolario.

Sono state aggiornate le edizioni di testi già presenti nel corpus in edizioni superate per 138 testi (vedi elenco qui) e sono stati inseriti 168 testi nuovi, finora assenti (vedi elenco qui).

La nuova versione del Corpus TLIO per il vocabolario che oggi si pubblica on line comprende 2.700testi (con un incremento di 261 unità rispetto alla versione precedente), per un totale di 22.638.114 occorrenze (con un incremento di 238.964 occ.), 471.357 forme grafiche distinte, 121.666 lemmi e 4.089.078 occorrenze lemmatizzate (con un incremento di 85.534 occ.).

Corpus OVI dell’italiano antico. Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti di GattoWeb) che comprende il Corpus TLIO per il vocabolario e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico.

Vi si sono inseriti 86 testi finora assenti, provenienti per lo più dal Corpus DiVo (vedi elenco qui).

La nuova versione del Corpus OVI dell’italiano antico che oggi si pubblica on line comprende 2.916testi (con un incremento di 346 unità rispetto alla versione precedente), per un totale di 28.507.646 occorrenze (con un incremento di 4.197.606 occ.) e 526.536 forme grafiche distinte.