Tutte le notizie

L’OVI pubblica una nuova versione dei suoi corpora, il Corpus TLIO e il Corpus OVI, in linea con l’assetto elaborato nell’ambito del progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015), mirato al rinnovamento filologico e testuale dei due corpora.

 

Corpus TLIO. Corpus lemmatizzato, è il corpus di riferimento del vocabolario.

Sono state aggiornate le edizioni di 11 testi già presenti nel Corpus TLIO in edizioni superate (vedi elenco qui ) e sono stati inseriti 122 testi nuovi, finora assenti (vedi elenco qui). Sono passati dal Corpus TLIO al Corpus OVI la Cronica di Giovanni Villani dell’ed. Moutier (1823) e 6 testi marcati come TPL (Testi da citare solo in casi Particolari, per ragioni Linguistiche), vale a dire i testi friulani e i Sermoni subalpini. Gli Esercizi cividalesi, invece, sono stati eliminati dal corpus e gli esempi citati saranno eliminati dal TLIO.

La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 2.439 testi (con un incremento di 115 unità rispetto alla versione precedente), per un totale di 22.399.150 occorrenze, 464.488 forme grafiche distinte, 120.617 lemmi e 4.003.544 occorrenze lemmatizzate.

 

Corpus OVI. Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GATTOWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico.

Oltre ai testi migrati dal Corpus TLIO, vi si sono inseriti 2 testi finora assenti, in conformità ai criteri di inclusione leggibili qui (vedi elenco qui).

La nuova versione del Corpus OVI che oggi si pubblica on line comprende 2.570 testi (con un incremento di 124 unità rispetto alla versione precedente), per un totale di 24.310.040 occorrenze e 486.361 forme grafiche distinte.