Corpus lemmatizzato, è il corpus di riferimento per la redazione del TLIO. Con l'aggiornamento dell'8 settembre Sono state aggiornate le edizioni di 8
testi già presenti nel Corpus TLIO in edizioni superate (vedi elenco qui) e sono stati inseriti 95 testi
nuovi, finora assenti (vedi elenco qui).
La nuova versione del Corpus TLIO che oggi si
pubblica on line comprende 3.452 testi (con un incremento di 99 unità rispetto
alla versione del 16 giugno 2025), per un totale di 24.285.827 occorrenze (con un incremento di 125.630 occorrenze),
503.539 forme grafiche distinte, 128.196 lemmi e 4.904.409 occorrenze
lemmatizzate (con un incremento di 47.745 occorrenze).
Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GattoWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico.
Vi si sono inseriti 16 testi finora
assenti, che non rientrano nei criteri di inclusione nel Corpus TLIO (vedi
elenco qui).
La nuova versione del Corpus OVI che oggi si
pubblica on line comprende 3.840 testi (con un incremento di 115 unità rispetto
alla versione del 16 giugno 2025), per
un totale di 31.222.521 occorrenze (con un incremento di 397.235 occorrenze) e 566.393
forme grafiche distinte.