Corpus lemmatizzato, è il corpus di riferimento per la redazione del TLIO. Con l'aggiornamento dell'8 aprile sono state aggiornate le edizioni di 36 testi già presenti nel Corpus TLIO in edizioni superate (vedi elenco qui) e sono stati inseriti 77 testi nuovi, finora assenti (vedi elenco qui).
La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 3.531 testi (con un incremento di 79 unità rispetto alla versione dell'8 settembre 2025), per un totale di 24.388.719 occorrenze (con un incremento di 102.892 occorrenze), 504.880 forme grafiche distinte, 128.381 lemmi e
4.947.034 occorrenze lemmatizzate (con un incremento di 42.625 occorrenze).
Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GattoWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico.
Vi si sono inseriti 2 testi finora assenti, che non rientrano nei criteri di inclusione nel Corpus TLIO (vedi elenco
qui
). La nuova versione del Corpus OVI che oggi si pubblica on line comprende 3.921 testi (con un incremento di 81 unità rispetto alla versione dell'8 settembre 2025, per un totale di 31.386.970 occorrenze (con un incremento di 164.449 occorrenze) e 568.964 forme grafiche distinte.