Corpus lemmatizzato, è il corpus di riferimento per la redazione del TLIO. Con gli aggiornamenti del 2 agosto e del 18 settembre sono stati inseriti 37 testi nuovi, finora assenti, ma 2 erano già nel Corpus OVI (vedi elenco qui).
La nuova versione del Corpus TLIO che oggi si pubblica on line comprende 3.210 testi (con un incremento di 37 unità rispetto alla versione del 2 ottobre 2022), per un totale di 23.814.549 occorrenze (con un incremento di 128.915 occorrenze), 494.385 forme grafiche distinte, 126.208 lemmi e 4.622.327 occorrenze lemmatizzate (con un incremento di 96.236 occorrenze).
Corpus non lemmatizzato (ma interrogabile con la funzione “lemmi muti” di GATTOWeb), che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati databili entro la fine del sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio testuale dell’italiano antico.
La nuova versione del Corpus OVI che oggi si pubblica on line comprende 3.447 testi (con un incremento di 35 unità - gli stessi testi inseriti nel Corpus TLIO - rispetto alla versione del 2 ottobre 2022, gli stessi inclusi nel Corpus TLIO - vedi elenco qui), per un totale di 30.245.108 occorrenze (con un incremento di 68.480 occorrenze) e 553.868 forme grafiche distinte.