Corpus lemmatizzato, è il corpus di riferimento per la
redazione del TLIO.
Sono stati inseriti 156 testi nuovi, finora assenti (vedi
elenco qui).
La nuova versione del Corpus TLIO che oggi si
pubblica on line comprende 3.147 testi (con un incremento di 156 unità rispetto
alla versione precedente), per un totale di 23.617.370 occorrenze (con un
incremento di 120.624 occorrenze), 490.027 forme grafiche distinte, 125.097 lemmi
e 4.484.822 occorrenze lemmatizzate (con un incremento di 36.058 occorrenze).
Corpus non lemmatizzato (ma interrogabile con la funzione
“lemmi muti” di GATTOWeb), che comprende il Corpus TLIO e lo estende fino a
includere tendenzialmente tutti i testi pubblicati databili entro la fine del
sec. XIV: è il corpus che mira a consentire l’interrogazione dell’intero patrimonio
testuale dell’italiano antico.
La nuova versione del Corpus OVI che oggi si
pubblica on line comprende 3.417 testi (con un incremento di 156 unità rispetto
alla versione precedente, gli stessi inclusi nel Corpus TLIO - vedi elenco qui), per un totale di 30.108.364 occorrenze (con un
incremento di 120.624 occorrenze) e 550.509 forme grafiche distinte.