Tutte le notizie

In occasione del convegno "Italiano antico, italiano plurale", organizzato dall'OVI per il traguardo delle 40.000 voci del TLIO, il Presidente del CNR prof. Massimo Inguscio ha introdotto i lavori, e ha scritto un articolo sul "Sole 24 Ore". Sul sito del CNR sono state pubblicate la rassegna stampa e alcune foto.

Con il progetto «CoVo. Il corpus del vocabolario italiano delle origini: aggiornamento filologico e interoperabilità» (PRIN 2015), l’OVI ha riavviato l’aggiornamento sistematico del Corpus TLIO e del Corpus OVI, con una serie di operazioni che oggi vedono una prima uscita on line.

Corpus TLIO. Corpus lemmatizzato, si conferma il corpus di riferimento del vocabolario. Si è iniziata la sostituzione di testi già presenti nel corpus, ma pubblicati in edizioni recenti più affidabili (vedi elenco qui). Si è inoltre riversata nel Corpus TLIO la maggior parte dei testi temporaneamente inseriti nel Corpus TLIO Aggiuntivo, che è stato quindi disattivato (vedi elenco qui). Si stanno infine preparando i primi testi che finora non facevano parte del Corpus TLIO e che si cominceranno a inserire fin dal prossimo aggiornamento: visto l’onere della lemmatizzazione, tali nuovi inserimenti non potranno essere esaustivi, e dovranno rispondere a criteri di maggiore rilevanza lessicografica (vedi criteri qui). La nuova versione del Corpus TLIO che oggi si pubblica on line comprende dunque 2.268 testi (con un incremento di 145 rispetto alla versione precedente), per un totale di 22.590.236 occorrenze (incremento di 658.218), 458.502 forme distinte (incremento di 12.586), 119.587 lemmi (incremento di 2.155), e 3.965.093 occorrenze lemmatizzate (incremento di 157.477).

Corpus OVI. Corpus solo parzialmente lemmatizzato, che comprende il Corpus TLIO e lo estende fino a includere tendenzialmente tutti i testi pubblicati, databili entro la fine del sec. XIV. Tale Corpus OVI non è dunque più, come è stato finora, la somma di Corpus TLIO e di Corpus TLIO Aggiuntivo, che era un corpus provvisorio i cui testi erano destinati a essere lemmatizzati e a entrare nel Corpus TLIO, ma un corpus che dovrebbe consentire la ricerca su tutto il patrimonio testuale dell’italiano antico. In esso si sono iniziati a inserire i testi finora assenti che non rientrano nei criteri di inclusione nel Corpus TLIO (vedi elenco qui). La nuova versione del Corpus OVI che oggi si pubblica on line comprende dunque 2.386 testi (con un incremento di 51 rispetto alla versione precedente), per un totale di 23.858.719 occorrenze (incremento di 682.010), 476.689 forme distinte (incremento di 9.470).

Nei giorni 13-14 settembre 2018 si terrà all'OVI un convegno sulle attività dell'Istituto, per sottoporre alla discussione della comunità scientifica i primi risultati e le nuove prospettive aperte dal lavoro dell'ultimo anno (progetti FOE e PRIN). A tre anni dal convegno per il trentennale (dicembre 2015), l'OVI torna a riunire specialisti italiani e stranieri attorno al cantiere del vocabolario, giunto alla soglia delle 40.000 voci consegnate (70% del totale), in un convegno intitolato "Italiano antico, italiano plurale. Testi e lessico del Medioevo nel mondo digitale". In tre sessioni di lavoro saranno affrontati i tre aspetti principali della ricerca legata al vocabolario: l'aggiornamento del corpus testuale, sia nei contenuti sia nel software, e la sua valorizzazione per la filologia digitale; la riflessione sul "Tesoro della lingua italiana delle Origini", e in particolare sul trattamento della documentazione non toscana, in una visione 'plurale' dell'italiano antico; le nuova piattaforma di redazione e consultazione on line del vocabolario, nello scenario della lessicografia in rete. Scarica il programma qui.