Opera del Vocabolario Italiano

Istituto del Consiglio Nazionale delle Ricerche

Ambiente Ricerche

La maggior parte delle ricerche ha come obiettivo finale la localizzazione all'interno dei testi scelti di occorrenze di forme specifiche. Altre operazioni consentono di estrarre informazioni di diversa natura, come liste di forme o di lemmi, incipitari, statistiche di frequenze.
Le ricerche possono riguardare forme, lemmi, categorie grammaticali, iperlemmi. In questo ambiente si definiscono dinamicamente eventuali sottocorpus e si possono estrarre varie informazioni, come formari o lemmari relativi a singoli testi, a singoli sottocorpus o a combinazioni di più sottocorpus, visualizzazioni di parti di testo, frequenze comparate di forme, uscite grafiche come distribuzione integrale delle occorrenze in un testo e distribuzione temporale dei contesti localizzati.
I risultati ottenuti possono essere stampati o copiati su file per un utilizzo successivo.
I testi di un corpus possono essere interrogati in blocco, singolarmente, o per gruppi liberamente selezionati in base ai dati bibliografici. Si possono quindi effettuare ricerche alternativamente sul corpus o su una o più di queste selezioni, indicate col termine sottocorpus. La composizione di ogni sottocorpus può venire memorizzata su disco per essere richiamata nelle sessioni successive.
Per cercare un elemento (forma, lemma,..) sono disponibili dei riquadri in ciascuno dei quali si può inserire una parola o un gruppo di parole da cercare. È possibile fare uso di caratteri jolly per estendere la ricerca a più parole, così come è disponibile una serie di opzioni per modificare le modalità di ricerca.
Nel caso di ricerca per forme esiste la possibilità di prelevare un brano da un documento qualunque con tecniche di copia e incolla, trasferendolo poi in una apposita finestra di ingresso di GATTO: il testo verrà analizzato e verranno ricercate nel corpus le occorrenze delle parole presenti al suo interno. In questo caso verranno espressamente evidenziate anche le parole del brano non presenti nel corpus.

Il risultato finale della ricerca sarà una serie di contesti. Ogni contesto così ottenuto comprende:

occorrenza cercata,
contesto,
riferimento topografico,
riferimento organico.

Ad ogni contesto sono inoltre associati i dati bibliografici del testo da cui e' stato estratto.Se l'occorrenza è lemmatizzata sono accessibili le informazioni relative al lemma (ed eventualmente all'iperlemma) coinvolto.Anziché accedere direttamente ai contesti individuati è possibile ottenere semplicemente l'elenco dei testi che li contengono, visualizzando poi di volta in volta i soli contesti inclusi nei testi successivamente selezionati dall'elenco.Una volta ottenuti i contesti la ricerca può essere raffinata imponendo, come condizione aggiuntiva, la presenza o l'assenza di altre parole specifiche entro una certa distanza massima dall'occorrenza localizzata: i contesti verranno ripresentati, limitatamente a quelli che soddisfano sia la ricerca iniziale che la condizione aggiuntiva. Il procedimento può essere iterato liberamente, partendo dall'ultimo raffinamento ottenuto oppure dai contesti localizzati inizialmente.La dimensione dei contesti può essere fissata, diversamente per singoli contesti o per gruppi di essi, in base al numero delle parole o dei periodi costituenti o per selezione diretta delle parole di inizio e fine contesto; è anche possibile l'uso di contesti in modalità kwic (KeyWord In Context).I contesti che verranno estratti al termine delle operazioni saranno presentati ordinandoli a scelta:

in ordine cronologico del testo di appartenenza e, a parità di testo, in ordine alfabetico di forme localizzate;
in ordine cronologico del testo di appartenenza e, a parità di testo, in ordine di apparizione nel testo stesso;
in ordine alfabetico di forme localizzate e, a parità di forma, in ordine cronologico del testo di appartenenza;
per sintagmi, ovvero in ordine alfabetico di forma; a parità di forma in ordine alfabetico delle parole circostanti, a parità in ordine di testo e infine di apparizione al suo interno.

Quando i contesti sono presentati in ordine alfabetico di forma, è possibile scegliere tra l'ordinamento consueto e quello basato sulle forme invertite, considerate cioè a partire dall'ultima lettera.L'ordinamento dei testi, per default effettuato su base cronologica, è modificabile ed è possibile utilizzare criteri diversi (ad esempio ordine alfabetico di autore o titolo).Il materiale così ricavato può essere estratto, tutto o in parte, e stampato su carta o copiato su file scritti in formato RTF (Rich Text Format) per essere in seguito riutilizzato completo della formattazione.

Sono possibili diversi tipi di ricerche:

In molti casi la ricerca può essere modulata mediante una serie di opzioni. A titolo di esempio viene qui accennato all'opzione di ricerca espansa.Parole differenti solo per gli attributi (accenti, dieresi, cediglie) vengono normalmente trattate come distinte: è possibile quindi cercare solo le parole caratterizzate da particolari attributi (es. solo che o solo ché o solo chè); attivando la ricerca espansa si può invece precisare che si vogliono trovare tutte le parole costituite dalla stessa sequenza di lettere, a prescindere dagli attributi (in tal caso la ricerca di ché o di che fornirebbe in risposta che, ché, chè, ecc.).La maggior parte delle modalità di ricerca consente di definire elementi da escludere dalla ricerca stessa.