• Increase font size
  • Default font size
  • Decrease font size

Corpus di riferimento per un Nuovo Vocabolario dell’Italiano moderno e contemporaneo. Fonti documentarie, retrodatazioni, innovazioni

 

 

 

PRIN 2012

Coordinatore nazionale (Principal Investigator): Prof. Claudio MARAZZINI

Coordinatore locale: Prof. Riccardo GUALDO

Componenti unità dell’Università della Tuscia: Prof. Stefano TELVE

Componenti aggregati di altre università: Prof. Maria Vittoria DELL’ANNA (Università del Salento)

 

 

Il Progetto di Ricerca di Interesse Nazionale (PRIN) dal titolo Corpus di riferimento per un Nuovo Vocabolario dell’Italiano moderno e contemporaneo. Fonti documentarie, retrodatazioni, innovazioni (cod. 2012CNRBYE_001) coordinato dal Prof. Claudio Marazzini, Ordinario di Storia della lingua italiana all’Università del Piemonte Orientale, è stato approvato dal MIUR con D.D. n. 1959 del 18/10/2013 e ammesso al finanziamento per un totale di € 532.324 con D.D. n. 2120 dell’8/11/2013. Il progetto di ricerca ha durata triennale ed è stato ufficialmente avviato l’8 marzo 2014; si concluderà dunque nel mese di febbraio 2017.
Il coordinamento generale del progetto è affidato a Claudio Marazzini; al progetto partecipano altre sette unità di ricerca: le Università di Genova, Milano Statale, Firenze, Tuscia, Napoli l’Orientale, Catania e l’Istituto di Teoria e Tecniche dell’Informazione Giuridica (ITTIG-CNR). Il progetto è sostenuto dall’Accademia della Crusca.

 

Scopo del progetto è la creazione di un corpus dei corpora su cui fondare un Nuovo Vocabolario dell’Italiano moderno e contemporaneo, con riferimento alla fase storica che va dall’Unità a oggi. Sarà un vocabolario in Rete costruito in modo del tutto innovativo rispetto alla tradizione lessicografica italiana. In una prima fase saranno allestiti corpora nuovi e saranno recuperati e messi in rete corpora già esistenti; seguirà il più specifico studio lessicale e linguistico dei materiali raccolti, con la creazione di dizionari paralleli da collocare online a fianco al Nuovo Vocabolario. L’iniziativa, unica nel suo genere nel panorama della lessicografia italiana, ha come modelli di riferimento teorici il Digitales Wörterbuch der deutschen Sprache (DWDS) della Brandeburgische Akademie der Wissenschaften e il British National Corpus (BYU-BNC), la più grande raccolta di dati lessicali di una lingua moderna.
Il corpus dei corpora fin qui brevemente descritto è il primo passo per un Nuovo Vocabolario dell’Italiano moderno e contemporaneo concepito come rete di testi, tale da permettere lo sviluppo di una lessicografia che superi il modello tradizionale di allestimento dei vocabolari, fondato sulla revisione ripetitiva dei dizionari già pubblicati. Gli spogli bilanciati, realizzati cioè settore per settore (es. lingua scientifica, lingua politica e istituzionale, ecc.), daranno una fotografia attendibile della lingua italiana moderna, in tutte le sue sfaccettature e potenzialità. Inoltre, un dizionario totalmente informatizzato permetterà la consultazione parallela di più strumenti lessicografici, secondo una formula anch’essa innovativa per la nostra lingua. Quest’impostazione scientifica vuol ribadire con forza il ruolo dell’italiano moderno in Europa, non solo lingua di cultura dotata di un nobile passato e di una grande tradizione, ma idioma di larga diffusione (oltre 70 milioni di parlanti madrelingua nel mondo, quinta lingua in assoluto studiata come lingua seconda, per scopi culturali e lavorativi), pienamente matura in tutte le sue funzioni comunicative, disponibile in tutti i settori della conoscenza, forte nella scrittura come nell’oralità. La tradizione della lessicografia italiana, la più antica nella storia della lessicografia occidentale, potrà riacquistare una forza d’impatto scientifico che le consentirà di confrontarsi con le più avanzate ricerche internazionali nel settore.

 

Attività previste nel triennio. Il programma di ricerca triennale prevede la creazione di vari corpora lessicali che ancora non esistono, quali per es. un corpus dell’italiano delle arti dall’Ottocento a oggi; un corpus dell’italiano scientifico dall’Unità a oggi; un corpus di lingua politico-istituzionale del XIX e del XX secolo; un corpus del linguaggio della paraletteratura, della trattatistica socio-etica e divulgativa, della letteratura per l’infanzia e per la scuola; un corpus dell’italiano otto-novecentesco della lirica, del melodramma e della canzone. Alcuni di questi corpora coprono àmbiti della lingua italiana unitaria finora mai indagati sul piano linguistico e scarsamente presenti nella lessicografia storica e sincronica dell’italiano, ancora orientata in larga prevalenza sulla lingua letteraria. La creazione di nuovi corpora si accompagnerà a un’attività di collegamento e recupero di raccolte già esistenti, talora rimaste inutilizzate perché il loro impiego richiede una conversione dei dati, parzialmente obsoleti dal punto di vista informatico. L’insieme di questi corpora confluirà in una banca dati dove ciascuno di essi potrà essere interrogato contemporaneamente mediante un meta-motore di ricerca. Numerose convenzioni con istituzioni pubbliche e private, enti di ricerca, biblioteche e istituti del CNR, già stipulate o in avanzata fase di preparazione, consentiranno nel corso del triennio un ulteriore arricchimento della banca dati che, negli intenti del gruppo di ricerca, verrà a costituire il più ampio e completo corpus digitalizzato della lingua italiana postunitaria.

 

L’unità di ricerca dell’Università degli Studi della Tuscia, coordinata dal prof. Riccardo Gualdo, costituirà un corpus dell’italiano istituzionale e scientifico in età postunitaria (1861-1921) e di lingua cinematografica (cinema industriale) nel ventennio 1948-1967.
Nello specifico, il corpus della lingua politica parlamentare si fonderà sulle trascrizioni delle sedute assembleari del neonato Parlamento del Regno. Si tratta di una tipologia testuale di particolare interesse per la conoscenza dell’evoluzione dell’italiano politico-istituzionale, rappresentata da un insieme di dati molto esteso (18 legislature per circa 60 anni, circa 3000 pagine all’anno per un insieme stimato intorno a oltre i 200 milioni di occorrenze lessicali), sinora mai indagato dal punto di vista linguistico. L’Unità di Viterbo intende costituire un corpus selettivo – statisticamente rappresentativo – di sedute parlamentari, suddiviso per legislature e comunque limitato all’epoca precedente l’instaurazione del regime fascista..
Tra le potenzialità applicative di un corpus basato su testi politico-istituzionali si può immaginare tra l’altro il confronto con materiali lessicali già raccolti da parallele imprese lessicografiche italiane in via di realizzazione, come il Vocabolario Giuridico Italiano, rispetto al quale il settore politico-amministrativo rappresenta un ambito concettualmente vicino e per molti aspetti complementare.




           

Direttore: Prof. Giulio Vesperini 

tel. 0761 357899


Segreteria: tel. 0761 - 357876, fax 0761 - 357875

Via San Carlo, 32 - Viterbo

Contatti

seguici su facebook-icon    ios homescreen icon