29 novembre 2019

“Se lo dice il dizionario…” L'utente tra i dizionari dell’uso e le nuove risorse digitali

di Licia Corbolante

All’inizio del 2019 anche l’Istituto Treccani si è trovato al centro di una delle polemiche linguistiche che regolarmente infiammano i social: indignazione per l’inclusione del nome Ferragnez nel Libro dell’Anno 2018, una pubblicazione che registrava fatti, temi, tendenze e neologismi dell’anno appena trascorso. Per molti un’istituzione così prestigiosa non avrebbe mai dovuto approvare la parola macedonia formata dai nomi di una coppia dello spettacolo, uno scandalo in quanto indegna di far parte della lingua italiana! A distanza di qualche mese la notizia fa sorridere ma può essere uno spunto per affrontare alcune percezioni errate sui dizionari da parte di pubblico, media e a volte anche di chi opera in ambito editoriale.

 

Dizionari dell’uso: percezioni errate

 

Il tipo più noto di dizionario è quello generale o dell’uso che documenta il lessico della lingua contemporanea con un approccio sincronico. Ciascun dizionario è compilato in base a propri criteri di impostazione che ne determinano metodi di ricerca, compilazione e scelte, ad esempio quali neologismi includere o a quali funzioni e informazioni dare più rilevanza, distinguendosi così dagli altri prodotti sul mercato. Tutti i dizionari dell’uso italiani però hanno in comune una finalità descrittiva: i lessicografi osservano le parole nell’uso orale e scritto della lingua in uno specifico periodo e le registrano nel dizionario.

I dizionari dell’uso non hanno un approccio normativo o prescrittivo: non determinano cosa si può e non si può dire, e non convalidano l’uso dei neologismi lemmatizzandoli. Si scontrano quindi con le aspettative di parte del pubblico, che li immagina come arbitri che mantengono alti gli standard linguistici. È una percezione distorta che viene rafforzata dalla narrazione dei media per i quali le parole dell’italiano sono consentite, permesse, legittimate, approvate, certificate, ufficializzate dall’inserimento in uno o più dizionari. Vengono così scatenate polemiche, alimentate ad arte, ogni volta che una parola si scontra con un’idea diffusa di norma linguistica, non è conforme a canoni estetici personali (come apericena), rappresenta concetti sgraditi (come webete) oppure è interpretata erroneamente (come la rianalisi di gelicidio).

Questo atteggiamento porta alcuni parlanti a deplorare ogni accoglimento di forestierismi e neologismi informali, visti come un abbassamento degli standard qualitativi di un dizionario o, in alternativa, a considerare la loro presenza come un segno dell’imbarbarimento della lingua. C’è anche chi lancia petizioni per apportare modifiche ai dizionari, ad esempio chiedendo l’aggiunta di parole inventate oppure la rimozione di parole sgradite, come se queste operazioni potessero effettivamente influire sull’uso della lingua da parte dei parlanti (cfr. Gheno). Intervenire su richiesta non è però il compito dei lessicografi, che invece scelgono le parole da aggiungere in base a criteri ben definiti tra cui frequenza d’uso, uso nel tempo e distribuzione: per poter essere lemmatizzato, un neologismo deve essere usato spesso, da almeno un certo tempo e in contesti o ambiti diversi.

 

I numeri dei dizionari

 

Il lessico di una lingua è un insieme aperto di elementi che può espandersi virtualmente all’infinito, con un’estensione impossibile da calcolare con precisione perché nuove parole compaiono e scompaiono continuamente. Indicativamente, i dizionari italiani dell’uso partono da un minimo di 50.000 lemmi e arrivano fino agli oltre 380.000 lemmi (circa 250.000 entrate principali e 130.000 sottolemmi) del GRADIT (De Mauro, 2005). Le modalità di calcolo dei lemmi possono variare anche considerevolmente da un editore all’altro, ad esempio con differenze nel modo in cui vengono contate le forme derivate, e per questo i numeri con cui sono descritti i diversi dizionari sono raramente confrontabili.

Non è però la quantità di lemmi che definisce la qualità di un dizionario, bensì le informazioni che contiene.  Devono soddisfare i fini che si è proposta la redazione lessicografica e le esigenze dell’utente finale di riferimento, anche nella presentazione dei dati: si riflettono in scelta dei lemmi, tipo di definizione, informazioni grammaticali essenziali, ortografia, pronuncia, costrutti, collocazioni, marche d’uso, etimologia, frasi di esempio, frequenza d’uso e altro ancora.

I dizionari non sono un modello di rappresentazione ideale della lingua ma andrebbero piuttosto considerati come strumenti che risolvono problemi: rispondono a dubbi sulla comprensione di testi e forniscono informazioni per la loro produzione. Succede però che dai dizionari si cerchi comunque di ricavare anche informazioni quantitative, ad esempio sull’uso degli anglicismi.

 

Dizionari e anglicismi

 

In una proposta di legge per la tutela della lingua italiana, presentata più volte in parlamento, ricorre questa affermazione: “dal 2000 ad oggi il numero di parole inglesi confluite nella lingua scritta italiana è aumentato del 773 per cento, quasi 9.000 sono gli anglicismi attualmente presenti nel dizionario della Treccani su circa 800.000 tra lemmi ed accezioni […] Questa anglicizzazione ossessiva rischia, nel lungo termine, di portare a un collasso dell'uso della lingua italiana, fino alla sua progressiva scomparsa che alcuni studiosi prevedono nell'arco di ottanta anni”. Sono dati del tutto inattendibili e di cui non si conosce la fonte, ma sono indicativi di quanto sia facile appropriarsi di riferimenti linguistici non verificati per finalità politiche (Corbolante, 2018).

Una visione della lingua altrettanto preoccupata è espressa da Antonio Zoppetti in I forestierismi nei dizionari: quanti sono e di che tipo (link) e in un libro del 2017. Si è servito dei conteggi dei forestierismi di diverse edizioni di dizionari dell’uso per affermare che oltre il 50% delle parole del nuovo millennio è di origine inglese, ipotizzando un conseguente cambiamento dell’assetto del nostro lessico. È un’elaborazione di dati che si presta a molti fraintendimenti e su cui è opportuno fare alcuni rilievi.

Come già evidenziato, ciascun dizionario conteggia i lemmi con propri modelli, per cui i numeri di dizionari diversi non sono facilmente raffrontabili, tantomeno accorpabili. Appare piuttosto azzardato produrre numeri e percentuali senza avere certezze sui metodi di ricerca e compilazione dei dizionari e sulla composizione dei corpora da cui sono stati ricavati i dati.

Inoltre, nei raffronti tra edizioni diverse dello stesso dizionario (ad esempio 1990 e 2017) va considerato che le modalità di raccolta e di elaborazione dei dati lessicali sono cambiate notevolmente negli ultimi decenni: c’è stato un passaggio dal cartaceo al digitale, che non costringe più a rimuovere lemmi obsoleti per fare spazio a quelli nuovi; è diventato disponibile un numero praticamente illimitato di testi digitali per la creazione di corpora di riferimento; i programmi di estrazione ed elaborazione dati sono notevolmente migliorati. È molto probabile che questi cambiamenti abbiano portato non solo a raccolte di dati più efficienti ma anche a un diverso approccio nelle decisioni di inclusione di lemmi, e questo potrebbe spiegare la crescita improvvisa di certi numeri.  

Per Calzolari, Furiassi e Giovanardi il numero degli anglicismi ricavati dai dizionari contemporanei andrebbe in ogni caso ridimensionato perché sostenuto da strategie di marketing che devono promuovere edizioni annuali facendo leva sulle novità. Gli anglicismi che sono entrati nel Devoto-Oli con la marca XXI secolo ne sono una conferma: nell’elenco di poco più di 600 lemmi si trovano parole di uso comune e ad alta frequenza come selfie e tweet ma anche parecchi marchionimi e molti esempi di tecnicismi e polirematiche come slate PC, lad lit e pet-coke che sono talmente inusuali da non essere contemplati neppure dai dizionari monolingui inglesi. Appare quindi evidente la necessità di adottare misurazioni che non amplifichino a dismisura questo tipo di anglicismi e restituiscano risultati più realistici (cfr. Antonelli).

Per misurazioni più affidabili e sistematiche è preferibile ricorrere alla linguistica dei corpora che con metodi statistici (link) consente di ricavare informazioni di frequenza e classificare gli anglicismi in base al loro rango d’uso (cfr. Calzolari, Serianni e in particolare Furiassi), per poi escludere quelli sotto soglie che li rendono irrilevanti (cfr. Szudarski). Il corpus di riferimento dovrebbe avere una rappresentazione bilanciata che includa diverse tipologie testuali, tenga conto di tutte le variabili sociolinguistiche e includa anche una dimensione diacronica per la datazione dei neologismi e della loro eventuale obsolescenza (cfr. Freddi e Biber). I dizionari potranno poi essere usati più proficuamente per fare raffronti con i risultati ottenuti (per esempi, cfr. Mamusa e Saugera).

 

Alternative ai dizionari dell’uso

 

I fraintendimenti sul ruolo dei dizionari sono ricorrenti anche nelle discussioni sui social, dove spesso si nota confusione tra risorse. Ad esempio, i contenuti della sezione Neologismi (link) del Portale Treccani vengono spessi confusi con il Vocabolario (link) anche se sono chiaramente siti con finalità diverse. Può quindi essere utile esaminare i nuovi tipi di dizionari online che si affiancano a quelli “classici” prodotti da redazioni lessicografiche. Sono contraddistinti da nuovi modelli di condivisione delle informazioni e dal ricorso a metodologie alternative per la raccolta, l’elaborazione e la distribuzione delle informazioni lessicali (cfr. Rundell). Riconoscere i diversi tipi aiuta a valutare punti di forza e di debolezza di ciascuna risorsa e capire se è adatta alle proprie esigenze.

 

Enciclopedie e dizionari collaborativi: i contenuti sono creati, modificati, aggiornati e mantenuti in collaborazione da una comunità di utenti che seguono delle linee guida e si autoregolano; non esiste una figura professionale di riferimento che supervisiona le attività e prende le decisioni finali. Wikipedia e Wiktionary sono gli esempi più noti: mettono a disposizione un quantitativo enorme di informazioni e riferimenti incrociati, con funzionalità di visualizzazione e navigazione spesso non reperibili altrove. La qualità però è variabile e passa da voci ineccepibili, con contenuti esaustivi compilati da esperti, a voci incomplete e inaffidabili o informazioni obsolete importate da vecchi dizionari non più soggetti a copyright. Nei dizionari collaborativi va fatta quindi attenzione a informazioni potenzialmente errate, a interventi puristi ingiustificati e a riferimenti linguistici a volte poco informati o fuorvianti.

 

Contenuti generati dagli utenti: ciascuno può contribuire, senza dover seguire alcuna regola, ma non può modificare o eliminare i contributi altrui. L’esempio più noto, in inglese, è il dizionario di slang Urban Dictionary, che ha contenuti estremamente eterogenei: dalle definizioni molto precise di nuove espressioni non ancora documentate altrove, a voci totalmente inventate per divertimento o anche per fuorviare ma che spesso acquisiscono grande visibilità grazie ai voti degli utenti.

 

Progetti in crowdsourcing: hanno finalità definite chiaramente e sono alimentati dai suggerimenti di un grande numero di persone (una “folla”, crowd) che contribuisce su base volontaria. I suggerimenti vengono vagliati da esperti che decideranno se utilizzarli, integrarli e modificarli e poi renderli disponibili per la consultazione. Vari dizionari tradizionali fanno ricorso a questa modalità per ottenere informazioni lessicali altrimenti difficili da acquisire in breve tempo. In italiano un esempio è la sezione Segnala un neologismo (link) del Portale Treccani.

 

Progetti personali: sono gestiti da esperti o semplici appassionati che con generosità rendono disponibili gratuitamente contenuti che hanno curato loro stessi, ad esempio glossari o raccolte terminologiche. In alcuni casi consentono commenti e suggerimenti al proprio lavoro. Per l’italiano un esempio è AAA, Dizionario di Alternative Agli Anglicismi di Antonio Zoppetti, da cui sono tratti molti esempi di L’inglese nell’italiano: espansione per ibridazione. (link).

Il metodo di raccolta, verifica e convalida dei dati, se indicato, può dare una prima indicazione dell’affidabilità di queste risorse. Se però chi le consulta non ha competenze linguistiche specifiche, può essere arduo riuscire distinguere tra informazioni specialistiche attendibili e altre invece amatoriali, non verificate o che potrebbero essere distorte da preferenze e idiosincrasie degli autori. Nel dizionario AAA, ad esempio, si rileva l’insolito parametro di classificazione “prolificità” che dovrebbe identificare le parole inglesi che hanno generato le “parole semiadattate” illustrate in L’inglese nell’italiano: espansione per ibridazione (link) nella sezione Bastardi senza gloria. L’autore probabilmente intende ciò che i linguisti chiamano produttività, che però non dovrebbe mai essere vista come caratteristica negativa: se un anglicismo è produttivo, è segno che è una parola acclimatata e vitale, e che i parlanti la ritengono utile.

Anche altre affermazioni dell’autore suscitano perplessità, ad esempio la tesi per cui le parole composte inglesi sarebbero di per sé virulente al punto da causare un effetto domino di diffusione incontrollata degli anglicismi che contengono un loro elemento: ad esempio, per l’autore parole come backup, background, backstage, flashback e playback creano “famiglie di parole” che favorirebbero l’adozione di qualsiasi anglicismo che al suo interno abbia back. Questa tesi però non tiene conto che negli esempi back non è la stessa parola (in inglese può essere verbo, sostantivo, aggettivo e avverbio, con funzioni e significati diversi all’interno di ciascun composto), che questi anglicismi sono entrati in italiano per strade e in periodi alquanto diversi, che non sono usati negli stessi ambiti, e che le parole del lessico fondamentale inglese sono note a buona parte dei parlanti grazie alla scuola e altri tipi di contatto con la lingua inglese, indipendentemente dagli anglicismi.

Questi esempi evidenziano che è sempre consigliabile cautela nella consultazione di risorse che non sono state sottoposte a un processo di revisione, ma che è utile conoscerle perché spesso forniscono informazioni non disponibili altrove.

 

Riferimenti bibliografici

Adamo, Giovanni e Della Valle, Valeria (2018), Le parole del lessico italiano, Carocci.

Antonelli, Giuseppe (2016), L’italiano nella società della comunicazione 2.0, Il Mulino.

Biber, Douglas (2008), Representativeness in Corpus Design, in Practical Lexicography, a cura di Fontenelle, T., Oxford University Press.

Calzolari, Nicoletta et al., La lingua italiana nell’era digitale, Springer.

Corbolante, Licia (2018), Anglicismi, che passione!?

Corbolante, Licia (2018), Davvero fra 80 anni non si parlerà più italiano?

Corbolante, Licia (2019), Bufale linguistiche: l’approvazione dei neologismi.

De Mauro, Tullio (2005), La Fabbrica delle Parole. Il lessico e problemi di lessicologia, UTET.

De Mauro, Tullio (2016), È irresistibile l’ascesa degli anglismi?.

Della Valle, Valeria (2005), Dizionari italiani: storia, tipi, struttura, Carocci.

Durkin, Philip, a cura di (2016), The Oxford Handbook of Lexicography, Oxford University Press.

Freddi, Laura (2014), Linguistica dei corpora, Carocci.

Furiassi, Cristiano (2008), Non-adapted anglicisms in Italian: attitudes, frequency counts, and lexicographic implications, in Fischer, R. e Pulaczewska, H. (a cura di), Anglicisms in Europe: Linguistic Diversity in a Global Context. Cambridge Scholars Publishing.

Gheno, Vera (2019), Potere alle parole. Perché usarle meglio, Einaudi.

Giovanardi, Claudio (2015), Un bilancio delle proposte di traduzione degli anglicismi dieci anni dopo, in Marazzini, C. e Petralli, A. (a cura di), La lingua italiana e le lingue romanze di fronte agli anglicismi, GoWare

Mamusa, Eleonora (2015), Gli anglicismi nella comunicazione politica su Twitter, tesi di dottorato.

Paweł Szudarski (2018), Corpus Linguistics for Vocabulary, Routledge.

Rundell, Michael (2015), Crowdsourcing, wikis, and user-generated content, and their potential value for dictionaries.

Saugera, Valérie (2017), Remade in France. Anglicisms in the lexicon and morphology of French, Oxford University Press.

Serianni, Luca (2015), Per una neologia consapevole, in Marazzini, C. e Petralli, A. (a cura di), La lingua italiana e le lingue romanze di fronte agli anglicismi, GoWare.

Zoppetti, Antonio (2017), Diciamolo in italiano. Gli abusi dell’inglese nel lessico dell’Italia e incolla, Hoepli.

 

Immagine: Libreria dell’Accademia della Crusca

 

Crediti immagine: Sailko [CC BY 3.0 (https://creativecommons.org/licenses/by/3.0)]

 


© Istituto della Enciclopedia Italiana - Riproduzione riservata

0