15 ottobre 2021

Voci senza volto

La fonoagnosia: quando il cervello non riconosce la voce di chi sta parlando

Pensa all’ultima telefonata che hai ricevuto. Forse hai risposto in maniera frettolosa, senza prestare attenzione al numero in entrata. Tuttavia, ti saranno bastate poche parole, persino poche sillabe, per decidere se la voce dall’altro capo della cornetta fosse a te conosciuta, associandovi poi un’identità precisa, un nome ed un volto. La capacità di stabilire chi stia parlando, basandosi soltanto sul canale uditivo, è una delle abilità cognitive più complesse di cui noi esseri umani siamo dotati. In effetti, gran parte delle nostre giornate è spesa ad ascoltare le voci di altre persone, molto più che qualsiasi altra categoria di suoni – naturali o artificiali – presenti nell’ambiente. Per questo motivo, il nostro sistema uditivo si è progressivamente specializzato nell’elaborare le vocalizzazioni di altri individui, conferendo loro uno statuto speciale rispetto ad altri stimoli sonori.

Ogniqualvolta ascoltiamo un’altra persona parlare – specialmente se non abbiamo accesso al canale visivo, come durante una telefonata o una registrazione audio – il nostro cervello non è unicamente impegnato nel comprendere cosa ci stia dicendo in termini di contenuto verbale. Notevoli risorse cerebrali vengono destinate, infatti, ad estrarre dalla voce indizi aggiuntivi riguardo al nostro interlocutore. Grazie alla grande varietà di informazioni paralinguistiche che la voce umana è in grado di racchiudere nella sua struttura acustica, ad esempio, potremmo intuire quale emozione stia provando questa persona, quale sia approssimativamente la sua età e struttura corporea, e, infine, quale sia la sua identità – nel caso in cui sia a noi nota. 

In questa prospettiva, il neuroscienziato Pascal Belin, docente all’Università di Aix-Marseille e uno dei massimi esperti riguardo la percezione delle voci, ha più volte definito la voce umana come una auditory face, ovvero una "faccia uditiva" che ci aiuta a navigare nel complesso mondo delle interazioni sociali, fornendoci informazioni rilevanti sulla persona con cui ci stiamo relazionando. 

Come fa dunque il nostro cervello a riconoscere l’identità di chi sta parlando, specialmente in assenza di informazioni da altre modalità sensoriali? Il primo passaggio è stabilire che un segnale uditivo sia la voce di un altro individuo e non, ad esempio, il verso di un animale o il rumore della pioggia. Questa classificazione avviene grazie ad alcune popolazioni di neuroni altamente specializzati che si attivano solo alla presenza delle caratteristiche acustiche della voce umana, distinguendola così dagli altri suoni ambientali. Tali neuroni costituiscono le cosiddette "aree temporali della voce" (Temporal Voice Areas in inglese), collocate nel giro e solco temporale superiore di entrambi gli emisferi cerebrali. Il lobo temporale, che si estende lungo la parte laterale inferiore della corteccia cerebrale, è, infatti, in una posizione strategica per ricevere i segnali uditivi dalle orecchie, ricoprendo un ruolo cruciale nell’elaborazione di varie categorie di suoni, tra cui le voci umane.

Dopo questa prima fase, i circuiti neurali per la percezione delle voci umane si differenziano in base alla tipologia di informazione che deve essere estratta. In particolare, circuiti parzialmente indipendenti si occupano di elaborare il contenuto linguistico o emotivo delle voci, oppure di estrapolare le informazioni legate all’identità delle voci. Cosa avviene concretamente all’interno di quest’ultimo circuito? L’ipotesi più accreditata è che il segnale vocale in entrata sia confrontato con una "voce prototipo" in memoria, la quale corrisponde ad un’approssimazione media di tutte le voci, maschili o femminili, incontrate nel corso della vita. Calcolando, poi, quanto le caratteristiche acustiche del segnale vocale si discostino da quelle del prototipo, è possibile stabilire se esso coincida con un’identità precedentemente nota o meno. In caso affermativo, si potrà procedere nell’associare la voce familiare ad altre informazioni disponibili riguardo l’interlocutore, come il nome, il volto e la professione. In caso negativo, invece, l’esposizione ripetuta alla voce sconosciuta consentirà di sviluppare un modello di riferimento per quella identità, che verrà conservato in memoria per future interazioni. 

Nonostante la complessità di questi processi neurali, le varie fasi del riconoscimento delle voci si succedono in tempi molto ridotti. Mediante la tecnica della elettroencefalografia, che consente di registrare l’attività elettrica cerebrale con grande precisione temporale, è stato possibile scoprire come ci bastino circa 200-250 millisecondi per determinare se una voce sia familiare o meno, mentre servirebbero attorno ai 290-370 millisecondi per riconoscere l’identità precisa di una voce. È grazie all’estrema rapidità di questi meccanismi cerebrali che possiamo determinare dopo poche sillabe che la persona dall’altro capo della telefonata è un nostro amico e non, ad esempio, il vicino di casa o un perfetto sconosciuto. 

A quanto descritto finora, l’identificazione di persone familiari a partire dalla voce sembrerebbe essere una capacità universalmente condivisa, attuata in modo rapido ed efficiente dal nostro sistema nervoso. Tuttavia, in alcune rare circostanze, tale abilità può risultare compromessa: si tratta del caso della fonoagnosia o "voice blindness" (letteralmente "cecità alle voci"), un disturbo selettivo dell’elaborazione delle voci umane in modalità uditiva, il quale può essere presente in forma congenita, cioè fin dalla nascita, oppure manifestarsi in età adulta a seguito di danno cerebrale, come nel caso di un ictus o di una malattia neurodegenerativa. I pazienti che soffrono di fonoagnosia non sono perciò in grado di riconoscere l’identità di persone note – siano esse parenti, amici o personaggi famosi – a partire dalla loro voce e/o di determinare se due stimoli vocali, presentati in sequenza, appartengano alla stessa persona o a persone differenti. Nei casi più gravi, i pazienti fonoagnosici arrivano a non riconoscere la voce dei propri figli o del proprio partner, oppure non riescono a distinguere tra le voci di persone differenti durante una conversazione. Eppure, in altre circostanze, questi pazienti dimostrano di sentirci benissimo: il loro udito è nella norma, così come la loro capacità di identificare altri suoni ambientali o musicali. 

Il primo caso documentato di un paziente con fonoagnosia acquisita, ovvero derivante da un danno cerebrale in età adulta, fu riportato nel 1981 da un gruppo di ricerca guidato dal neurochirurgo Par G. Assal. Essi descrissero il profilo del paziente RB, un direttore amministrativo di 45 anni che, a seguito di una malattia cerebrovascolare, mostrava consistenti difficoltà nel riconoscere voci precedentemente familiari e nel discriminare tra vocalizzazioni appartenenti alla stessa persona o meno. Al contrario, la capacità di RB nell’identificare le stesse persone dai volti era intatta. Questa evidenza suggerì come il riconoscimento di persone familiari nelle due modalità – uditiva e visiva – sia basato su meccanismi cerebrali almeno in parte indipendenti, che possono risultare compromessi l’uno separatamente dall’altro. Considerato che all’origine del disturbo di RB vi era un’estesa lesione bilaterale nella regione temporale anteriore, per la prima volta Assal e colleghi ipotizzarono un ruolo chiave del lobo temporale nell’elaborazione delle identità vocali. 

Nonostante questo precedente caso, il termine "fonoagnosia" (phonagnosia in originale, dall’unione di φωνή e ἀγνωσία, rispettivamente "voce" e "assenza di conoscenza") fu ufficialmente coniato solo l’anno successivo, il 1982, da Diana Van Lancker e Gerald J. Canter, ricercatori presso la Northwestern University (USA). In uno studio pubblicato sulla rivista Brain and Cognition, gli autori dimostrarono come i disturbi del riconoscimento di voci e volti familiari, rispettivamente la fonoagnosia e la prosopagnosia (da πρόσωπον, "faccia", e ἀγνωσία, vedi sopra), occorressero con maggiore probabilità nei pazienti che avevano subito una lesione cerebrale localizzata nell’emisfero destro, rispetto a quello sinistro. In particolare, il 44.4% degli individui con danno cerebrale destro esibiva serie difficoltà nell’identificare correttamente le voci di personaggi famosi, contro solo il 4.8% del gruppo con danno cerebrale sinistro. Durante il corso degli anni ’80, Diana Van Lancker e colleghi continuarono ad accumulare evidenze di questa associazione fra fonoagnosia ed emisfero destro, documentando numerosi casi di pazienti fonoagnosici con lesioni collocate soprattutto nel lobo parietale e temporale destro. 

Tuttavia, solo in anni più recenti la comunità scientifica ha riscontrato come i disturbi del riconoscimento delle voci possono essere presenti anche fin dalla nascita, in assenza di un danno cerebrale manifesto. In questo caso si parla di fonoagnosia congenita, ovvero di un disturbo del neurosviluppo che, durante tutto il corso della vita, rende difficoltoso riconoscere o distinguere altri individui a partire dalla voce. Secondo un’indagine di Shilowich & Biederman (2016), la sua prevalenza nella popolazione generale potrebbe raggiungere il 3.2%. 

La fonoagnosia congenita è stata documentata per la prima volta nel 2009 da Lúcia Garrido e colleghi dell'University College of London (UK). Essi descrissero il caso di KH, una donna di 60 anni che riportava fin dall’infanzia estreme difficoltà nel riconoscere le voci, anche quelle più familiari, come la propria figlia. Questo disturbo rappresentava per KH una fonte di grande disagio nelle interazioni sociali, al punto che quest’ultima evitava di rispondere al telefono, a meno che non si trattasse di chiamate ad orari prestabiliti con amici e parenti. Tramite un’estesa serie di test, Garrido e colleghi dimostrarono come KH fosse realmente impossibilitata nell’identificare le voci di personaggi famosi, così come nel riconoscere nuove identità vocali dopo una breve fase di apprendimento. Al contrario, la donna non esibiva alcuna difficoltà nelle equivalenti prove di riconoscimento dei volti in modalità visiva. Inoltre, KH non pareva soffrire di un generale disturbo uditivo, in quanto era in grado sia di riconoscere altre tipologie di suoni musicali e naturali (es. versi di animale, applausi), sia di estrapolare dalle voci informazioni riguardo lo stato affettivo e l’età dell’interlocutore. Di conseguenza, il deficit di KH si confermò essere genuinamente legato al riconoscimento delle identità vocali, avvalorando così l’esistenza di una forma di fonoagnosia congenita, dovuta ad un alterato sviluppo dei circuiti neurali che supportano tale capacità. 

In conclusione, nonostante la fonoagnosia sia un disturbo ancora poco conosciuto, soprattutto se paragonato al suo analogo visivo (la prosopagnosia), il suo studio è di cruciale importanza. Infatti, indagare cosa avviene nel cervello umano quando la capacità di riconoscimento di voci familiari è danneggiata ci consente di chiarire i processi neurali implicati in questa capacità in condizioni di funzionamento normale. La prossima volta che risponderai al telefono, dunque, prova ad assaporare l’istante in cui un semplice "ciao" dall’altra parte della cornetta non ti rimane estraneo, ma riesce a colorarsi di un’identità, di un nome ed un volto. Per una persona fonoagnosica, questo scenario non è poi tanto scontato. 

 

Per saperne di più:

Per un’introduzione generale alle agnosie, ovvero i disturbi del riconoscimento nelle modalità visiva, uditiva e tattile, si consiglia la lettura del capitolo a cura di Bartolomeo, P., & Migliaccio, R. (2011). I disturbi del riconoscimento: le agnosie. In G. Vallar, & C. Papagno (Edd.), Manuale di Neuropsicologia (pagg. 229-248). Bologna: Il Mulino. 

Per approfondire aspetti specifici sulla capacità di percezione delle voci e sui casi di fonoagnosia, è possibile fare riferimento ai seguenti articoli scientifici: 

Belin, P., Bestelmeyer, P. E., Latinus, M., & Watson, R. (2011). Understanding voice perception. British Journal of Psychology102(4), 711-725. https://doi.org/10.1111/j.2044-8295.2011.02041.x

Garrido, L., Eisner, F., McGettigan, C., Stewart, L., Sauter, D., Hanley, J. R., ... & Duchaine, B. (2009). Developmental phonagnosia: a selective deficit of vocal identity recognition. Neuropsychologia47(1), 123-131. https://doi.org/10.1016/j.neuropsychologia.2008.08.003

Maguinness, C., Roswandowitz, C., & von Kriegstein, K. (2018). Understanding the mechanisms of familiar voice-identity recognition in the human brain. Neuropsychologia116, 179-193. https://doi.org/10.1016/j.neuropsychologia.2018.03.039

Roswandowitz, C., Maguinness, C., & von Kriegstein, K. (2018). Deficits in Voice-Identity Processing Acquired and Developmental Phonagnosia. In P. Belin, & S. Fruehholz (Eds.), Oxford Handbook of Voice Perception. Oxford: Oxford University Press. https://doi.org/10.1093/oxfordhb/9780198743187.013.39

Van Lancker, D. R., & Canter, G. J. (1982). Impairment of voice and face recognition in patients with hemispheric damage. Brain and cognition1(2), 185-195. https://doi.org/10.1016/0278-2626(82)90016-1

 

Immagine di Couleur da Pixabay – Immagine libera da usi commerciali

© Istituto della Enciclopedia Italiana - Riproduzione riservata

0