02 dicembre 2019

Intelligenza artificiale tra rischi e opportunità

di Mirko Tavosanis

Forse è tutta una questione di lucine colorate, segni di spunta, pop-up e messaggi che lampeggiano. Da Facebook o da WhatsApp, ci arriva una pioggia di messaggi e incitamenti che può far sembrare che i sistemi informatici ci parlino. E invece no: la maggioranza dei messaggi che riceviamo è stata scritta, dettata o parlata da un essere umano, e il sistema si è limitato a sceglierli e inoltrarli.

 

Il computer come strumento di comunicazione

 

D’accordo, ogni tanto arriva qualcosa di diverso, sotto forma per esempio di spam, o di promemoria inviato da qualche servizio cui siamo iscritti. Però i messaggi utili sono di regola scritti da esseri umani: compagni di calcetto su WhatsApp, vecchi compagni di scuola su Facebook, colleghi di lavoro nella posta elettronica… In grande maggioranza, gli articoli di giornale che leggiamo sono stati scritti da giornalisti umani, le pagine informative sulla normativa delle pensioni che abbiamo ripescato da Google sono state scritte da esperti umani e le voci di Wikipedia sono opera di volontari umani.

 

In questa massa di testi e messaggi, il sistema informatico agisce quasi solo da intermediario. Perfino Google, in risposta alle ricerche condotte su parole chiave, nella maggior parte dei casi si limita a mandarci un rinvio a una pagina web esistente, o a qualcosa di simile. In questo non c’è nulla di strano o di imprevisto. Semplicemente, si tratta della logica conseguenza di un’idea avuta dalla comunità dei ricercatori più di cinquant’anni fa, e formalizzata nel 1968 in un celebre articolo di Licklider e Taylor: quella per cui i computer erano troppo stupidi perché ci si potesse parlare, ma in compenso erano strumenti meravigliosi per consentire agli esseri umani di comunicare tra di loro con una flessibilità che i sistemi precedenti non offrivano.

 

Questa visione rientrava ancora in pieno nella visione tradizionale della civiltà della scrittura. Quasi duemilacinquecento anni fa, nel Fedro di Platone, Socrate notava appunto che i testi scritti sono un prodotto tecnologico congelato, incapace di interagire attivamente con il lettore:

 

«Perché vedi, o Fedro, la scrittura è in una strana condizione, simile veramente a quella della pittura. I prodotti cioè della pittura ci stanno davanti come se vivessero; ma se li interroghi, tengono un maestoso silenzio. Nello stesso modo si comportano le parole scritte: crederesti che potessero parlare quasi che avessero in mente qualcosa; ma se tu, volendo imparare, chiedi loro qualcosa di ciò che dicono esse ti manifestano una cosa sola e sempre la stessa».

 

Allo stesso modo, al di là di tutte le notifiche e di tutti i contatori, Google in sostanza non è mai stato capace di dialogare con gli utenti. La sua funzione di base consisteva nel recuperare con efficienza informazioni scritte da altri.

 

Tuttavia, un po’ alla volta qualcosa è cambiato lo stesso. All’interno dei sistemi automatici, quando si sono sfruttate a fondo le possibilità del “computer come strumento di comunicazione”, la scrittura ha imparato qualche trucchetto nuovo. Un sito per il commercio elettronico non può fare nulla di diverso da ciò per cui è stato progettato, ma permette per esempio all’utente di riempire un carrello della spesa, rivedere la lista di ciò che vuol comprare, inserire informazioni sul pagamento e sulla consegna e così via. Negli ultimi decenni ci siamo abituati, non certo a una vera intelligenza, ma a un’adattabilità maggiore rispetto al passato. E ora, l’introduzione di tecniche di intelligenza artificiale sta permettendo di fare un passo ulteriore.

 

Le applicazioni linguistiche dell’intelligenza artificiale

 

Oggi va di moda parlare di “intelligenza artificiale”, inserendo sotto questa etichetta una serie di tecniche di vario genere: apprendimento automatico o machine learning, uso di reti neurali per l’elaborazione di dati e così via.

 

I nomi evocativi che vengono dati a tali sistemi non devono trarre in inganno. Nessuno di essi possiede una vera “intelligenza” simile a quella degli esseri umani: le tecniche coinvolte sono in sostanza una forma di statistica. Tuttavia, questa statistica si è rivelata sorprendentemente funzionale e capace di migliorare in modo significativo problemi pratici come la trascrizione e la sintesi del parlato e la traduzione in più lingue, di cui si parla in un intervento dedicato. Inoltre, il modo in cui opera è interessante di per sé, e in questo speciale è descritto in dettaglio da Davide Bacciu (link).

 

Questa maggiore flessibilità permette di simulare interazioni molto più sofisticate che in passato. Da millenni, gli esseri umani si sono commossi di fronte ai ritratti o alle lettere delle persone amate; più di recente, si sono commossi di fronte a fotografie, registrazioni e video. Oggi però è possibile riprodurre molte altre caratteristiche superficiali degli esseri umani: l’aspetto fisico, la voce, i modi caratteristici di esprimersi. Che cosa succede quindi quando per esempio il modo di rispondere di una persona scomparsa può essere simulato in modo convincente in un’applicazione conversazionale? O quando un minirobot diventa un compagno prezioso per gli anziani, e magari una preziosa fonte di interazione e simpatia? Insomma, come mostra qui Roberto Pieraccini (link), dobbiamo già chiederci che cosa succede quando si dialoga non più attraverso, ma con i computer.

 

Il cloud, le aziende, la privacy

 

Ci sono diverse ragioni per cui è importante tenere traccia di questa evoluzione. Una è, ovviamente, la semplice pervasività: gli strumenti diventano più efficaci e coinvolgenti. La rapidissima diffusione degli smartphone mostra con quale rapidità una novità tecnologica può entrare nel tessuto della vita quotidiana.

 

Un’altra ragione, più inquietante, è la questione del coinvolgimento di terze parti. Quasi tutte queste tecnologie operano “nel cloud”, cioè su computer di proprietà di qualche grande azienda, generalmente con base negli Stati Uniti. Ci vogliono però di regola diversi anni perché le leggi, e in generale la società, si evolvano fino a gestire cose nuove. I problemi di privacy sono già oggi molto importanti per le nostre comunicazioni: che cosa può succedere quando le aziende non solo archiviano e trasmettono informazioni coinvolgenti dal punto di vista emotivo, ma le generano? Quando insomma il ricordo del caro parente defunto viene animato da un servizio di proprietà di Google, o di Amazon, o di Facebook? Che magari, nel pieno rispetto della privacy, può decidere anche, di punto in bianco, di terminare il supporto per un prodotto o di renderlo di colpo molto più costoso?

 

Sono questioni importanti, su cui è ragionevole pensare che nei prossimi anni occorrerà, come minimo, tenere alta l’attenzione. Ma ancora più importante sarà esercitare l’immaginazione, e incoraggiare un alto livello della discussione. Oltre ai rischi, occorre infatti vedere le opportunità che queste tecnologie offrono – e non è affatto detto che le opportunità più interessanti siano quelle di cui si parla molto oggi, e su cui le aziende interessate hanno già deciso di investire.

 

Bibliografia

Joseph C. Licklider e Robert W. Taylor, The computer as a communication device, “Science and Technology”, 76, aprile 1068.

Roberto Pieraccini, The Voice in the Machine. Building Computers that Understand Speech, Boston, MIT Press, 2012.

Mirko Tavosanis, Lingue e intelligenza artificiale, Roma, Carocci, 2018.

James Vlahos, Talk to Me: Apple, Google, Amazon and the Race for Voice-controlled AI, Londra, Random House, 2019.

 

Immagine: Her (2013), regia di S. Jonze

 

 

 


© Istituto della Enciclopedia Italiana - Riproduzione riservata

0