Gli sComunicati:Gli assistenti vocali e il problema della pronuncia

Gli Scomunicati - Quotidiano indipendente online dal 2006 - Fondato e diretto da Emilia Urso Anfuso
Registrazione Tribunale di Roma N° 3 del 21 Gennaio 2014

Sei nella sezione Scienza -> Categoria: Tecnologia

Gli assistenti vocali e il problema della pronuncia

Autore: Luca Sambucci - Redazione Nuove

Data: 22/04/2020

A Stanford hanno provato a vedere come si comportano gli algoritmi di riconoscimento vocale quando la pronuncia, la cadenza, l’inflessione delle parole non è perfettamente corrispondente alla lingua ufficiale. Per lo studio hanno raccolto spezzoni audio da diversi gruppi di donne e uomini provenienti da varie parti degli Stati Uniti. Fra gli altri hanno anche raccolto pezzi audio da una comunità di afroamericani nel North Carolina e altri da una comunità di bianchi nel nord della California per confrontare i risultati.

Per comprendere con quale efficacia gli algoritmi di riconoscimento vocale riuscissero a capire l’audio i ricercatori hanno usato una metrica chiamata word error rate (WER), che si ottiene mettendo a confronto una trascrizione manuale fedele all’audio e la trascrizione fornita dall’algoritmo. Dai risultati è apparso chiaro che tutti i sistemi hanno problemi con l’audio pronunciato dagli uomini afroamericani, con tassi di errore generalmente doppi rispetto a quelli riscontrati con uomini e donne bianchi. Più comprensibili degli uomini sono risultate le donne di colore, con un tasso d’errore comunque superiore alla media dello studio.

Con uomini e donne bianchi gli algoritmi hanno restituito tassi di errore rispettivamente dello 0,21 e dello 0,17 – differenze statisticamente irrilevanti – mentre il WER con le donne afroamericane è arrivato a 0,30 e con gli uomini afroamericani addirittura allo 0,41. All’atto pratico queste differenze vogliono dire che i software non riconoscono, non capiscono, sbagliano le parole il doppio delle volte con gli uomini di colore rispetto ai bianchi.

Il motivo ovviamente non è razzismo, bensì semplicemente un training delle reti neurali dove il dataset era composto più da spezzoni audio di persone bianche rispetto a persone di colore. Tutti i maggiori produttori di software di riconoscimento vocale, parliamo di Amazon, Apple, Google, IBM e Microsoft, hanno avuto problemi simili nel test. Questo significa che in tutti quei casi il training set non era opportunamente bilanciato, cosa che ha fatto nascere il bias dell’algoritmo.

Sbaglieremmo a pensare che il problema è solo americano. Tutte le lingue hanno dialetti, accenti, pronunce diverse. In Italia ne sappiamo qualcosa, con la molteplicità di lingue e soprattutto di dialetti parlati nel nostro Paese. Ma anche altri Paesi, penso ad esempio all’India, hanno le stesse difficoltà.

Una soluzione sarebbe consentire alle reti neurali degli assistenti vocali di imparare in continuazione, adeguandosi al parlato di chi li usa. Sarebbe triste veder accelerare la scomparsa di lingue e dialetti solo perché le macchine non li capiscono. O perché i maggiori produttori di assistenti digitali usano dataset troppo selettivi.

L'autore: Luca Sambucci:

Dopo la laurea in Management ha conseguito una specializzazione in Business Analytics a Wharton e una certificazione Artificial Intelligence Professional da IBM. E' socio fondatore del chapter italiano di Internet Society, membro dell’Associazione Italiana esperti in Infrastrutture Critiche (AIIC), della Association for the Advancement of Artificial Intelligence (AAAI) e dell’Associazione Italiana per l’Intelligenza Artificiale (AIxIA). Partecipa ai lavori della European AI Alliance della Commissione Europea e del Consultation Forum for Sustainable Energy in the Defence and Security Sector della European Defence Agency.

Abbiamo stipulato un accordo con l'autore, Luca Sambucci, per la diffusione dei suoi articoli. L'articolo originale si trova al seguente link: Notizie.ai

Cosa ne pensi?

Per commentare l'articolo occorre essere loggati e rispettare la netiquette del sito.

Se sei registrato effettua il login dal box qui a sinistra.

Se ancora non sei registrato fallo cliccando qui

I commenti:

Commento 1)
La redazione ed il direttore hanno piacere di rispondere ai commenti dei nostri lettori. Facci sapere cosa ne pensi dell'articolo. La tua opinione è per noi importante.

Commento di: emilia.urso

Ip:83.73.103.204

Voto: 7

Data 22/11/2024 23:02:41

Sei iscritto su Facebook, Twitter o G+?
Commenta e condividi l'articolo direttamente.

Iscrizione newsletter

Inserisci il tuo indirizzo email

Vuoi cancellarti?
Clicca qui

Ricerca articolo

Sondaggi

La Vostra opinione

Renzi. Il nuovo che avanza

Visualizza risultati

Petizioni

Facciamo sentire la nostra voce

Dimettiamoci dalla carica di Cittadini Italiani

Cos'è uno Stato senza i cittadini? Nulla. Cosa sono i cittadini senza lo Stato? La risposta la conosciamo tutti, perchè lo Stato italiano palesemente, sta lasciando alla deriva la motivazione fondamentale della sua stessa esistenz

Data:10/08/2013
Categoria:Politica e Governo
Obbiettivo:50000 firme

Firma anche tu

Correlati in Tecnologia

Ecco come un modello di deep learning “vede” il malware

Autore: Luca Sambucci - Redazione Nuove Tecnologie

Data: 23/05/2020

Ecco come un modello di deep learning “vede” il malware

I risultati, come sempre accade nella sicurezza informatica, variano a seconda di quanta sensibilità si vuole assegnare al classificatore.

Leggi l'articolo

Il numero dell’AI: la ricerca di una metrica universale

Autore: Luca Sambucci - Redazione Nuove Tecnologie

Data: 22/05/2020

Il numero dell’AI: la ricerca di una metrica universale

Vita e lavoro sono spesso scandite da alcune metriche che, giuste o sbagliate che siano, misurano la progressione, la crescita (o decrescita) rispetto a un determinato periodo.

Leggi l'articolo

Amazon annuncia il lancio del Nuovo Fire HD 8

Autore: Marco Ferrario e Sara Antonelli - Redazione Nuov

Data: 13/05/2020

Amazon annuncia il lancio del Nuovo Fire HD 8

Il nuovo tablet Fire HD 8 presenta caratteristiche che tutti in famiglia apprezzano: contenuti di qualità, maggiore spazio di archiviazione, maggiore durata della batteria, il tutto a un prezzo incredibilmente conveniente

Leggi l'articolo

La pandemia ha eluso i sistemi predittivi di intelligenza artificiale

Autore: Luca Sambucci - Redazione Nuove Tecnologie

Data: 16/05/2020

La pandemia ha eluso i sistemi predittivi di intelligenza artificiale

I modelli predittivi hanno fallito il loro primo vero appuntamento con un cambiamento epocale – certo, di quelli che si trovano solo nei libri di storia – e nel settore dell’intelligenza artificiale questi problemi non sono presi sottogamba.

Leggi l'articolo

GERENZA: Gli Scomunicati - L'informazione per chi non ha paura e chi ne ha troppa - PluriSet timanale nazionale - Reg. Tribunale di Roma N° 3 del 21 Gennaio 2014
Testata ideata e diretta da Emilia Urso Anfuso. Note legali. Per informazioni commerciali e per entrare in contatto con la redazione potete chiamare lo 06 92938726 (Tel. e Fax) -