Sei nella sezione Scienza   -> Categoria:  Tecnologia  
Gli assistenti vocali e il problema della pronuncia

Gli assistenti vocali e il problema della pronuncia
Autore: Luca Sambucci - Redazione Nuove
Data: 22/04/2020

A Stanford hanno provato a vedere come si comportano gli algoritmi di riconoscimento vocale quando la pronuncia, la cadenza, l’inflessione delle parole non è perfettamente corrispondente alla lingua ufficiale. Per lo studio hanno raccolto spezzoni audio da diversi gruppi di donne e uomini provenienti da varie parti degli Stati Uniti. Fra gli altri hanno anche raccolto pezzi audio da una comunità di afroamericani nel North Carolina e altri da una comunità di bianchi nel nord della California per confrontare i risultati.

Per comprendere con quale efficacia gli algoritmi di riconoscimento vocale riuscissero a capire l’audio i ricercatori hanno usato una metrica chiamata word error rate (WER), che si ottiene mettendo a confronto una trascrizione manuale fedele all’audio e la trascrizione fornita dall’algoritmo. Dai risultati è apparso chiaro che tutti i sistemi hanno problemi con l’audio pronunciato dagli uomini afroamericani, con tassi di errore generalmente doppi rispetto a quelli riscontrati con uomini e donne bianchi. Più comprensibili degli uomini sono risultate le donne di colore, con un tasso d’errore comunque superiore alla media dello studio.

Con uomini e donne bianchi gli algoritmi hanno restituito tassi di errore rispettivamente dello 0,21 e dello 0,17 – differenze statisticamente irrilevanti – mentre il WER con le donne afroamericane è arrivato a 0,30 e con gli uomini afroamericani addirittura allo 0,41. All’atto pratico queste differenze vogliono dire che i software non riconoscono, non capiscono, sbagliano le parole il doppio delle volte con gli uomini di colore rispetto ai bianchi.

Il motivo ovviamente non è razzismo, bensì semplicemente un training delle reti neurali dove il dataset era composto più da spezzoni audio di persone bianche rispetto a persone di colore. Tutti i maggiori produttori di software di riconoscimento vocale, parliamo di AmazonAppleGoogleIBM e Microsoft, hanno avuto problemi simili nel test. Questo significa che in tutti quei casi il training set non era opportunamente bilanciato, cosa che ha fatto nascere il bias dell’algoritmo.

Sbaglieremmo a pensare che il problema è solo americano. Tutte le lingue hanno dialetti, accenti, pronunce diverse. In Italia ne sappiamo qualcosa, con la molteplicità di lingue e soprattutto di dialetti parlati nel nostro Paese. Ma anche altri Paesi, penso ad esempio all’India, hanno le stesse difficoltà.

Una soluzione sarebbe consentire alle reti neurali degli assistenti vocali di imparare in continuazione, adeguandosi al parlato di chi li usa. Sarebbe triste veder accelerare la scomparsa di lingue e dialetti solo perché le macchine non li capiscono. O perché i maggiori produttori di assistenti digitali usano dataset troppo selettivi.

L'autore: Luca Sambucci:

Dopo la laurea in Management ha conseguito una specializzazione in Business Analytics a Wharton e una certificazione Artificial Intelligence Professional da IBM. E' socio fondatore del chapter italiano di Internet Society, membro dell’Associazione Italiana esperti in Infrastrutture Critiche (AIIC), della Association for the Advancement of Artificial Intelligence (AAAI) e dell’Associazione Italiana per l’Intelligenza Artificiale (AIxIA). Partecipa ai lavori della European AI Alliance della Commissione Europea e del Consultation Forum for Sustainable Energy in the Defence and Security Sector della European Defence Agency.

 

Abbiamo stipulato un accordo con l'autore, Luca Sambucci, per la diffusione dei suoi articoli. L'articolo originale si trova al seguente link: Notizie.ai




Cosa ne pensi?
Login
Inserisci il tuo username e la tua password per loggarti.
Username:


Password:

Remember me:

Non sei ancora iscritto?
Diventa subito uno sComunicato!

Dimenticata la password?
Clicca qui



aaaa

Per commentare l'articolo occorre essere loggati e rispettare la netiquette del sito.


Se sei registrato effettua il login dal box qui a sinistra.

Se ancora non sei registrato fallo cliccando qui
I commenti:

Commento 1)
La redazione ed il direttore hanno piacere di rispondere ai commenti dei nostri lettori. Facci sapere cosa ne pensi dell'articolo. La tua opinione è per noi importante.

Commento di: emilia.urso Ip:83.73.103.204 Voto: 7 Data 07/09/2024 20:46:34

Sei iscritto su Facebook, Twitter o G+?
Commenta e condividi l'articolo direttamente.

Login
Inserisci il tuo username e la tua password per loggarti.

Username:


Password:

Remember me:

Non sei ancora iscritto?
Diventa subito uno sComunicato!

Dimenticata la password?
Clicca qui

 
Iscrizione newsletter
Inserisci il tuo indirizzo email

Vuoi cancellarti?
Clicca qui
 
 
Search
Ricerca articolo
Ricerca
Dove
Da data
A Data:
Tipo ricerca:
Almeno una parola

Tutte le parole
 
 
Petizioni
Facciamo sentire la nostra voce
Dimettiamoci dalla carica di Cittadini Italiani

Cos'è uno Stato senza i cittadini? Nulla. Cosa sono i cittadini senza lo Stato? La risposta la conosciamo tutti, perchè lo Stato italiano palesemente, sta lasciando alla deriva la motivazione fondamentale della sua stessa esistenz



Data:10/08/2013
Categoria:Politica e Governo
Obbiettivo:50000 firme

 
Correlati in Tecnologia

Autore: Luca Sambucci - Redazione Nuove Tecnologie
Data: 23/05/2020
Ecco come un modello di deep learning “vede” il malware

I risultati, come sempre accade nella sicurezza informatica, variano a seconda di quanta sensibilità si vuole assegnare al classificatore. 

Leggi l'articolo

Autore: Luca Sambucci - Redazione Nuove Tecnologie
Data: 22/05/2020
Il numero dell’AI: la ricerca di una metrica universale

Vita e lavoro sono spesso scandite da alcune metriche che, giuste o sbagliate che siano, misurano la progressione, la crescita (o decrescita) rispetto a un determinato periodo. 

Leggi l'articolo

Autore: Marco Ferrario e Sara Antonelli - Redazione Nuov
Data: 13/05/2020
Amazon annuncia il lancio del Nuovo Fire HD 8

Il nuovo tablet Fire HD 8 presenta caratteristiche che tutti in famiglia apprezzano: contenuti di qualità, maggiore spazio di archiviazione, maggiore durata della batteria, il tutto a un prezzo incredibilmente conveniente

Leggi l'articolo

Autore: Luca Sambucci - Redazione Nuove Tecnologie
Data: 16/05/2020
La pandemia ha eluso i sistemi predittivi di intelligenza artificiale

I modelli predittivi hanno fallito il loro primo vero appuntamento con un cambiamento epocale – certo, di quelli che si trovano solo nei libri di storia – e nel settore dell’intelligenza artificiale questi problemi non sono presi sottogamba. 

Leggi l'articolo
GERENZA: Gli Scomunicati - L'informazione per chi non ha paura e chi ne ha troppa - PluriSet timanale nazionale - Reg. Tribunale di Roma N° 3 del 21 Gennaio 2014
Testata ideata e diretta da Emilia Urso Anfuso. Note legali.  Per informazioni commerciali e per entrare in contatto con la redazione potete chiamare lo 06 92938726 (Tel. e Fax) -