Inteligența generativă a datelor

Cineva îi ajută în sfârșit pe modelele AI să-i înțeleagă pe cei cu dizabilități de vorbire

Data:

Boffins de la Universitatea din Illinois Urbana-Champaign (UIUC) din SUA lucrează cu super-corpul obișnuit de internet pentru, în mod ideal, a îmbunătăți recunoașterea vocii AI pentru persoanele cu dizabilități.

Software-ul de recunoaștere a vorbirii se luptă adesea să proceseze vorbirea pentru persoanele cu accente puternice și funcționează și mai rău pentru persoanele cu dizabilități de vorbire, deoarece vocile lor nu sunt de obicei reprezentate bine sau deloc în seturile de date de antrenament. 

Proiectul de accesibilitate a vorbirii, lansat luni și susținut de Amazon, Apple, Google, Meta și Microsoft, precum și de organizații nonprofit, își propune să facă modelele de recunoaștere a vorbirii mai eficiente pentru toată lumea. „Pentru mulți dintre noi, vorbirea și comunicarea sunt fără efort”, a spus Clarion Mendes, profesor clinic în știința vorbirii și a auzului la UIUC, care lucrează la proiect. Registrul.

„Cu toate acestea, există milioane de oameni pentru care comunicarea nu este fără efort. Este o luptă zilnică. Prin unificarea eforturilor noastre către un obiectiv comun de îmbunătățire a accesibilității vorbirii pentru persoanele cu dizabilități sau diferențe de vorbire, nu îmbunătățim doar tehnologia, ci îmbunătățim calitatea vieții și promovăm independența.”

Cercetătorii se vor concentra pe obținerea de date audio diverse de la persoane afectate de diferite tulburări medicale care afectează vorbirea, cum ar fi boala Lou Gehrig sau scleroza laterală amiotrofică (ALS), Parkinson, paralizia cerebrală și sindromul Down vorbind engleza. Voluntarii vor fi plătiți pentru a înregistra mostre audio, care vor fi folosite pentru a crea un set mare de date pentru a antrena modele AI pentru aplicații comerciale și de cercetare.

Dacă există sau au existat proiecte similare cu acest efort, este grozav, deși acesta se remarcă prin sprijinul acordat de cei care produc asistenții vocali AI de astăzi și altele asemenea.

Partenerii din industrie care susțin Proiectul de accesibilitate a vorbirii finanțează proiectul pentru cel puțin doi ani și vor lucra cu cadre universitare pentru a afla cum pot fi îmbunătățite modelele actuale de recunoaștere a vorbirii.

„Prin lucrul direct cu persoane cu diferențe de vorbire și dizabilități, prin focus grupuri și partenerii noștri de advocacy, vom fi echipați pentru a determina punctele forte și limitările sistemelor actuale de recunoaștere automată a vorbirii și necesitatea dezvoltării unor sisteme noi”, a spus Mendes.

Echipa va lucra cu Davis Phinney Foundation și Team Gleason, două organizații non-profit pentru a colecta date despre vorbire de la persoanele cu SLA și boala Parkinson la început înainte de a se extinde pentru a sprijini alte tipuri de dizabilități. 

„Opțiunea de a comunica și opera dispozitive cu vorbire este crucială pentru oricine interacționează astăzi cu tehnologia sau economia digitală. Interfețele de vorbire ar trebui să fie disponibile pentru toată lumea, iar asta include și persoanele cu dizabilități.” a spus Mark Hasegawa-Johnson, profesorul UIUC de inginerie electrică și informatică, care conduce proiectul.

„Această sarcină a fost dificilă, deoarece necesită multă infrastructură, în mod ideal cea care poate fi susținută de companii de tehnologie de vârf, așa că am creat o echipă interdisciplinară unică, cu experiență în lingvistică, vorbire, inteligență artificială, securitate și confidențialitate pentru a ajuta facem față acestei provocări importante.” ®

spot_img

Ultimele informații

spot_img

Chat cu noi

Bună! Cu ce ​​​​vă pot ajuta?