Generatiivne andmeluure

Looge sisu jaoks heli mitmes keeles sama TTS-häälega isikuga Amazon Pollys

kuupäev:

Amazon Polly on juhtiv pilvepõhine teenus, mis teisendab teksti elutruuks kõneks. Pärast Neural Text-to-Speech (NTTS) kasutuselevõttu oleme pidevalt laiendanud oma saadaolevate häälte portfelli, et pakkuda toetatud keeltes laia valikut erinevaid kõlareid. Täna on meil hea meel teatada neljast uuest täiendusest: Pedro räägib USA hispaania keelt, Daniel räägib saksa keelt, Liam räägib Kanada prantsuse keelt ja Arthur räägib Briti inglise keelt. Nagu kõik meie portfellis olevad närvihääled, pakuvad need hääled oma sihtkeeltes sujuvat ja omakeelset hääldust. Nende nelja hääle puhul on aga ainulaadne see, et nad kõik põhinevad samal hääleisikul.

Pedro, Danieli, Liami ja Arthuri eeskujuks oli olemasolev USA inglise Matthew hääl. Kuigi kliendid hindavad Matthew'd jätkuvalt tema loomulikkuse ja professionaalse kõla eest, on hääl siiani teenindanud ainult ingliskeelset liiklust. Nüüd, kasutades süvaõppe meetodeid, lahutasime keele ja kõneleja identiteedi, mis võimaldas meil säilitada paljude keelte keeleoskuse, ilma et oleksime pidanud hankima samalt kõnelejalt mitmekeelseid andmeid. Praktikas tähendab see, et kandsime USA inglise keele Matthew hääle vokaalsed omadused üle USA hispaania, saksa, kanada prantsuse ja briti inglise keelele, avades Amazon Polly klientidele uusi võimalusi.

Sarnaselt kõlava hääle olemasolu viies asukohas avab suure potentsiaali ettevõtte kasvuks. Esiteks saavad globaalse jalajäljega kliendid luua ühtse kasutuskogemuse erinevates keeltes ja piirkondades. Näiteks saab mitut keelt toetav interaktiivse häälreaktsiooni (IVR) süsteem nüüd teenindada erinevaid kliendisegmente ilma brändi tunnetust muutmata. Sama kehtib ka kõigi muude TTS-i kasutusjuhtude kohta, näiteks uudisteartiklite, õppematerjalide või taskuhäälingusaadete esitamise kohta.

Teiseks sobivad hääled hästi Amazon Polly klientidele, kes otsivad võõrkeelsete fraaside emakeelset hääldust mis tahes viiest toetatud keelest.

Kolmandaks teenindab Pedro, Danieli, Liami ja Arthuri väljaandmine meie kliente, kellele meeldib Amazon Polly NTTS USA hispaania, saksa, kanada prantsuse ja briti inglise keeles, kuid kes otsivad kvaliteetset mehelikku häält – nad saavad neid hääli kasutada heli loomiseks. ükskeelse sisu jaoks ja oodata tippkvaliteeti, mis on samaväärne teiste nendes keeltes NTTS-i häältega.

Lõpuks saab kasutada ka tehnoloogiat, mille oleme välja töötanud uute meessoost NTTS-häälte loomiseks Brändi hääled. Tänu sellele saavad Brand Voice'i kliendid mitte ainult nautida ainulaadset NTTS-i häält, mis on kohandatud nende kaubamärgile, vaid ka säilitada järjepideva kogemuse teenindades rahvusvahelist publikut.

Kasutusjuhtumi näide

Uurime näidet, et näidata, mida see praktikas tähendab. Matthew’ga tuttavad Amazon Polly kliendid saavad seda häält ikka tavapärasel viisil valides kasutada Matthew Amazon Polly konsoolil ja sisestades mis tahes teksti, mida nad soovivad kuulda USA inglise keeles. Järgmise stsenaariumi korral loome helinäidised IVR-süsteemi jaoks ("Inglise keele jaoks vajutage ühte"):

Tänu sellele väljalasele saate nüüd kasutusjuhtumit laiendada, et pakkuda ühtlast helikogemust erinevates keeltes. Kõik uued hääled on loomulikkõlalised ja säilitavad omapärase aktsendi.

  • Briti inglise keeles kõne loomiseks valige Arthur ("Inglise keele jaoks vajutage ühte"):
  • USA hispaania keele kõnelejate kasutamiseks valige Pedro ("Para español, por favor marque dos"):
  • Daniel pakub tuge saksa keeles (“Für Deutsch drücken Sie bitte die Drei”):
  • Saate sünteesida teksti Kanada prantsuse keeles, valides Liami ("Pour le français, veuillez appuyer sur le quatre"):

Pange tähele, et lisaks erineva aktsendiga rääkimisele lokaliseerib Ühendkuningriigi ingliskeelne Arthuri hääl sisendteksti teisiti kui USA inglise Matthew hääl. Näiteks „1/2/22” loeb Arthur kui „1. veebruar 2022”, samas kui Matthew loeb seda „2. jaanuar 2022”.

Nüüd ühendame need juhised:

Järeldus

Pedro, Daniel, Liam ja Arthur on saadaval ainult Neural TTS häältena, nii et nende nautimiseks peate kasutama Neurali mootorit ühes AWS-i piirkonnad, mis toetavad NTTS-i. Need on kvaliteetsed ükskeelsed hääled nende sihtkeeltes. Asjaolu, et nende isikud on erinevates keeltes järjepidevad, on täiendav eelis, mis loodetavasti rõõmustab kliente, kes töötavad mitmes keeles sisuga. Lisateabe saamiseks vaadake meie Amazon Polly täielikku loendit tekstist kõneks muutvad hääled , Neuraalne TTS-i hinnakujundus, teenuse piirangudja KKKja külastage meie hinnakiri.


Autoritest

Patryk Wainaina on keeleinsener, kes töötab teksti kõneks muutmisega inglise, saksa ja hispaania keeles. Kõne- ja keeletöötluse taustal on tema huvid masinõppes, mida kasutatakse TTS-i esiotsa lahendustes, eriti vähese ressursiga seadetes. Vabal ajal kuulab ta meelsasti elektroonilist muusikat ja õpib uusi keeli.

Marta Smolarek on vanemprogrammijuht Amazoni teksti kõneks muutmise meeskonnas, kus ta keskendub kontaktkeskuse TTS-i kasutusjuhtumitele. Ta määratleb turule mineku algatused, kasutab klientide tagasisidet toote tegevuskava koostamiseks ja koordineerib TTS-i häälkäsklusi. Väljaspool tööd meeldib talle perega telkimas käia.

spot_img

Uusim intelligentsus

spot_img

Jututuba koos meiega

Tere! Kuidas ma teid aidata saan?