Generatiivinen tiedustelu

Luo ääntä sisällölle useilla kielillä samalla TTS-äänipersoonalla Amazon Pollyssa

Treffi:

Amazon Polly on johtava pilvipohjainen palvelu, joka muuntaa tekstin todentuntuiseksi puheeksi. Neural Text-to-Speech (NTTS) -tekniikan käyttöönoton jälkeen olemme jatkuvasti laajentaneet saatavilla olevien äänien valikoimaamme tarjotaksemme laajan valikoiman erilaisia ​​kaiuttimia tuetuilla kielillä. Tänään meillä on ilo ilmoittaa neljästä uudesta lisäyksestä: Pedro puhuu Yhdysvaltain espanjaa, Daniel puhuu saksaa, Liam puhuu kanadan ranskaa ja Arthur puhuu brittiläistä englantia. Kuten kaikki salkkumme hermoäänet, nämä äänet tarjoavat sujuvan, natiiviääntämisen kohdekielellään. Ainutlaatuista näissä neljässä äänessä on kuitenkin se, että ne kaikki perustuvat samaan äänipersoonaan.

Pedro, Daniel, Liam ja Arthur mallinnettiin olemassa olevan yhdysvaltalaisen Matthew-äänen mukaan. Asiakkaat arvostavat Matthew'ta edelleen luonnollisesta ja ammattimaiselta kuulostavasta laadustaan, mutta ääni on toistaiseksi palvellut yksinomaan englanninkielistä liikennettä. Nyt käyttämällä syväoppimismenetelmiä erotimme kielen ja puhujan identiteetin, minkä ansiosta pystyimme säilyttämään äidinkielen kaltaisen sujuvuuden useilla kielillä ilman, että meidän oli hankittava monikielisiä tietoja samalta puhujalta. Käytännössä tämä tarkoittaa, että siirsimme yhdysvaltalaisen englannin Matthew-äänen lauluominaisuudet Yhdysvaltain espanjaksi, saksaksi, kanadanranskaksi ja brittienglanniksi, mikä avasi uusia mahdollisuuksia Amazon Polly -asiakkaille.

Samalla kuulostavan äänen saaminen viidellä paikkakunnalla avaa suuren potentiaalin liiketoiminnan kasvulle. Ensinnäkin asiakkaat, joilla on globaali jalanjälki, voivat luoda yhtenäisen käyttökokemuksen eri kielillä ja alueilla. Esimerkiksi useita kieliä tukeva interaktiivinen äänivastausjärjestelmä (IVR) voi nyt palvella eri asiakassegmenttejä muuttamatta brändin tunnelmaa. Sama koskee kaikkia muita TTS-käyttötapauksia, kuten uutisartikkelien, koulutusmateriaalien tai podcastien esittämistä.

Toiseksi, äänet sopivat hyvin Amazon Polly -asiakkaille, jotka etsivät vieraiden lauseiden ääntämistä millä tahansa viidestä tuetuista kielestä.

Kolmanneksi Pedron, Danielin, Liamin ja Arthurin julkaiseminen palvelee asiakkaitamme, jotka pitävät Amazon Polly NTTS:stä Yhdysvaltain espanjan, saksan, kanadanranskan ja brittiläisen englannin kielellä, mutta jotka etsivät korkealaatuista maskuliinista ääntä – he voivat käyttää näitä ääniä äänen luomiseen. yksikieliselle sisällölle ja odotat huippulaatua, joka on sama kuin muiden näiden kielten NTTS-ääniä.

Lopuksi voidaan käyttää myös uusien miespuolisten NTTS-äänien luomiseen kehittämäämme tekniikkaa Brand Voices. Tämän ansiosta Brand Voicen asiakkaat voivat nauttia ainutlaatuisesta, heidän brändilleen räätälöidystä NTTS-äänestä, mutta myös säilyttää yhtenäisen kokemuksen palvellessaan kansainvälistä yleisöä.

Esimerkki käyttötapauksesta

Tutkitaan esimerkkikäyttötapausta osoittaaksemme, mitä tämä tarkoittaa käytännössä. Matthew'n tuntevat Amazon Polly -asiakkaat voivat edelleen käyttää tätä ääntä tavalliseen tapaan valitsemalla Matteus Amazon Polly -konsolissa ja kirjoittamalla minkä tahansa tekstin, jonka he haluavat kuulla puhuttuna Yhdysvaltain englanniksi. Seuraavassa tilanteessa luomme ääninäytteitä IVR-järjestelmää varten ("Englannin kieli, paina yksi"):

Tämän julkaisun ansiosta voit nyt laajentaa käyttötapausta tarjotaksesi yhtenäisen äänikokemuksen eri kielillä. Kaikki uudet äänet ovat luonnollisen kuuloisia ja säilyttävät alkuperäisen aksentin.

  • Jos haluat luoda puheen brittienglanniksi, valitse Arthur ("Englannin kieli, paina yhtä"):
  • Jos haluat käyttää Yhdysvaltain espanjan puhujaa, valitse Pedro ("Para español, por favor marque dos"):
  • Daniel tarjoaa tukea saksaksi ("Für Deutsch drücken Sie bitte die Drei"):
  • Voit syntetisoida tekstiä kanadan ranskaksi valitsemalla Liam ("Pour le français, veuillez appuyer sur le quatre"):

Huomaa, että paitsi puhuessaan eri aksentilla, brittiläinen Arthur-ääni lokalisoi syöttötekstin eri tavalla kuin yhdysvaltalainen Matthew-ääni. Esimerkiksi "1/2/22" Arthur lukee "1. helmikuuta 2022", kun taas Matthew lukee sen "2. tammikuuta 2022".

Yhdistetään nyt nämä kehotteet:

Yhteenveto

Pedro, Daniel, Liam ja Arthur ovat saatavilla vain Neural TTS -ääninä, joten voidaksesi nauttia niistä, sinun on käytettävä Neural-moottoria jossakin NTW: tä tukevat AWS-alueet. Nämä ovat laadukkaita yksikielisiä ääniä kohdekielellään. Se, että heidän persoonansa ovat yhdenmukaisia ​​eri kielillä, on lisäetu, jonka toivomme ilahduttavan asiakkaita, jotka työskentelevät useilla kielillä. Katso lisätietoja Amazon Polly -luettelostamme teksti puheeksi -äänet , Neuraalinen TTS-hinnoittelu, palvelurajatja UKK, ja vieraile hinnoittelusivulla.


Tietoja Tekijät

Patryk Wainaina on kieliinsinööri, joka työskentelee tekstistä puheeksi englannin, saksan ja espanjan kielellä. Puheen ja kielenkäsittelyn taustalla hänen kiinnostuksensa ovat koneoppiminen, jota sovelletaan TTS-eturatkaisuihin, erityisesti vähän resursseja vaativissa olosuhteissa. Vapaa-ajallaan hän kuuntelee mielellään elektronista musiikkia ja oppii uusia kieliä.

Marta Smolarek on vanhempi ohjelmapäällikkö Amazon Text-to-Speech -tiimissä, jossa hän keskittyy Contact Center TTS -käyttötapaukseen. Hän määrittelee Go-to-Market-aloitteet, käyttää asiakaspalautetta tuotekartan rakentamiseen ja koordinoi TTS-äänen lanseerauksia. Työn ulkopuolella hän tykkää käydä telttailemassa perheensä kanssa.

spot_img

Uusin älykkyys

spot_img

Keskustele kanssamme

Hei siellä! Kuinka voin olla avuksi?