Inteligência de dados generativa

O novo modelo de IA da Meta pode traduzir e transcrever 100 idiomas

Data:

Meta Platforms Inc. anunciou um modelo de IA que pode transcrever e traduzir até 100 idiomas. SeamlessM4T oferece suporte a traduções entre fala e texto, facilitando a interação das pessoas, independentemente de seu idioma nativo.

Em uma postagem no blog publicada em 22 de agosto, o Facebook a empresa controladora disse que o modelo também suporta traduções completas de fala para fala em 36 idiomas, uma melhoria em relação aos modelos anteriores, que só podiam traduzir fala ou texto em um idioma por vez.

SeamlessM4T pode executar várias outras funções, incluindo reconhecimento de fala, tradução de fala para texto, tradução de texto para texto e tradução de texto para fala, disse a empresa.

Veja também: Câmeras AI pegam 300 motoristas britânicos errantes em 3 dias

Meta afirma que SeamlessM4T reduz erros

De acordo com no blog, a empresa está disponibilizando seu modelo SeamlessM4T ao público para uso não comercial – o que significa que pesquisadores e desenvolvedores podem usar o modelo para construir seus próprios aplicativos e melhorar o estado da tradução de IA.

Os pesquisadores dizem que o modelo foi treinado em quatro milhões de horas de “áudio bruto proveniente de um repositório publicamente disponível de dados rastreados da web”, Reuters relatórios. Os dados de texto foram retirados de conjuntos de dados criados em 2022 por meio da extração de conteúdo da Wikipedia e de outros sites relacionados.

Meta admite que os dados não são protegidos por direitos autorais – algo que levou a ações judiciais contra empresas de IA que utilizam dados publicamente disponíveis para treinar os seus modelos. A empresa descreveu o SeamlessM4T como um “avanço significativo” no campo da tecnologia de fala para fala e fala para texto.

“Em comparação com abordagens que usam modelos separados, a abordagem de sistema único do SeamlessM4T reduz erros e atrasos, aumentando a eficiência e a qualidade do processo de tradução”, Meta dito.

SeamlessM4T baseia-se no No Language Left Behind da Meta, uma tradução automática de texto para texto modelo lançado no ano passado, e o Universal Speech Translator, que suporta Hokkien, uma variedade da língua chinesa.

Ele também se baseia na estrutura Massively Multilingual Speech da empresa, que fornece reconhecimento de fala, identificação de idioma e tecnologia de síntese de fala para mais de 1,100 idiomas.

IA – nexo metaverso

O CEO da Meta, Mark Zuckerberg, disse anteriormente que espera que ferramentas como o SeamlessM4T facilitem as interações entre usuários de todo o mundo no metaverso.

Ao facilitar a comunicação entre as pessoas entre idiomas, a IA poderia ajudar a tornar o metaverso um espaço mais inclusivo e acessível para todos.

Zuckerberg acredita que a Meta se beneficia de um ecossistema aberto de IA porque permite à empresa terceirizar a criação de ferramentas voltadas para o consumidor para suas plataformas sociais, em vez de cobrar pelo acesso aos modelos, conforme relatório da Reuters.

Em sua postagem no blog, a empresa escreveu:

“Nosso modelo único oferece traduções sob demanda que permitem que pessoas que falam idiomas diferentes se comuniquem de maneira mais eficaz.”

A Meta não é a única empresa que cria modelos de tradução baseados em IA. Amazon, Microsoft, OpenAI e Google são todos trabalhar em serviços de tradução de IA comerciais ou de código aberto. A Mozilla criou o Common Voice, um grande banco de dados multilíngue de vozes que pode ser usado para treinar algoritmos automáticos de reconhecimento de fala.

Meta avisou que o SeamlessM4T pode estar sujeito a alguns preconceitos. Ele tende a “generalizar demais para formas masculinas ao traduzir a partir de termos neutros” e tem melhor desempenho ao traduzir a partir da referência masculina (por exemplo, substantivos como “ele” em inglês) para a maioria dos idiomas.

local_img

Inteligência mais recente

local_img