Meta Platforms Inc. anunciou um modelo de IA que pode transcrever e traduzir até 100 idiomas. SeamlessM4T oferece suporte a traduções entre fala e texto, facilitando a interação das pessoas, independentemente de seu idioma nativo.
Em uma postagem no blog publicada em 22 de agosto, o Facebook a empresa controladora disse que o modelo também suporta traduções completas de fala para fala em 36 idiomas, uma melhoria em relação aos modelos anteriores, que só podiam traduzir fala ou texto em um idioma por vez.
SeamlessM4T pode executar várias outras funções, incluindo reconhecimento de fala, tradução de fala para texto, tradução de texto para texto e tradução de texto para fala, disse a empresa.
Veja também: Câmeras AI pegam 300 motoristas britânicos errantes em 3 dias
Meta afirma que SeamlessM4T reduz erros
De acordo com no blog, a empresa está disponibilizando seu modelo SeamlessM4T ao público para uso não comercial – o que significa que pesquisadores e desenvolvedores podem usar o modelo para construir seus próprios aplicativos e melhorar o estado da tradução de IA.
Os pesquisadores dizem que o modelo foi treinado em quatro milhões de horas de “áudio bruto proveniente de um repositório publicamente disponível de dados rastreados da web”, Reuters relatórios. Os dados de texto foram retirados de conjuntos de dados criados em 2022 por meio da extração de conteúdo da Wikipedia e de outros sites relacionados.
Meta admite que os dados não são protegidos por direitos autorais – algo que levou a ações judiciais contra empresas de IA que utilizam dados publicamente disponíveis para treinar os seus modelos. A empresa descreveu o SeamlessM4T como um “avanço significativo” no campo da tecnologia de fala para fala e fala para texto.
“Em comparação com abordagens que usam modelos separados, a abordagem de sistema único do SeamlessM4T reduz erros e atrasos, aumentando a eficiência e a qualidade do processo de tradução”, Meta dito.
Apresentando o SeamlessM4T, o primeiro modelo de tradução multimodal multilíngue completo.
Este modelo único pode executar tarefas de conversão de fala em texto, conversão de fala em fala, tradução de texto em texto e reconhecimento de fala em até 100 idiomas, dependendo da tarefa.
Detalhes ⬇️
—Meta AI (@MetaAI) 22 de agosto de 2023
SeamlessM4T baseia-se no No Language Left Behind da Meta, uma tradução automática de texto para texto modelo lançado no ano passado, e o Universal Speech Translator, que suporta Hokkien, uma variedade da língua chinesa.
Ele também se baseia na estrutura Massively Multilingual Speech da empresa, que fornece reconhecimento de fala, identificação de idioma e tecnologia de síntese de fala para mais de 1,100 idiomas.
IA – nexo metaverso
O CEO da Meta, Mark Zuckerberg, disse anteriormente que espera que ferramentas como o SeamlessM4T facilitem as interações entre usuários de todo o mundo no metaverso.
Ao facilitar a comunicação entre as pessoas entre idiomas, a IA poderia ajudar a tornar o metaverso um espaço mais inclusivo e acessível para todos.
Zuckerberg acredita que a Meta se beneficia de um ecossistema aberto de IA porque permite à empresa terceirizar a criação de ferramentas voltadas para o consumidor para suas plataformas sociais, em vez de cobrar pelo acesso aos modelos, conforme relatório da Reuters.
Em sua postagem no blog, a empresa escreveu:
“Nosso modelo único oferece traduções sob demanda que permitem que pessoas que falam idiomas diferentes se comuniquem de maneira mais eficaz.”
A Meta não é a única empresa que cria modelos de tradução baseados em IA. Amazon, Microsoft, OpenAI e Google são todos trabalhar em serviços de tradução de IA comerciais ou de código aberto. A Mozilla criou o Common Voice, um grande banco de dados multilíngue de vozes que pode ser usado para treinar algoritmos automáticos de reconhecimento de fala.
Meta avisou que o SeamlessM4T pode estar sujeito a alguns preconceitos. Ele tende a “generalizar demais para formas masculinas ao traduzir a partir de termos neutros” e tem melhor desempenho ao traduzir a partir da referência masculina (por exemplo, substantivos como “ele” em inglês) para a maioria dos idiomas.
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
- PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
- PlatãoESG. Automotivo / EVs, Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
- PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
- ChartPrime. Eleve seu jogo de negociação com ChartPrime. Acesse aqui.
- BlockOffsets. Modernizando a Propriedade de Compensação Ambiental. Acesse aqui.
- Fonte: https://metanews.com/metas-new-ai-model-can-translate-and-transcribe-100-languages/