Inteligência de dados generativa

Traduza documentos de vários idiomas de origem para vários idiomas de destino usando o Amazon Translate

Data:

As empresas precisam traduzir conteúdo crítico para os negócios, como materiais de marketing, manuais de instrução e catálogos de produtos em vários idiomas para se comunicar com um público global de clientes, parceiros e partes interessadas. Identificar o idioma de origem em cada documento antes de chamar um trabalho de tradução cria complexidades e adiciona outra etapa ao seu fluxo de trabalho. Por exemplo, uma empresa internacional de produtos com operações de suporte ao cliente localizadas em seu escritório corporativo exige que seus agentes traduzam e-mails ou documentos para atender às solicitações dos clientes. Anteriormente, eles precisavam configurar fluxos de trabalho para identificar o idioma dominante em cada documento, agrupá-los por tipo de idioma e configurar um trabalho de tradução em lote para cada idioma de origem. Agora, Amazon TradutorO recurso de detecção automática de idioma para trabalhos de tradução em lote permite que você traduza um lote de documentos em vários idiomas com um único trabalho de tradução. Isso elimina a necessidade de orquestrar o fluxo de trabalho de tradução de documentos que exigia identificação e agrupamento de idiomas dominantes. O Amazon Translate também permite tradução para vários idiomas de destino para tradução (até 10 idiomas). Um único trabalho de tradução pode traduzir documentos para vários idiomas de destino. Esse recurso elimina a necessidade de criar trabalhos em lote separados para idiomas de destino individuais. Os clientes agora podem criar documentação em vários idiomas, tudo com uma única chamada de API.

Nesta postagem, demonstramos como traduzir documentos em vários idiomas de destino em um trabalho de tradução em lote.

Visão geral da solução

A detecção automática do idioma de origem para trabalhos de tradução em lote permite que você traduza documentos escritos em vários idiomas suportados em uma única operação. Você também pode fornecer até 10 idiomas como destinos. A tarefa processa cada documento, identifica o idioma de origem dominante e o traduz para o idioma de destino. Usos do Amazon Tradutor Amazon Comprehend para determinar o idioma dominante em cada um dos documentos de origem e usá-lo como idioma de origem.

Nas seções a seguir, demonstramos como criar um trabalho de tradução em lote por meio do Console de gerenciamento da AWS ou SDK da AWS.

Crie um trabalho de tradução em lote por meio do console

Neste exemplo, configuramos a tradução em lote do Amazon Translate para detectar automaticamente o idioma de origem e traduzi-lo para inglês e hindi, usando a entrada e a saída Serviço de armazenamento simples da Amazon (Amazon S3) locais de balde fornecidos.

criar trabalho de tradução

A seguir, criamos um Gerenciamento de acesso e identidade da AWS (IAM) que é provisionado como parte da configuração. A função recebe acesso aos buckets S3 de entrada e saída.

Após a criação do trabalho, você pode monitorar o andamento do trabalho de tradução em lote no Trabalhos de tradução seção.

seção de trabalhos de tradução

Quando o trabalho de tradução estiver concluído, você poderá navegar até o local do bucket S3 de saída e observar que os documentos foram traduzidos para o idioma de destino. Nossa entrada consistia em dois arquivos, sample-doc.txt e sample-doc-2.txt, em duas línguas diferentes. Cada documento foi traduzido para duas línguas-alvo, totalizando quatro documentos.

balde S3 de saída

Crie um trabalho de tradução em lote por meio do AWS SDK

O seguinte código Python Boto3 usa a chamada de tradução em lote para traduzir documentos em seu bucket S3 de origem. Especifique os seguintes parâmetros:

  • Configuração de dados de entrada – Forneça a localização do depósito S3 de seus documentos de entrada
  • SaídaDataConfig – Forneça a localização do depósito S3 de seus documentos de saída
  • DataAccessRoleArn – Crie uma função IAM que conceda ao Amazon Translate permissão para acessar seus buckets S3 de entrada e saída
  • SourceLanguageCode: Usar auto
  • Códigos de idioma de destino: Escolha até 10 idiomas de destino
import boto3 client = boto3.client('translate') def lambda_handler(event, context): response = client.start_text_translation_job( JobName='auto-translate-multi-language-sdk', InputDataConfig={ 'S3Uri': 's3://<<REPLACE-WITH-YOUR-INPUT-BUCKET>>/input-sdk', 'ContentType': 'text/plain' }, OutputDataConfig={ 'S3Uri': 's3://<<REPLACE-WITH-YOUR-OUTPUT-BUCKET>>/output-sdk', }, DataAccessRoleArn='<<REPLACE-WITH-THE-IAM-ROLE-ARN>>', SourceLanguageCode='auto', TargetLanguageCodes=[ 'en', 'hi' ] )

limpar

Para limpar depois de usar esta solução, conclua as seguintes etapas:

  1. Excluir os buckets do S3 que você criou.
  2. Excluir papéis do IAM que você configurou.
  3. Exclua todos os outros recursos que você configurou para esta postagem.

Conclusão

Com a necessidade atual de alcance global com recursos limitados, o Amazon Translate ajuda você a simplificar seus fluxos de trabalho de processamento em vários idiomas. Com a introdução da detecção automática do idioma dominante em seu documento de origem para trabalhos de tradução em lote e a tradução para até 10 idiomas de destino, você pode se concentrar na lógica de negócios em vez de lidar com a carga operacional de classificar documentos e gerenciar várias traduções em lote empregos.

Nós nos esforçamos para adicionar recursos ao nosso serviço que facilitem a inovação de nossos clientes. Experimente esta solução e conte-nos como isso ajudou a simplificar suas cargas de trabalho de processamento de documentos.


Sobre os autores

Kishore Dhamodaran é arquiteto de soluções sênior na AWS. Kishore ajuda clientes estratégicos com sua estratégia empresarial de nuvem e jornada de migração, aproveitando seus anos de experiência no setor e na nuvem.

Sid Padgaonkar é gerente de produto sênior do Amazon Translate, o serviço de processamento de linguagem natural da AWS. Nos fins de semana, você o encontrará jogando squash e explorando a cena gastronômica do Pacífico NW.

local_img

Inteligência mais recente

local_img