Inteligência de dados generativa

Faça uma transição perfeita entre o machine learning sem código e o code-first com o Amazon SageMaker Canvas e o Amazon SageMaker Studio | Amazon Web Services

Data:

Estúdio Amazon SageMaker é um ambiente de desenvolvimento integrado (IDE) baseado na Web para aprendizado de máquina (ML) que permite criar, treinar, depurar, implantar e monitorar seus modelos de ML. O SageMaker Studio fornece todas as ferramentas de que você precisa para levar seus modelos desde a preparação de dados até a experimentação e a produção, ao mesmo tempo que aumenta sua produtividade.

Tela do Amazon SageMaker é uma poderosa ferramenta de ML sem código projetada para equipes de negócios e de dados gerarem previsões precisas sem escrever código ou ter ampla experiência em ML. Com sua interface visual intuitiva, o SageMaker Canvas simplifica o processo de carregamento, limpeza e transformação de conjuntos de dados e de construção de modelos de ML, tornando-os acessíveis a um público mais amplo.

No entanto, à medida que suas necessidades de ML evoluem ou se você precisar de personalização e controle mais avançados, talvez você queira fazer a transição de um ambiente sem código para uma abordagem que prioriza o código. É aqui que entra em ação a integração perfeita entre o SageMaker Canvas e o SageMaker Studio.

Neste post apresentamos uma solução para os seguintes tipos de usuários:

  • Especialistas não-ML, como analistas de negócios, engenheiros de dados ou desenvolvedores, que são especialistas de domínio e estão interessados ​​em ferramentas de baixo código sem código (LCNC) para orientá-los na preparação de dados para ML e na construção de modelos de ML. Essa pessoa normalmente é apenas um usuário do SageMaker Canvas e geralmente depende de especialistas em ML em sua organização para revisar e aprovar seu trabalho.
  • Especialistas em ML interessados ​​em como as ferramentas LCNC podem acelerar partes do ciclo de vida do ML (como a preparação de dados), mas também provavelmente adotarão uma abordagem de alto código para certas partes do ciclo de vida do ML (como a construção de modelos). Essa persona normalmente é um usuário do SageMaker Studio que também pode ser um usuário do SageMaker Canvas. Os especialistas em ML também desempenham frequentemente um papel na revisão e aprovação do trabalho de não especialistas em ML para casos de uso de produção.

A utilidade das soluções propostas neste post é dupla. Em primeiro lugar, ao demonstrar como você pode compartilhar modelos no SageMaker Canvas e no SageMaker Studio, os não especialistas em ML e os especialistas em ML podem colaborar em seus ambientes preferidos, que podem ser um ambiente sem código (SageMaker Canvas) para não especialistas e um ambiente de alto código. ambiente (SageMaker Studio) para especialistas. Em segundo lugar, ao demonstrar como compartilhar um modelo do SageMaker Canvas com o SageMaker Studio, mostramos como os especialistas em ML que desejam migrar de uma abordagem LCNC para desenvolvimento para uma abordagem de alto código para produção podem fazê-lo em ambientes SageMaker. A solução descrita nesta postagem é para usuários do novo SageMaker Studio. Para usuários do SageMaker Studio Classic, consulte Colabore com cientistas de dados para saber como você pode fazer uma transição perfeita entre o SageMaker Canvas e o SageMaker Studio Classic.

Visão geral da solução

Para fazer uma transição perfeita entre ML sem código e ML com código primeiro com SageMaker Canvas e SageMaker Studio, descrevemos duas opções. Você pode escolher a opção com base em suas necessidades. Em alguns casos, você pode decidir usar as duas opções em paralelo.

  • Opção 1: Registro de modelo SageMaker – Um usuário do SageMaker Canvas registra seu modelo no Registro de modelos do Amazon SageMaker, invocando um fluxo de trabalho de governança para especialistas em ML revisarem detalhes e métricas do modelo e, em seguida, aprová-lo ou rejeitá-lo, após o qual o usuário pode implantar o modelo aprovado no SageMaker Canvas. Esta opção é um processo de compartilhamento automatizado que fornece governança integrada e rastreamento de aprovação. Você pode visualizar as métricas do modelo; no entanto, há visibilidade limitada no código e na arquitetura do modelo. O diagrama a seguir ilustra a arquitetura.

Opção 1: Registro de modelo SageMaker

  • Opção 2: exportação de notebook – Nesta opção, o usuário do SageMaker Canvas exporta o notebook completo do SageMaker Canvas para Serviço de armazenamento simples da Amazon (Amazon S3) e, em seguida, compartilha-o com especialistas em ML para importação para o SageMaker Studio, permitindo visibilidade e personalização completas do código e da lógica do modelo antes que o especialista em ML implante o modelo aprimorado. Nesta opção, há visibilidade completa do código e da arquitetura do modelo com a capacidade do especialista em ML personalizar e aprimorar o modelo no SageMaker Studio. Porém, esta opção exige uma exportação e importação manual do notebook modelo para o IDE. O diagrama a seguir ilustra essa arquitetura.

Opção 2: exportação de notebook

As fases a seguir descrevem as etapas para colaboração:

  • Partilhar – O usuário do SageMaker Canvas registra o modelo no SageMaker Canvas ou baixa o notebook no SageMaker Canvas
  • Avaliações – O usuário do SageMaker Studio acessa o modelo por meio do registro do modelo para revisar e executar o notebook exportado por meio do JupyterLab para validar o modelo
  • Profissional – O usuário do SageMaker Studio aprova o modelo do registro de modelo
  • Implantação – O usuário do SageMaker Studio pode implantar o modelo do JupyterLab ou o usuário do SageMaker Canvas pode implantar o modelo do SageMaker Canvas

Vejamos detalhadamente as duas opções (registro de modelo e exportação de notebook) em cada etapa.

Pré-requisitos

Antes de mergulhar na solução, certifique-se de ter se inscrito e criado uma conta AWS. Então você precisa criar um usuário administrativo e um grupo. Para obter instruções sobre ambas as etapas, consulte Configurar os pré-requisitos do Amazon SageMaker. Você pode pular esta etapa se já tiver sua própria versão do SageMaker Studio em execução.

Complete o pré-requisitos para configurar o SageMaker Canvas e criar o modelo de sua escolha para seu caso de uso.

Compartilhe o modelo

O usuário do SageMaker Canvas compartilha o modelo com o usuário do SageMaker Studio registrando-o no SageMaker Model Registry, o que aciona um fluxo de trabalho de governança, ou baixando o notebook completo do SageMaker Canvas e fornecendo-o ao usuário do SageMaker Studio.

Registro de modelo do SageMaker

Para implantar usando o SageMaker Model Registry, conclua as seguintes etapas:

  1. Depois que um modelo for criado no SageMaker Canvas, escolha o menu de opções (três pontos verticais) e escolha Adicionar ao registro do modelo.
    adicionar ao registro do modelo
  2. Insira um nome para o grupo de modelos.
  3. Escolha Adicionar.
    nome do grupo de modelos

Agora você pode ver que o modelo está registrado.
modelo cadastrado

Você também pode ver que o modelo está com aprovação pendente.
aprovação pendente

Exportação de notebook SageMaker

Para implantar usando um notebook SageMaker, conclua as seguintes etapas:

  1. No menu de opções, escolha Ver bloco de notas.
    ver caderno
  2. Escolha Copiar S3 URI.
    s3 uri

Agora você pode compartilhar o URI do S3 com o usuário do SageMaker Studio.

Revise o modelo

O usuário do SageMaker Studio acessa o modelo compartilhado por meio do registro do modelo para revisar seus detalhes e métricas, ou pode importar o notebook exportado para o SageMaker Studio e usar notebooks Jupyter para validar completamente o código, a lógica e o desempenho do modelo.

Registro de modelo do SageMaker

Para usar o registro de modelo, conclua as etapas a seguir:

  1. No console do SageMaker Studio, escolha Modelos no painel de navegação.
  2. Escolha Modelos registrados.
  3. Escolha o seu modelo.
    registro de modelo

Você pode revisar os detalhes do modelo e ver se o status está pendente.
Status: Pendente

Você também pode revisar as diferentes métricas para verificar o desempenho do modelo.
revisar métricas

Você pode visualizar as métricas do modelo; no entanto, há visibilidade limitada no código e na arquitetura do modelo. Se desejar visibilidade completa do código e da arquitetura do modelo com a capacidade de personalizar e aprimorar o modelo, use a opção de exportação de notebook.

Exportação de notebook SageMaker

Para usar a opção de exportação de notebook como usuário do SageMaker Studio, conclua as etapas a seguir.

  1. Inicie o SageMaker Studio e escolha JupyterLabGenericName para Aplicações.
  2. Abra o espaço JupyterLab. Se você não tiver um espaço JupyterLab, poderá criar um.
    laboratório jupyter
  3. Abra um terminal e execute o seguinte comando para copiar o notebook do Amazon S3 para o SageMaker Studio (o número da conta no exemplo a seguir foi alterado para awsaccountnumber):
    sagemaker-user@default:~$ aws s3 cp s3://sagemaker-us-east-1-awsaccountnumber/Canvas/default-20240130t161835/Training/output/Canvas1707947728560/sagemaker-automl-candidates/notebooks/SageMakerAutopilotCandidateDefinitionNotebook.ipynb ./canvas.ipynb

    terminal

  4. Após o download do notebook, você poderá abri-lo e executá-lo para avaliar melhor.

testes de candidatos

Aprove o modelo

Após uma revisão abrangente, o usuário do SageMaker Studio pode tomar uma decisão informada para aprovar ou rejeitar o modelo no registro de modelos com base na avaliação de sua qualidade, precisão e adequação para o caso de uso pretendido.

Para usuários que registraram seu modelo por meio da UI do Canvas, siga as etapas abaixo para aprovar o modelo. Para usuários que exportaram o bloco de notas do modelo da UI do Canvas, você pode registrar e aprovar o modelo usando o registro de modelo do SageMaker, no entanto, essas etapas não são necessárias.

Registro de modelo do SageMaker

Como usuário do SageMaker Studio, quando estiver confortável com o modelo, você pode atualizar o status para aprovado. A aprovação acontece apenas no SageMaker Model Registry. Conclua as seguintes etapas:

  1. No SageMaker Studio, navegue até a versão do modelo.
  2. No menu de opções, escolha Atualizar o status e aprovado.
    atualização de status
  3. Insira um comentário opcional e escolha Salvar e atualizar.
    atualizar status do modelo

Agora você pode ver que o modelo está aprovado.
aprovou

Implantar o modelo

Quando o modelo estiver pronto para implantação (recebeu as revisões e aprovações necessárias), os usuários terão duas opções. Para usuários que adotaram a abordagem de registro de modelo, eles podem implantar a partir do SageMaker Studio ou do SageMaker Canvas. Para usuários que adotaram a abordagem de exportação de notebook modelo, eles podem implantar a partir do SageMaker Studio. Ambas as opções de implantação são detalhadas abaixo.

Implantar via SageMaker Studio

O usuário do SageMaker Studio pode implantar o modelo do espaço JupyterLab.
implantação de modelo

Após a implantação do modelo, você pode navegar até o console do SageMaker, escolher Pontos finais para Inferência no painel de navegação e visualize o modelo.
endpoints

Implantar via SageMaker Canvas

Como alternativa, se a implantação for feita pelo usuário do SageMaker Canvas, você poderá implantar o modelo do SageMaker Canvas.

implantação de tela

Depois que o modelo for implantado, você poderá navegar até o Pontos finais página no console do SageMaker para visualizar o modelo.
terminais implantados

limpar

Para evitar cobranças de sessões futuras, saia do SageMaker Canvas.

Para evitar cobranças contínuas, exclua os pontos de extremidade de inferência do SageMaker. Você pode excluir os endpoints por meio do console do SageMaker ou do bloco de anotações do SageMaker Studio usando os seguintes comandos:

predictor.delete_model()

predictor.delete_endpoint()

Conclusão

Anteriormente, você só podia compartilhar modelos no SageMaker Canvas (ou visualizar modelos compartilhados do SageMaker Canvas) no SageMaker Studio Classic. Nesta postagem, mostramos como compartilhar modelos construídos no SageMaker Canvas com o SageMaker Studio para que diferentes equipes possam colaborar e você possa passar de um caminho de implantação sem código para um caminho de implantação com alto código. Ao usar o SageMaker Model Registry ou exportar notebooks, especialistas e não especialistas em ML podem colaborar, revisar e aprimorar modelos nessas plataformas, permitindo um fluxo de trabalho tranquilo, desde a preparação de dados até a implantação de produção.

Para obter mais informações sobre colaboração em modelos usando o SageMaker Canvas, consulte Crie, compartilhe, implante: como analistas de negócios e cientistas de dados alcançam um time-to-market mais rápido usando ML sem código e Amazon SageMaker Canvas.


Sobre os autores

Rajakumar Sampathkumar é gerente técnico principal de contas na AWS, fornecendo orientação ao cliente sobre o alinhamento de tecnologia de negócios e apoiando a reinvenção de seus modelos e processos de operação em nuvem. Ele é apaixonado por nuvem e aprendizado de máquina. Raj também é especialista em machine learning e trabalha com clientes da AWS para projetar, implantar e gerenciar suas cargas de trabalho e arquiteturas da AWS.

Meenakshisundaram Thandavarayan trabalha para a AWS como especialista em IA/ML. Ele tem paixão por projetar, criar e promover experiências de análise e dados centradas no ser humano. Meena se concentra no desenvolvimento de sistemas sustentáveis ​​que oferecem vantagens competitivas mensuráveis ​​para clientes estratégicos da AWS. Meena é uma conectora e pensadora de design e se esforça para levar as empresas a novas formas de trabalhar por meio da inovação, incubação e democratização.

Claire O’Brien Rajkumar é gerente de produto sênior da equipe do Amazon SageMaker com foco no SageMaker Canvas, o espaço de trabalho sem código e low-code do SageMaker para ML e IA generativa. O SageMaker Canvas ajuda a democratizar o ML e a IA generativa, reduzindo as barreiras à adoção para aqueles que são novos no ML e acelerando os fluxos de trabalho para profissionais avançados.

local_img

Inteligência mais recente

local_img