Inteligência de dados generativa

Tag: inferência

Apple supostamente desenvolvendo chips de IA para servidores

Análise Podemos adicionar a Apple à lista de titãs da tecnologia que desenvolvem seus próprios aceleradores de IA personalizados – pelo menos é o que fontes não identificadas...

Manchetes

Render Network – Um mercado de computação baseado em Blockchain para projetos gráficos e baseados em IA

O mundo da narrativa visual está constantemente ultrapassando os limites do que é possível. De animações 3D de tirar o fôlego a efeitos especiais cativantes e emocionantes...

AWS Inferentia e AWS Trainium oferecem menor custo para implantar modelos Llama 3 no Amazon SageMaker JumpStart | Amazon Web Services

Hoje, temos o prazer de anunciar a disponibilidade da inferência Meta Llama 3 em instâncias baseadas em AWS Trainium e AWS Inferentia no Amazon SageMaker JumpStart....

Amazon Personalize lança novas receitas que suportam catálogos de itens maiores com menor latência | Amazon Web Services

Experiências personalizadas do cliente são essenciais para envolver os usuários de hoje. No entanto, oferecer experiências verdadeiramente personalizadas que se adaptem às mudanças no comportamento do usuário pode ser tanto...

Comece a usar o Amazon Titan Text Embeddings V2: um novo modelo de embeddings de última geração no Amazon Bedrock | Amazon Web Services

Os embeddings são essenciais para vários aplicativos de processamento de linguagem natural (PNL) e sua qualidade é crucial para um desempenho ideal. Eles são comumente usados ​​no conhecimento...

Guia simples para treinar Llama 2 com AWS Trainium no Amazon SageMaker | Amazon Web Services

Os grandes modelos de linguagem (LLMs) estão causando um impacto significativo no domínio da inteligência artificial (IA). Suas impressionantes habilidades generativas levaram à difusão generalizada...

Automatize chatbot para recuperação de documentos e dados usando agentes e bases de conhecimento para Amazon Bedrock | Amazon Web Services

Inúmeros clientes enfrentam desafios no gerenciamento de diversas fontes de dados e buscam uma solução de chatbot capaz de orquestrar essas fontes para oferecer respostas abrangentes. Esse...

Intel e Ampere mostram LLMs em CPUs não é tão maluco quanto parece

Chatbots e serviços de IA generativos populares, como ChatGPT ou Gemini, são executados principalmente em GPUs ou outros aceleradores dedicados, mas como modelos menores são mais...

Como as grandes tendências da computação estão moldando a ciência – Parte Dois » CCC Blog

O CCC apoiou três sessões científicas na Conferência Anual da AAAS deste ano e, caso você não tenha podido comparecer pessoalmente, estamos recapitulando...

Desenvolva e treine modelos grandes de maneira econômica com Metaflow e AWS Trainium | Amazon Web Services

Este é um post convidado em coautoria com Ville Tuulos (cofundador e CEO) e Eddie Mattia (cientista de dados) da Outerbounds. ...

Cohere Command R e R+ agora estão disponíveis no Amazon SageMaker JumpStart | Amazon Web Services

Esta postagem do blog foi co-escrita com Pradeep Prabhakaran de Cohere. Hoje temos o prazer de anunciar que...

Databricks DBRX já está disponível no Amazon SageMaker JumpStart | Amazon Web Services

Hoje, temos o prazer de anunciar que o modelo DBRX, um modelo de linguagem grande (LLM) aberto e de uso geral desenvolvido pela Databricks, está disponível para clientes...

Implantar um modelo de diarização de alto-falante Hugging Face (PyAnnote) no Amazon SageMaker como um endpoint assíncrono | Amazon Web Services

A diarização do locutor, um processo essencial na análise de áudio, segmenta um arquivo de áudio com base na identidade do locutor. Esta postagem investiga a integração do PyAnnote do Hugging Face...

Inteligência mais recente

local_img
local_img
local_img