Inteligência de dados generativa

Databricks afirma que seu LLM de código aberto supera o GPT-3.5

Data:

A plataforma analítica Databricks lançou um grande modelo de linguagem fundamental de código aberto, esperando que as empresas optem por usar suas ferramentas para entrar no movimento LLM.

A empresa, fundada em torno do Apache Spark, publicou uma série de benchmarks afirmando que seu LLM de uso geral – apelidado de DBRX – superou os rivais de código aberto em compreensão de linguagem, programação e matemática. O desenvolvedor também afirmou que superou o GPT-3.5 proprietário da OpenAI nas mesmas medidas.

DBRX foi desenvolvido pela Mosaic AI, que Blocos de dados adquiridos por US$ 1.3 bilhão e treinado na Nvidia DGX Cloud. A Databricks afirma que otimizou o DBRX para eficiência com o que chama de arquitetura de mistura de especialistas (MoE) – onde várias redes de especialistas ou alunos dividem um problema.

Databricks explicou que o modelo possui 132 bilhões de parâmetros, mas apenas 36 bilhões estão ativos em qualquer entrada.

Joel Minnick, vice-presidente de marketing da Databricks, disse O registro: “Esse é um grande motivo pelo qual o modelo é capaz de funcionar com a mesma eficiência, mas também funciona extremamente rápido. Em termos práticos, se você usa qualquer tipo de chatbot importante que existe hoje, provavelmente está acostumado a esperar e observar a resposta ser gerada. Com o DBRX é quase instantâneo.”

Mas o desempenho do modelo em si não é o objetivo do Databricks. Afinal, o negócio é disponibilizar o DBRX para grátis no GitHub e Abraçando o rosto.

A Databricks espera que os clientes usem o modelo como base para seus próprios LLMs. Se isso acontecer, poderá melhorar os chatbots dos clientes ou as respostas a perguntas internas, ao mesmo tempo que mostra como o DBRX foi construído usando as ferramentas proprietárias do Databricks.

A Databricks reuniu o conjunto de dados a partir do qual o DBRX foi desenvolvido usando os notebooks Apache Spark e Databricks para processamento de dados, Unity Catalog para gerenciamento e governança de dados e MLflow para rastreamento de experimentos.

Minnick revelou que o investimento empresarial em LLMs foi adiado por receios sobre a propriedade e governação de terceiros. “Ter que transferir dados para terceiros, não ter propriedade sobre os pesos do modelo, não ser capaz de controlar totalmente a governação dos dados de ponta a ponta – estas são coisas que os atrasam”, explicou ele.

“O que pretendemos construir foi um modelo extremamente eficiente… que as empresas podem usar para levar para seus próprios aplicativos para seus próprios casos de uso específicos.”

Hyoun Park, CEO e analista-chefe da Amalgam Insights, observou que a importância do DBRX é que o Databricks pode mostrar como o modelo foi construído, passo a passo, como um processo para outras empresas seguirem e ajustarem.

“Essa combinação de linhagem, visibilidade, repetibilidade e propriedade do modelo no ajuste, teste e operacionalização de modelo de ponta a ponta é importante.”

Park observou que entendia que a Databricks já havia construído mais de 50,000 modelos personalizados para clientes. “É essa combinação de experiência de construção de modelos e a capacidade de fazê-lo em escala com um modelo de alto desempenho, a par dos melhores esforços privados e de código aberto, que torna este anúncio notável para mim do ponto de vista de TI empresarial.”

As notícias do DBRX se desenrolam em um cenário competitivo em mudança para o Databricks. A empresa tem uma parceria estratégica de longo prazo com a Microsoft, que resultou no Azure Databricks – onde os usuários recebem a promessa de serviços de dados integrados intimamente ligados à plataforma de nuvem da gigante de Redmond.

Mas desde a oferta lançada em 2017, a Microsoft entrou no mercado de lakehouse do Databricks – onde os usuários recebem armazenamento de dados e data lakes em um ambiente – e promete aos usuários LLMs de nível empresarial com são US$ 10 bilhões Parceria OpenAI. Em seu ambiente Fabric, A Microsoft também pode oferecer “espelhamento” de seus sistemas de banco de dados transacionais Azure Cosmos DB e Azure SQL DB, oferecendo acesso a serviços de análise sem mover dados.

Uma questão em aberto que paira sobre as estratégias da Databricks e da Microsoft é quando chegará a enxurrada de investimentos esperados em tecnologias LLM. Em janeiro, Gartner previsto os gastos empresariais com tecnologia não ocorrerão este ano e terão pouco impacto em outros investimentos em TI. ®

local_img

Inteligência mais recente

local_img

Fale Conosco

Olá! Como posso ajudá-lo?