Inteligencia de datos generativa

Databricks afirma que su LLM de código abierto supera a GPT-3.5

Fecha:

La plataforma de análisis Databricks ha lanzado un modelo de lenguaje grande fundamental de código abierto, con la esperanza de que las empresas opten por utilizar sus herramientas para subirse al carro de LLM.

El negocio, fundado en torno a Apache Spark, publicó una serie de puntos de referencia que afirmaban que su LLM de propósito general, denominado DBRX, venció a sus rivales de código abierto en comprensión de lenguajes, programación y matemáticas. El desarrollador también afirmó que superó al GPT-3.5 patentado de OpenAI en las mismas medidas.

DBRX fue desarrollado por Mosaic AI, que Ladrillos de datos adquiridos por 1.3 millones de dólares y se formó en Nvidia DGX Cloud. Databricks afirma que optimizó DBRX para lograr eficiencia con lo que llama una arquitectura de mezcla de expertos (MoE), donde múltiples redes de expertos o estudiantes dividen un problema.

Databricks explicó que el modelo posee 132 mil millones de parámetros, pero solo 36 mil millones están activos en cada entrada.

Joel Minnick, vicepresidente de marketing de Databricks, dijo El registro: “Esa es una razón importante por la que el modelo puede funcionar con tanta eficiencia, pero también funciona increíblemente rápido. En términos prácticos, si utiliza algún tipo de chatbot importante que existe hoy en día, probablemente esté acostumbrado a esperar y ver cómo se genera la respuesta. Con DBRX es casi instantáneo”.

Pero el rendimiento del modelo en sí no es el objetivo de Databricks. Después de todo, el negocio es hacer que DBRX esté disponible para gratis en GitHub y Abrazando la cara.

Databricks espera que los clientes utilicen el modelo como base para sus propios LLM. Si eso sucede, podría mejorar los chatbots de los clientes o la respuesta a preguntas internas, al mismo tiempo que muestra cómo se creó DBRX utilizando las herramientas patentadas de Databricks.

Databricks reunió el conjunto de datos a partir del cual se desarrolló DBRX utilizando cuadernos Apache Spark y Databricks para el procesamiento de datos, Unity Catalog para la gestión y gobernanza de datos y MLflow para el seguimiento de experimentos.

Minnick reveló que la inversión empresarial en LLM se retrasó por temores sobre la propiedad y la gobernanza de terceros. "Tener que transferir datos a terceros, no tener propiedad sobre los pesos del modelo, no poder controlar completamente la gobernanza de los datos de un extremo a otro, son cosas que los ralentizan", explicó.

"Lo que nos propusimos construir fue un modelo extremadamente eficiente... que las empresas pueden utilizar para implementar sus propias aplicaciones para sus propios casos de uso específicos".

Hyoun Park, director ejecutivo y analista jefe de Amalgam Insights, observó que la importancia de DBRX es que Databricks puede mostrar cómo se construyó el modelo, paso a paso, como un proceso que otras empresas pueden seguir y ajustar.

"Esa combinación de linaje, visibilidad, repetibilidad y propiedad del modelo en el ajuste, las pruebas y la operacionalización del modelo de un extremo a otro es importante".

Park señaló que tenía entendido que Databricks ya había creado más de 50,000 modelos personalizados para clientes. "Es esa combinación de experiencia en la creación de modelos y la capacidad de hacerlo a escala con un modelo de alto rendimiento a la par de los mejores esfuerzos privados y de código abierto lo que hace que este anuncio sea notable para mí desde una perspectiva de TI empresarial".

Las noticias de DBRX se desarrollan en un contexto competitivo cambiante para Databricks. El negocio tiene una asociación estratégica a largo plazo con Microsoft, que resultó en Azure Databricks, donde a los usuarios se les prometen servicios de datos integrados estrechamente vinculados a la plataforma en la nube del gigante de Redmond.

Pero desde que se lanzó la oferta en 2017, Microsoft se ha trasladado al mercado de lagos de Databricks, donde a los usuarios se les ofrece almacenamiento de datos y lagos de datos en un solo entorno, y promete a los usuarios LLM de nivel empresarial con son 10 mil millones de dólares Asociación OpenAI. En su entorno Fabric, Microsoft también puede ofrecer “duplicación” de sus sistemas de bases de datos transaccionales Azure Cosmos DB y Azure SQL DB, ofreciendo acceso a servicios de análisis sin mover datos.

Una pregunta abierta que se cierne sobre las estrategias tanto de Databricks como de Microsoft es cuándo llegará la avalancha de inversiones esperadas en tecnologías LLM. En Enero, Gartner predijo El gasto empresarial en tecnología no se producirá este año y tendría poco impacto en otras inversiones en TI. ®

punto_img

Información más reciente

punto_img

Habla con nosotros!

¡Hola! ¿Le puedo ayudar en algo?