Databricks lanza Dolly similar a ChatGPT, un clon que cualquier empresa puede tener

Únase a altos ejecutivos en San Francisco los días 11 y 12 de julio para conocer cómo los líderes están integrando y optimizando las inversiones en IA para lograr el éxito. Más información

¿Se ha convertido la plataforma Data Lakehouse Databricks en un rival de OpenAI en la tarjeta de bingo de 2023? Bueno, hola, Dolly.

Hoy, en un esfuerzo que la compañía dice tiene como objetivo desarrollar su misión de larga data de democratizar la IA para los negocios, Databricks lanzó el código para un modelo de lenguaje grande (LLM) de código abierto llamado Dolly, que lleva el nombre de la oveja Dolly, la primera clonada mamífero: que las empresas pueden usar para crear chatbots siguiendo instrucciones similares a ChatGPT.

El modelo se puede entrenar, explica la empresa en una entrada de blog, con muy pocos datos y en muy poco tiempo. "Con $30, un servidor y tres horas, podemos enseñarle a [Dolly] a comenzar a hacer interactividad a nivel humano", dijo el director ejecutivo de Databricks, Ali Ghodsi.

Hay muchas razones por las que una empresa preferiría crear su propio modelo LLM en lugar de enviar datos a un proveedor LLM centralizado que sirve un modelo patentado detrás de una API, explica la entrada del blog. Pasar datos confidenciales a un tercero puede no ser una opción, mientras que las organizaciones pueden tener necesidades específicas con respecto a la calidad del modelo, el costo y el comportamiento deseado.
Evento
Transformar 2023

Únase a nosotros en San Francisco los días 11 y 12 de julio, donde los altos ejecutivos hablarán sobre cómo han integrado y optimizado las inversiones en IA para lograr el éxito y cómo evitar errores comunes.
Regístrate ahora
"Creemos que, a largo plazo, la mayoría de los usuarios de ML obtienen mejores servicios si son propietarios directos de sus modelos", afirma la publicación del blog.
Databricks descubrió que las calificaciones similares a ChatGPT no requieren el último o mejor LLM
Según el anuncio, Databricks dijo que Dolly pretende demostrar que cualquiera "puede tomar un gran modelo de lenguaje estándar de código abierto y darle instrucciones mágicas similares a ChatGPT". Sorprendentemente, dice, seguir las instrucciones no parece requerir los últimos o mejores modelos: Dolly solo tiene 6 000 millones de parámetros, en comparación con los 175 000 millones de GPT-3.

"Nos llamamos a nosotros mismos una empresa de datos e inteligencia artificial desde 2013, y tenemos casi 1000 clientes que usan algún tipo de modelo de lenguaje grande en Databricks", dijo Ghodsi, quien le dijo a VentureBeat que estaba "impresionado" cuando ChatGPT se lanzó a fines de noviembre de 2022, pero se dio cuenta de que solo unas pocas empresas en el planeta tenían los modelos de lenguaje masivo necesarios para la capacidad de nivel de ChatGPT.

"La mayoría de la gente estaba pensando, ¿deberíamos todos aprovechar estos modelos patentados que muy pocas empresas tienen? Y si es así, ¿deberíamos darles nuestros datos?", dice.

La respuesta a ambas preguntas es no: en febrero, Meta lanzó los pesos de un conjunto de modelos de lenguaje de alta calidad (pero no instructivos) llamado LLaMA para investigadores académicos, capacitados durante más de 80 000 horas de GPU cada uno. . Luego, en marzo, Stanford construyó el modelo Alpaca, que fue...

Inauguración Mar 24, 2023 0 18 Add to Reading List

Databricks lanza Dolly similar a ChatGPT, un clon que cualquier empresa puede tener

Únase a altos ejecutivos en San Francisco los días 11 y 12 de julio para conocer cómo los líderes están integrando y optimizando las inversiones en IA para lograr el éxito. Más información

¿Se ha convertido la plataforma Data Lakehouse Databricks en un rival de OpenAI en la tarjeta de bingo de 2023? Bueno, hola, Dolly.

Hoy, en un esfuerzo que la compañía dice tiene como objetivo desarrollar su misión de larga data de democratizar la IA para los negocios, Databricks lanzó el código para un modelo de lenguaje grande (LLM) de código abierto llamado Dolly, que lleva el nombre de la oveja Dolly, la primera clonada mamífero: que las empresas pueden usar para crear chatbots siguiendo instrucciones similares a ChatGPT.

El modelo se puede entrenar, explica la empresa en una entrada de blog, con muy pocos datos y en muy poco tiempo. "Con $30, un servidor y tres horas, podemos enseñarle a [Dolly] a comenzar a hacer interactividad a nivel humano", dijo el director ejecutivo de Databricks, Ali Ghodsi.

Hay muchas razones por las que una empresa preferiría crear su propio modelo LLM en lugar de enviar datos a un proveedor LLM centralizado que sirve un modelo patentado detrás de una API, explica la entrada del blog. Pasar datos confidenciales a un tercero puede no ser una opción, mientras que las organizaciones pueden tener necesidades específicas con respecto a la calidad del modelo, el costo y el comportamiento deseado.

Evento

Transformar 2023

Únase a nosotros en San Francisco los días 11 y 12 de julio, donde los altos ejecutivos hablarán sobre cómo han integrado y optimizado las inversiones en IA para lograr el éxito y cómo evitar errores comunes.

Regístrate ahora

"Creemos que, a largo plazo, la mayoría de los usuarios de ML obtienen mejores servicios si son propietarios directos de sus modelos", afirma la publicación del blog.

Databricks descubrió que las calificaciones similares a ChatGPT no requieren el último o mejor LLM

Según el anuncio, Databricks dijo que Dolly pretende demostrar que cualquiera "puede tomar un gran modelo de lenguaje estándar de código abierto y darle instrucciones mágicas similares a ChatGPT". Sorprendentemente, dice, seguir las instrucciones no parece requerir los últimos o mejores modelos: Dolly solo tiene 6 000 millones de parámetros, en comparación con los 175 000 millones de GPT-3.

"Nos llamamos a nosotros mismos una empresa de datos e inteligencia artificial desde 2013, y tenemos casi 1000 clientes que usan algún tipo de modelo de lenguaje grande en Databricks", dijo Ghodsi, quien le dijo a VentureBeat que estaba "impresionado" cuando ChatGPT se lanzó a fines de noviembre de 2022, pero se dio cuenta de que solo unas pocas empresas en el planeta tenían los modelos de lenguaje masivo necesarios para la capacidad de nivel de ChatGPT.

"La mayoría de la gente estaba pensando, ¿deberíamos todos aprovechar estos modelos patentados que muy pocas empresas tienen? Y si es así, ¿deberíamos darles nuestros datos?", dice.

La respuesta a ambas preguntas es no: en febrero, Meta lanzó los pesos de un conjunto de modelos de lenguaje de alta calidad (pero no instructivos) llamado LLaMA para investigadores académicos, capacitados durante más de 80 000 horas de GPU cada uno. . Luego, en marzo, Stanford construyó el modelo Alpaca, que fue...