Cómo los modelos de difusión abren nuevas posibilidades para la creatividad generativa

Regístrese ahora para obtener su pase virtual gratuito para la Cumbre Low-Code/No-Code del 9 de noviembre. Escuche a los líderes de Service Now, Credit Karma, Stitch Fix, Appian y más. Obtenga más información.

Los modelos de inteligencia artificial (IA) generativa continúan creciendo en popularidad y reconocimiento. Los avances recientes en tecnología y su éxito en la generación de imágenes han despertado una ola de interés entre las empresas de tecnología y los profesionales del aprendizaje automático (ML), que ahora adoptan regularmente modelos de IA generativos para múltiples casos de uso empresarial.

La aparición de arquitecturas de conversión de texto está impulsando aún más esta adopción, con modelos generativos de IA como Imagen Video de Google, Make-A-Video de Meta y otros como DALL-E, MidJourney y Stable Spread.

Un denominador común de todas las arquitecturas de IA generativa es el uso de un método conocido como modelo de difusión, que se inspira en el proceso físico de difusión de moléculas de gas, donde las moléculas difunden áreas de alta densidad a áreas de baja densidad.

Al igual que el proceso científico, el modelo comienza recopilando ruido aleatorio de los datos de entrada proporcionados, que se resta en una serie de pasos que crean una imagen estéticamente agradable e idealmente consistente. Al guiar la eliminación de ruido de una manera que promueva la conformidad con un mensaje de texto, los modelos de transmisión pueden crear imágenes con mayor fidelidad.
Evento
Vértice de código bajo/sin código

Únase a los principales líderes de hoy en Low-Code/No-Code Summit virtualmente el 9 de noviembre. Regístrese para obtener su pase gratis hoy.
registrarse aquí
Para la implementación de IA generativa, el uso de modelos de difusión se ha hecho evidente recientemente, mostrando signos de reemplazar métodos anteriores como las redes antagónicas generativas (GAN) y los transformadores en el campo de la síntesis de imágenes condicionales, porque los modelos de difusión pueden producir estados. Los estados de imagen de última generación mantienen la calidad y la estructura semántica de los datos y no se ven afectados por los inconvenientes de capacitación, como el colapso de la moda.
Un nuevo método de síntesis basado en IA
Uno de los avances recientes en visión artificial y aprendizaje automático ha sido la invención de las GAN, que son modelos de IA de dos partes que consisten en un generador que crea muestras y un discriminador que intenta diferenciar entre muestras generadas y muestras del mundo real. Este método se convirtió en un trampolín para un nuevo campo conocido como modelado generativo. Sin embargo, después de pasar por una fase de auge, las GAN comenzaron a estabilizarse, ya que la mayoría de los métodos luchaban por resolver los cuellos de botella encontrados por las técnicas antagónicas, un método de aprendizaje supervisado de fuerza bruta en el que se alimentan tantos ejemplos como sea posible para entrenar el modelo.

Las GAN funcionan bien para varias aplicaciones, pero son difíciles de entrenar y su salida carece de diversidad. Por ejemplo, las GAN a menudo sufren de formación inestable y colapso de modo, un problema en el que el generador puede aprender a producir una única salida que parece más plausible, mientras que los modelos autorregresivos suelen sufrir de una velocidad de síntesis lenta.

Sobre la base de estos retrasos, la técnica del modelo de difusión evolucionó a partir de la estimación de probabilidad probabilística, un método para estimar el resultado de un modelo estadístico a través de observaciones de datos, mediante la búsqueda de valores de parámetros que maximicen la probabilidad de realizar la predicción.

Los modelos de difusión son modelos generativos (un...

Negocio Oct 27, 2022 0 33 Add to Reading List

Cómo los modelos de difusión abren nuevas posibilidades para la creatividad generativa

Regístrese ahora para obtener su pase virtual gratuito para la Cumbre Low-Code/No-Code del 9 de noviembre. Escuche a los líderes de Service Now, Credit Karma, Stitch Fix, Appian y más. Obtenga más información.

Los modelos de inteligencia artificial (IA) generativa continúan creciendo en popularidad y reconocimiento. Los avances recientes en tecnología y su éxito en la generación de imágenes han despertado una ola de interés entre las empresas de tecnología y los profesionales del aprendizaje automático (ML), que ahora adoptan regularmente modelos de IA generativos para múltiples casos de uso empresarial.

La aparición de arquitecturas de conversión de texto está impulsando aún más esta adopción, con modelos generativos de IA como Imagen Video de Google, Make-A-Video de Meta y otros como DALL-E, MidJourney y Stable Spread.

Un denominador común de todas las arquitecturas de IA generativa es el uso de un método conocido como modelo de difusión, que se inspira en el proceso físico de difusión de moléculas de gas, donde las moléculas difunden áreas de alta densidad a áreas de baja densidad.

Al igual que el proceso científico, el modelo comienza recopilando ruido aleatorio de los datos de entrada proporcionados, que se resta en una serie de pasos que crean una imagen estéticamente agradable e idealmente consistente. Al guiar la eliminación de ruido de una manera que promueva la conformidad con un mensaje de texto, los modelos de transmisión pueden crear imágenes con mayor fidelidad.

Evento

Vértice de código bajo/sin código

Únase a los principales líderes de hoy en Low-Code/No-Code Summit virtualmente el 9 de noviembre. Regístrese para obtener su pase gratis hoy.

registrarse aquí

Para la implementación de IA generativa, el uso de modelos de difusión se ha hecho evidente recientemente, mostrando signos de reemplazar métodos anteriores como las redes antagónicas generativas (GAN) y los transformadores en el campo de la síntesis de imágenes condicionales, porque los modelos de difusión pueden producir estados. Los estados de imagen de última generación mantienen la calidad y la estructura semántica de los datos y no se ven afectados por los inconvenientes de capacitación, como el colapso de la moda.

Un nuevo método de síntesis basado en IA

Uno de los avances recientes en visión artificial y aprendizaje automático ha sido la invención de las GAN, que son modelos de IA de dos partes que consisten en un generador que crea muestras y un discriminador que intenta diferenciar entre muestras generadas y muestras del mundo real. Este método se convirtió en un trampolín para un nuevo campo conocido como modelado generativo. Sin embargo, después de pasar por una fase de auge, las GAN comenzaron a estabilizarse, ya que la mayoría de los métodos luchaban por resolver los cuellos de botella encontrados por las técnicas antagónicas, un método de aprendizaje supervisado de fuerza bruta en el que se alimentan tantos ejemplos como sea posible para entrenar el modelo.

Las GAN funcionan bien para varias aplicaciones, pero son difíciles de entrenar y su salida carece de diversidad. Por ejemplo, las GAN a menudo sufren de formación inestable y colapso de modo, un problema en el que el generador puede aprender a producir una única salida que parece más plausible, mientras que los modelos autorregresivos suelen sufrir de una velocidad de síntesis lenta.

Sobre la base de estos retrasos, la técnica del modelo de difusión evolucionó a partir de la estimación de probabilidad probabilística, un método para estimar el resultado de un modelo estadístico a través de observaciones de datos, mediante la búsqueda de valores de parámetros que maximicen la probabilidad de realizar la predicción.

Los modelos de difusión son modelos generativos (un...