Le nouveau Make-a-Video de Meta signale la prochaine évolution de l'IA générative

Vous n'avez pas pu assister à Transform 2022 ? Découvrez dès maintenant toutes les sessions du sommet dans notre bibliothèque à la demande ! Regardez ici.

Ce matin, le PDG de Meta, Mark Zuckerberg, a posté sur sa page Facebook pour annoncer Make-A-Video, un nouveau système d'IA qui permet aux utilisateurs de transformer des invites textuelles, comme "un ours en peluche peignant un autoportrait", en courts, hauts -des clips vidéo uniques et de qualité.

Cela ressemble-t-il à DALL-E ? C'est l'idée : selon un communiqué de presse, Make-A-Video s'appuie sur la technologie de génération d'images AI (y compris le travail Make-A-Scene de Meta du début de cette année) en « ajoutant une couche d'apprentissage non supervisé qui permet au système de comprendre le mouvement dans le monde physique et appliquez-le à la génération traditionnelle de texte en image. »

"C'est un progrès assez incroyable", a écrit Zuckerberg dans son article. "Il est beaucoup plus difficile de générer des vidéos que des photos, car en plus de générer correctement chaque pixel, le système doit également prédire leur évolution dans le temps."

Il est difficile de croire que cela ne fait qu'environ un an que le DALL-E original a été dévoilé en janvier 2021, alors que 2022 semble être l'année de la révolution du texte à l'image grâce au DALL-E 2, Midjourney , Stable Diffusion et d'autres grands modèles génératifs permettant aux utilisateurs de créer des images et des illustrations réalistes à partir d'invites de texte naturelles.

Événement

MétaBeat 2022

MetaBeat réunira des leaders d'opinion pour donner des conseils sur la manière dont la technologie métaverse transformera la façon dont toutes les industries communiquent et font des affaires le 4 octobre à San Francisco, en Californie.

Inscrivez-vous ici

Le nouveau Make-A-Video de Meta est-il le signe que la prochaine étape de l'IA générative, le text-to-video, est sur le point de se généraliser ? Compte tenu de la vitesse de l'évolution du texte à l'image cette année – Midjourney a même créé la controverse avec une image qui a remporté un concours d'art à la Colorado State Fair – cela semble certainement possible. Il y a quelques semaines, la société de logiciels de montage vidéo Runway a publié une vidéo promotionnelle présentant une nouvelle fonctionnalité de son éditeur vidéo basé sur l'IA, qui peut éditer une vidéo à partir de descriptions écrites.

Et la demande de générateurs de texte à vidéo au niveau des options de texte à image d'aujourd'hui est élevée, grâce au besoin de contenu vidéo dans tous canaux - de la publicité sur les réseaux sociaux et des blogs vidéo aux vidéos explicatives.

Meta, pour sa part, semble confiant, selon son article de recherche présentant Make-A-Video : "Dans tous les aspects, révolution spatiale et temporelle, fidélité au texte et qualité, nous présentons l'état de l'art résultats dans la génération de texte en vidéo, tel que déterminé par des mesures qualitatives et quantitatives. »

La mission de VentureBeat est d'être une place publique numérique permettant aux décideurs techniques d'acquérir des connaissances sur les technologies d'entreprise transformatrices et d'effectuer des transactions. Découvrez nos Briefings.

Le nouveau Make-a-Video de Meta signale la prochaine évolution de l'IA générative

Vous n'avez pas pu assister à Transform 2022 ? Découvrez dès maintenant toutes les sessions du sommet dans notre bibliothèque à la demande ! Regardez ici.

Ce matin, le PDG de Meta, Mark Zuckerberg, a posté sur sa page Facebook pour annoncer Make-A-Video, un nouveau système d'IA qui permet aux utilisateurs de transformer des invites textuelles, comme "un ours en peluche peignant un autoportrait", en courts, hauts -des clips vidéo uniques et de qualité.

Cela ressemble-t-il à DALL-E ? C'est l'idée : selon un communiqué de presse, Make-A-Video s'appuie sur la technologie de génération d'images AI (y compris le travail Make-A-Scene de Meta du début de cette année) en « ajoutant une couche d'apprentissage non supervisé qui permet au système de comprendre le mouvement dans le monde physique et appliquez-le à la génération traditionnelle de texte en image. »

"C'est un progrès assez incroyable", a écrit Zuckerberg dans son article. "Il est beaucoup plus difficile de générer des vidéos que des photos, car en plus de générer correctement chaque pixel, le système doit également prédire leur évolution dans le temps."

Il est difficile de croire que cela ne fait qu'environ un an que le DALL-E original a été dévoilé en janvier 2021, alors que 2022 semble être l'année de la révolution du texte à l'image grâce au DALL-E 2, Midjourney , Stable Diffusion et d'autres grands modèles génératifs permettant aux utilisateurs de créer des images et des illustrations réalistes à partir d'invites de texte naturelles.

Événement

MétaBeat 2022

MetaBeat réunira des leaders d'opinion pour donner des conseils sur la manière dont la technologie métaverse transformera la façon dont toutes les industries communiquent et font des affaires le 4 octobre à San Francisco, en Californie.

Inscrivez-vous ici

Le nouveau Make-A-Video de Meta est-il le signe que la prochaine étape de l'IA générative, le text-to-video, est sur le point de se généraliser ? Compte tenu de la vitesse de l'évolution du texte à l'image cette année – Midjourney a même créé la controverse avec une image qui a remporté un concours d'art à la Colorado State Fair – cela semble certainement possible. Il y a quelques semaines, la société de logiciels de montage vidéo Runway a publié une vidéo promotionnelle présentant une nouvelle fonctionnalité de son éditeur vidéo basé sur l'IA, qui peut éditer une vidéo à partir de descriptions écrites.

Et la demande de générateurs de texte à vidéo au niveau des options de texte à image d'aujourd'hui est élevée, grâce au besoin de contenu vidéo dans tous canaux - de la publicité sur les réseaux sociaux et des blogs vidéo aux vidéos explicatives.

Meta, pour sa part, semble confiant, selon son article de recherche présentant Make-A-Video : "Dans tous les aspects, révolution spatiale et temporelle, fidélité au texte et qualité, nous présentons l'état de l'art résultats dans la génération de texte en vidéo, tel que déterminé par des mesures qualitatives et quantitatives. »

La mission de VentureBeat est d'être une place publique numérique permettant aux décideurs techniques d'acquérir des connaissances sur les technologies d'entreprise transformatrices et d'effectuer des transactions. Découvrez nos Briefings.

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow