تتعامل Imagen من Google مع Meta Make-A-Video مع زيادة نماذج الذكاء الاصطناعي لتحويل النص إلى فيديو

تعرف على كيفية قيام مؤسستك بإنشاء تطبيقات لأتمتة المهام واكتساب الكفاءات باستخدام أدوات التعليمات البرمجية المنخفضة / بدون تعليمات برمجية يوم 9 نوفمبر في مؤتمر Virtual Low-Code / No-Code Summit. سجل هنا.

إنه موسم الذكاء الاصطناعي التوليدي (AI). في الأسبوع الماضي ، أعلنت Meta عن Make-A-Video ، وهو نظام ذكاء اصطناعي يسمح للمستخدمين بتحويل الرسائل النصية إلى مقاطع فيديو قصيرة وعالية الجودة وفريدة من نوعها. الآن جوجل ليست بعيدة عن الركب. يُظهر اتجاه تحويل النص إلى فيديو كل علامة على الاستعداد للانفجار ، تمامًا كما فعل تحويل النص إلى صورة العام الماضي مع DALL-E و MidJourney و Stable Diffusion.

يُعد Imagen Video من Google ، الذي تم الإعلان عنه بالأمس فقط ، نموذجًا توليفيًا للفيديو AI قادرًا على إنتاج فيديو عالي الدقة من موجه نصي. يمكن لنموذج تسليم الفيديو المكيّف للنص إخراج فيديو بدقة تصل إلى 1280 × 768 بمعدل 24 إطارًا في الثانية.

يوفر Imagen Video من Google دقة عالية

في مقالها المنشور مؤخرًا "فيديو Imagen: إنشاء فيديو عالي الدقة مع نماذج التسليم" ، تؤكد Google أن Imagen Video قادر على إنشاء فيديو بدقة عالية ولديه درجة عالية من التحكم والمعرفة بالعالم. تتضمن قدرات النموذج التوليدي إنشاء مقاطع فيديو نصية ورسوم متحركة متنوعة بأنماط فنية مختلفة ، وفهم ثلاثي الأبعاد ، وتقديم النص والرسوم المتحركة. النموذج في مرحلة البحث حاليًا ، لكن وصوله يأتي بعد خمسة أشهر فقط من إظهار Imagen للتطور السريع للنماذج القائمة على التوليف.

يتألف Imagen Video من برنامج تشفير نص (T5-XXL مجمد) ، ونموذج دفق فيديو أساسي ، ونماذج دفق فائقة الدقة مكانية وزمنية متداخلة. لإنشاء مثل هذه البنية ، تدعي Google أنها نقلت نتائج العمل السابق في إنشاء الصور القائمة على البث إلى معلمة إنشاء الفيديو. قام فريق البحث أيضًا بغرس التقطير التدريجي في نماذج الفيديو مع تلميحات خالية من المصنف لأخذ عينات سريعة وعالية الجودة. حدث

رأس منخفض / لا يوجد كود

انضم إلى كبار القادة اليوم في قمة Code Low / No-Code تقريبًا في 9 نوفمبر. اشترك للحصول على بطاقتك المجانية اليوم. سجل هنا سلسلة من سبعة نماذج توصيل فيديو فرعي

إن إطار عمل إنشاء الفيديو عبارة عن سلسلة من سبعة نماذج دفق فيديو فرعي تقوم بإنشاء فيديو مشروط للنص ، ودقة فائقة مكانية ، ودقة فائقة مؤقتة. مع الشلال بأكمله ، ينتج Imagen Video 1280 × 768 فيديو عالي الدقة بمعدل 24 إطارًا في الثانية لـ 128 إطارًا ، أو حوالي 126 مليون بكسل. باستخدام التقطير التدريجي ، يمكن لـ Imagen Video إنشاء فيديو عالي الجودة باستخدام ثماني مراحل دفق فقط لكل نموذج فرعي. يؤدي هذا إلى تسريع وقت إنشاء الفيديو بحوالي 18 مرة.

تتعامل Imagen من Google مع Meta Make-A-Video مع زيادة نماذج الذكاء الاصطناعي لتحويل النص إلى فيديو

تعرف على كيفية قيام مؤسستك بإنشاء تطبيقات لأتمتة المهام واكتساب الكفاءات باستخدام أدوات التعليمات البرمجية المنخفضة / بدون تعليمات برمجية يوم 9 نوفمبر في مؤتمر Virtual Low-Code / No-Code Summit. سجل هنا.

إنه موسم الذكاء الاصطناعي التوليدي (AI). في الأسبوع الماضي ، أعلنت Meta عن Make-A-Video ، وهو نظام ذكاء اصطناعي يسمح للمستخدمين بتحويل الرسائل النصية إلى مقاطع فيديو قصيرة وعالية الجودة وفريدة من نوعها. الآن جوجل ليست بعيدة عن الركب. يُظهر اتجاه تحويل النص إلى فيديو كل علامة على الاستعداد للانفجار ، تمامًا كما فعل تحويل النص إلى صورة العام الماضي مع DALL-E و MidJourney و Stable Diffusion.

يُعد Imagen Video من Google ، الذي تم الإعلان عنه بالأمس فقط ، نموذجًا توليفيًا للفيديو AI قادرًا على إنتاج فيديو عالي الدقة من موجه نصي. يمكن لنموذج تسليم الفيديو المكيّف للنص إخراج فيديو بدقة تصل إلى 1280 × 768 بمعدل 24 إطارًا في الثانية.

يوفر Imagen Video من Google دقة عالية

في مقالها المنشور مؤخرًا "فيديو Imagen: إنشاء فيديو عالي الدقة مع نماذج التسليم" ، تؤكد Google أن Imagen Video قادر على إنشاء فيديو بدقة عالية ولديه درجة عالية من التحكم والمعرفة بالعالم. تتضمن قدرات النموذج التوليدي إنشاء مقاطع فيديو نصية ورسوم متحركة متنوعة بأنماط فنية مختلفة ، وفهم ثلاثي الأبعاد ، وتقديم النص والرسوم المتحركة. النموذج في مرحلة البحث حاليًا ، لكن وصوله يأتي بعد خمسة أشهر فقط من إظهار Imagen للتطور السريع للنماذج القائمة على التوليف.

يتألف Imagen Video من برنامج تشفير نص (T5-XXL مجمد) ، ونموذج دفق فيديو أساسي ، ونماذج دفق فائقة الدقة مكانية وزمنية متداخلة. لإنشاء مثل هذه البنية ، تدعي Google أنها نقلت نتائج العمل السابق في إنشاء الصور القائمة على البث إلى معلمة إنشاء الفيديو. قام فريق البحث أيضًا بغرس التقطير التدريجي في نماذج الفيديو مع تلميحات خالية من المصنف لأخذ عينات سريعة وعالية الجودة. حدث

رأس منخفض / لا يوجد كود

انضم إلى كبار القادة اليوم في قمة Code Low / No-Code تقريبًا في 9 نوفمبر. اشترك للحصول على بطاقتك المجانية اليوم. سجل هنا سلسلة من سبعة نماذج توصيل فيديو فرعي

إن إطار عمل إنشاء الفيديو عبارة عن سلسلة من سبعة نماذج دفق فيديو فرعي تقوم بإنشاء فيديو مشروط للنص ، ودقة فائقة مكانية ، ودقة فائقة مؤقتة. مع الشلال بأكمله ، ينتج Imagen Video 1280 × 768 فيديو عالي الدقة بمعدل 24 إطارًا في الثانية لـ 128 إطارًا ، أو حوالي 126 مليون بكسل. باستخدام التقطير التدريجي ، يمكن لـ Imagen Video إنشاء فيديو عالي الجودة باستخدام ثماني مراحل دفق فقط لكل نموذج فرعي. يؤدي هذا إلى تسريع وقت إنشاء الفيديو بحوالي 18 مرة.

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow