تتيح لك D-ID ، الشركة التي تقف وراء Deep Nostalgia ، إنشاء مقاطع فيديو تم إنشاؤها بواسطة AI من صورة واحدة

تطلق شركة D-ID الإسرائيلية للذكاء الاصطناعي ، والتي وفرت التكنولوجيا لمشاريع مثل Deep Nostalgia ، نظامًا أساسيًا جديدًا حيث يمكن للمستخدمين تحميل صورة واحدة ونص لإنشاء مقطع فيديو. من خلال هذا الموقع الجديد المسمى Creative Reality Studio ، تستهدف الشركة قطاعات مثل تدريب الشركات والتعليم واتصالات الشركات الداخلية والخارجية والتسويق ومبيعات المنتجات.

النظام الأساسي سهل الاستخدام للغاية: يمكن للمستخدمين تحميل صورة لمقدم أو تحديد صورة من المقدمين الذين تم إنشاؤهم مسبقًا لبدء عملية إنشاء الفيديو. يمكن للمستخدمين المدفوعين الوصول إلى مقدمي العروض المتميزين الأكثر "تعبيراً" لأن لديهم تعابير وجه وحركات يد أفضل من تلك الافتراضية. بعد ذلك ، يمكن للمستخدمين إما إدخال نص البرنامج النصي أو ببساطة تحميل مقطع صوتي لخطاب شخص ما. يمكن للمستخدمين بعد ذلك تحديد لغة (النظام الأساسي يدعم 119 لغة) ، والصوت ، وأنماط مثل سعيد ، حزين ، متحمس ، وودود.

ستنشئ الخوارزميات القائمة على الذكاء الاصطناعي للشركة مقطع فيديو بناءً على هذه المعلمات. يمكن للمستخدمين بعد ذلك توزيع الفيديو في أي مكان. تدعي الشركة أن الخوارزمية لا تستغرق سوى نصف طول الفيديو لإنشاء مقطع ، ولكن في اختباراتنا استغرق الأمر بضع دقائق لإنشاء مقطع فيديو مدته دقيقة واحدة. قد يتغير هذا بناءً على نوع مقدم العرض واللغة التي حددتها.

"لقد أدى وباء COVID-19 إلى تسريع الحاجة إلى المحتوى الرقمي في جميع أنحاء العالم. هناك مشكلة كبيرة بالنسبة للمؤسسات تتمثل في إنشاء محتوى تعليمي. ويمكن أن تكون قراءة المستندات والاطلاع على العروض التقديمية جافة ومملة. بالإضافة إلى ذلك ، يتعين عليهم إنفاق الآلاف من قال جيل بيري ، الرئيس التنفيذي لشركة D-ID ، لـ TechCrunch في مقابلة:

أبرز بيري العديد من حالات استخدام هذه التقنية ، بدءًا من رسالة متعددة اللغات من الرئيس التنفيذي إلى الموظفين إلى التحيات المخصصة للمستخدمين في المؤسسة.

أطلق D-ID الاستوديو للاختبار في منتصف أغسطس لحل الأخطاء قبل الإطلاق العام. وبينما ينصب تركيزها الأساسي على تلبية احتياجات الشركات من جميع الأحجام ، إلا أن الشركة تجتذب اهتمامًا كبيرًا من المبدعين على المنصة.

يعد إنشاء مقاطع فيديو مسيئة عن طريق التزييف العميق مخاطرة. ولهذا وضعت الشركة الإسرائيلية ضمانات مثل تصفية الكلمات البذيئة والملاحظات العنصرية ، وكذلك التعرف على الصور لتجنب استخدام وجوه المشاهير. يستخدم Microsoft Azure Text Moderation API للتخلص من الملاحظات الجنسية واللغة المسيئة في نصوص الفيديو. قالت D-ID إن شروط خدمة المنصة تمنع المستخدمين من إنشاء مقاطع فيديو سياسية. في حالة انتهاك أي من هذه القواعد ، يجوز للشركة تعليق حساب المخالف وإزالة الفيديو الخاص به من المكتبة.

جمعت D-ID 25 مليون دولار في تمويلها من الفئة ب بقيادة Macquarie Capital في مارس الماضي ، بإجمالي 47 مليون دولار تم جمعها حتى الآن. حتى الآن ، اعتمدت الشركة على الآخرين الذين يستخدمون واجهة برمجة التطبيقات الخاصة بها لإنشاء محتوى - يعتبر Deep Nostalgia مثالًا رئيسيًا - مع عملاء مثل Modelez و Warner Bros. و Josh ، وهو تطبيق فيديو قصير مقره الهند. اليوم ، تعمل الشركة على توسيع منتجاتها المربحة من خلال إطلاق مكون إضافي لبرنامج PowerPoint باستخدام منصة الخدمة الذاتية هذه. يضيف المكون الإضافي مقدمًا تفاعليًا إلى النظام الأساسي ، بحيث لا يضطر المستخدمون فقط إلى قراءة الشرائح. يمكنهم الاختيار بين الصور الرمزية والأصوات واللغات المختلفة ، تمامًا مثل منصة الخدمة الذاتية. ولكن ليس هناك شرط أن يكون لديك مقدم مخصص في الوقت الحالي.

عند الإطلاق ، سيتمكن المستخدمون من التسجيل للحصول على حساب تجريبي مجاني لمدة 14 يومًا وإنشاء ما يصل إلى خمس دقائق من فيديو 720 بكسل تم إنشاؤه بواسطة AI. بعد ذلك ، يمكنهم دفع 49 دولارًا شهريًا للوصول إلى 15 دقيقة من الفيديو عالي الدقة الذي تم إنشاؤه بواسطة الذكاء الاصطناعي ومكوّن PowerPoint الإضافي ودعم البريد الإلكتروني.

تتيح لك D-ID ، الشركة التي تقف وراء Deep Nostalgia ، إنشاء مقاطع فيديو تم إنشاؤها بواسطة AI من صورة واحدة

تطلق شركة D-ID الإسرائيلية للذكاء الاصطناعي ، والتي وفرت التكنولوجيا لمشاريع مثل Deep Nostalgia ، نظامًا أساسيًا جديدًا حيث يمكن للمستخدمين تحميل صورة واحدة ونص لإنشاء مقطع فيديو. من خلال هذا الموقع الجديد المسمى Creative Reality Studio ، تستهدف الشركة قطاعات مثل تدريب الشركات والتعليم واتصالات الشركات الداخلية والخارجية والتسويق ومبيعات المنتجات.

النظام الأساسي سهل الاستخدام للغاية: يمكن للمستخدمين تحميل صورة لمقدم أو تحديد صورة من المقدمين الذين تم إنشاؤهم مسبقًا لبدء عملية إنشاء الفيديو. يمكن للمستخدمين المدفوعين الوصول إلى مقدمي العروض المتميزين الأكثر "تعبيراً" لأن لديهم تعابير وجه وحركات يد أفضل من تلك الافتراضية. بعد ذلك ، يمكن للمستخدمين إما إدخال نص البرنامج النصي أو ببساطة تحميل مقطع صوتي لخطاب شخص ما. يمكن للمستخدمين بعد ذلك تحديد لغة (النظام الأساسي يدعم 119 لغة) ، والصوت ، وأنماط مثل سعيد ، حزين ، متحمس ، وودود.

ستنشئ الخوارزميات القائمة على الذكاء الاصطناعي للشركة مقطع فيديو بناءً على هذه المعلمات. يمكن للمستخدمين بعد ذلك توزيع الفيديو في أي مكان. تدعي الشركة أن الخوارزمية لا تستغرق سوى نصف طول الفيديو لإنشاء مقطع ، ولكن في اختباراتنا استغرق الأمر بضع دقائق لإنشاء مقطع فيديو مدته دقيقة واحدة. قد يتغير هذا بناءً على نوع مقدم العرض واللغة التي حددتها.

"لقد أدى وباء COVID-19 إلى تسريع الحاجة إلى المحتوى الرقمي في جميع أنحاء العالم. هناك مشكلة كبيرة بالنسبة للمؤسسات تتمثل في إنشاء محتوى تعليمي. ويمكن أن تكون قراءة المستندات والاطلاع على العروض التقديمية جافة ومملة. بالإضافة إلى ذلك ، يتعين عليهم إنفاق الآلاف من قال جيل بيري ، الرئيس التنفيذي لشركة D-ID ، لـ TechCrunch في مقابلة:

أبرز بيري العديد من حالات استخدام هذه التقنية ، بدءًا من رسالة متعددة اللغات من الرئيس التنفيذي إلى الموظفين إلى التحيات المخصصة للمستخدمين في المؤسسة.

أطلق D-ID الاستوديو للاختبار في منتصف أغسطس لحل الأخطاء قبل الإطلاق العام. وبينما ينصب تركيزها الأساسي على تلبية احتياجات الشركات من جميع الأحجام ، إلا أن الشركة تجتذب اهتمامًا كبيرًا من المبدعين على المنصة.

يعد إنشاء مقاطع فيديو مسيئة عن طريق التزييف العميق مخاطرة. ولهذا وضعت الشركة الإسرائيلية ضمانات مثل تصفية الكلمات البذيئة والملاحظات العنصرية ، وكذلك التعرف على الصور لتجنب استخدام وجوه المشاهير. يستخدم Microsoft Azure Text Moderation API للتخلص من الملاحظات الجنسية واللغة المسيئة في نصوص الفيديو. قالت D-ID إن شروط خدمة المنصة تمنع المستخدمين من إنشاء مقاطع فيديو سياسية. في حالة انتهاك أي من هذه القواعد ، يجوز للشركة تعليق حساب المخالف وإزالة الفيديو الخاص به من المكتبة.

جمعت D-ID 25 مليون دولار في تمويلها من الفئة ب بقيادة Macquarie Capital في مارس الماضي ، بإجمالي 47 مليون دولار تم جمعها حتى الآن. حتى الآن ، اعتمدت الشركة على الآخرين الذين يستخدمون واجهة برمجة التطبيقات الخاصة بها لإنشاء محتوى - يعتبر Deep Nostalgia مثالًا رئيسيًا - مع عملاء مثل Modelez و Warner Bros. و Josh ، وهو تطبيق فيديو قصير مقره الهند. اليوم ، تعمل الشركة على توسيع منتجاتها المربحة من خلال إطلاق مكون إضافي لبرنامج PowerPoint باستخدام منصة الخدمة الذاتية هذه. يضيف المكون الإضافي مقدمًا تفاعليًا إلى النظام الأساسي ، بحيث لا يضطر المستخدمون فقط إلى قراءة الشرائح. يمكنهم الاختيار بين الصور الرمزية والأصوات واللغات المختلفة ، تمامًا مثل منصة الخدمة الذاتية. ولكن ليس هناك شرط أن يكون لديك مقدم مخصص في الوقت الحالي.

عند الإطلاق ، سيتمكن المستخدمون من التسجيل للحصول على حساب تجريبي مجاني لمدة 14 يومًا وإنشاء ما يصل إلى خمس دقائق من فيديو 720 بكسل تم إنشاؤه بواسطة AI. بعد ذلك ، يمكنهم دفع 49 دولارًا شهريًا للوصول إلى 15 دقيقة من الفيديو عالي الدقة الذي تم إنشاؤه بواسطة الذكاء الاصطناعي ومكوّن PowerPoint الإضافي ودعم البريد الإلكتروني.

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow