عين الذكاء الاصطناعي: قضية تفكيك محتوى الذكاء الاصطناعي ، خيوط الخسارة لبيانات الذكاء الاصطناعي؟

ChatGPT يأكل أكلة لحوم البشر

بدأ ضجيج ChatGPT في التلاشي ، حيث انخفضت عمليات البحث في Google عن "ChatGPT" بنسبة 40٪ عن ذروتها في أبريل ، بينما انخفضت حركة مرور الويب إلى موقع ChatGPT التابع لـ OpenAI بنحو 10٪ في الشهر الماضي.

هذا متوقع فقط ؛ ومع ذلك ، أبلغ مستخدمو GPT-4 أيضًا أن النموذج يبدو غبيًا إلى حد كبير (ولكن أسرع) مما كان عليه من قبل.

تقول إحدى النظريات أن OpenAI قسمتها إلى عدة نماذج أصغر مدربة في مجالات محددة يمكنها العمل جنبًا إلى جنب ، ولكن ليس على المستوى نفسه تمامًا.

AI tweet

ولكن هناك إمكانية أكثر إثارة للاهتمام تلعب أيضًا دورًا: أكل لحوم البشر باستخدام الذكاء الاصطناعي.

تمتلئ الويب الآن بالنصوص والصور ، ويتم استخراج هذه البيانات التركيبية كبيانات لتدريب الذكاء الاصطناعي ، مما يتسبب في حدوث حلقة من التعليقات السلبية. كلما زاد عدد بيانات الذكاء الاصطناعي التي يستوعبها النموذج ، كان الناتج أسوأ من حيث الاتساق والجودة. إنه يشبه إلى حد ما ما يحدث عندما تقوم بعمل نسخة من نسخة ضوئية ، وتتدهور الصورة تدريجيًا.

بينما تنتهي بيانات تدريب GPT-4 الرسمية في سبتمبر 2021 ، من الواضح أنها تعرف أكثر من ذلك بكثير ، وقد أغلقت OpenAI مؤخرًا المكون الإضافي الخاص بها.

توصلت ورقة بحثية جديدة أعدها علماء في جامعة رايس وجامعة ستانفورد إلى اختصار لطيف للمشكلة: أو MAD.

"استنتاجنا الرئيسي في جميع السيناريوهات هو أنه بدون وجود بيانات حقيقية كافية وجديدة في كل جيل من الحلقة الذاتية ، فإن النماذج التوليدية المستقبلية محكوم عليها برؤية جودتها (دقتها) أو تنوعها (استرجاعها) تنخفض تدريجيًا" ، على حد قولهم.

بشكل أساسي ، تبدأ النماذج في التخلص من البيانات الفريدة والأقل تمثيلاً ، وتقوية نتائجها على بيانات أقل تنوعًا ، في عملية مستمرة. الخبر السار هو أن هذا يعني أن الذكاء الاصطناعي لديه الآن سبب لإبقاء البشر على اطلاع دائم إذا تمكنا من إيجاد طريقة لتحديد المحتوى البشري وتحديد أولوياته للنماذج. هذه إحدى خطط رئيس OpenAI Sam Altman من خلال مشروع blockchain لفحص العين ، Worldcoin.

Tom Goldstein

هل الخيوط مجرد قائد خسارة لتدريب نماذج الذكاء الاصطناعي؟

تعد خيوط استنساخ Twitter خطوة غريبة بعض الشيء بواسطة Mark Zuckerberg لأنها تقضي على مستخدمي Instagram. تربح منصة مشاركة الصور ما يصل إلى 50 مليار دولار سنويًا ، ولكن من المتوقع أن تكسب حوالي عُشر ما تحصل عليه من الخيوط ، حتى في ظل السيناريو غير الواقعي المتمثل في حصولها على حصة سوقية بنسبة 100 ٪ من Twitter. يتوقع Alex Valaitis من Big Brain Daily أنه سيتم إغلاقها أو إعادة دمجها في Instagram في غضون 12 شهرًا ، ويقول إن السبب الحقيقي لإطلاقه الآن "هو الحصول على المزيد من المحتوى النصي لتدريب قدوة." AI from Meta ".

تم تدريب ChatGPT على كميات هائلة من بيانات Twitter ، ولكن Elon Musk اتخذ العديد من الخطوات التي لا تحظى بشعبية لمنع حدوث ذلك في المستقبل (فرض رسوم على الوصول إلى واجهة برمجة التطبيقات ، وتحديد المعدل ، وما إلى ذلك).

يمتلك Zuck نموذجًا في هذا الصدد ، حيث تم تدريب SEER على التعرف على الصور من Meta على صورة منشورة على Instagram. وافق المستخدمون على ذلك في سياسة الخصوصية ، وأكثر من عدد قليل لديهم تطبيق Thread يجمع بيانات عن كل شيء من البيانات الصحية إلى المعتقدات الدينية والعرق. ستُستخدم هذه البيانات حتمًا لتدريب نماذج الذكاء الاصطناعي مثل LLaMA الخاص بـ Facebook (نموذج Meta AI للغة الكبيرة). في غضون ذلك ، أطلق Musk للتو منافسًا يسمى OpenAI والذي سيعمل على استخراج بيانات Twitter من أجل LLM الخاص به.

عين الذكاء الاصطناعي: قضية تفكيك محتوى الذكاء الاصطناعي ، خيوط الخسارة لبيانات الذكاء الاصطناعي؟
ChatGPT يأكل أكلة لحوم البشر

بدأ ضجيج ChatGPT في التلاشي ، حيث انخفضت عمليات البحث في Google عن "ChatGPT" بنسبة 40٪ عن ذروتها في أبريل ، بينما انخفضت حركة مرور الويب إلى موقع ChatGPT التابع لـ OpenAI بنحو 10٪ في الشهر الماضي.

هذا متوقع فقط ؛ ومع ذلك ، أبلغ مستخدمو GPT-4 أيضًا أن النموذج يبدو غبيًا إلى حد كبير (ولكن أسرع) مما كان عليه من قبل.

تقول إحدى النظريات أن OpenAI قسمتها إلى عدة نماذج أصغر مدربة في مجالات محددة يمكنها العمل جنبًا إلى جنب ، ولكن ليس على المستوى نفسه تمامًا.

AI tweet

ولكن هناك إمكانية أكثر إثارة للاهتمام تلعب أيضًا دورًا: أكل لحوم البشر باستخدام الذكاء الاصطناعي.

تمتلئ الويب الآن بالنصوص والصور ، ويتم استخراج هذه البيانات التركيبية كبيانات لتدريب الذكاء الاصطناعي ، مما يتسبب في حدوث حلقة من التعليقات السلبية. كلما زاد عدد بيانات الذكاء الاصطناعي التي يستوعبها النموذج ، كان الناتج أسوأ من حيث الاتساق والجودة. إنه يشبه إلى حد ما ما يحدث عندما تقوم بعمل نسخة من نسخة ضوئية ، وتتدهور الصورة تدريجيًا.

بينما تنتهي بيانات تدريب GPT-4 الرسمية في سبتمبر 2021 ، من الواضح أنها تعرف أكثر من ذلك بكثير ، وقد أغلقت OpenAI مؤخرًا المكون الإضافي الخاص بها.

توصلت ورقة بحثية جديدة أعدها علماء في جامعة رايس وجامعة ستانفورد إلى اختصار لطيف للمشكلة: أو MAD.

"استنتاجنا الرئيسي في جميع السيناريوهات هو أنه بدون وجود بيانات حقيقية كافية وجديدة في كل جيل من الحلقة الذاتية ، فإن النماذج التوليدية المستقبلية محكوم عليها برؤية جودتها (دقتها) أو تنوعها (استرجاعها) تنخفض تدريجيًا" ، على حد قولهم.

بشكل أساسي ، تبدأ النماذج في التخلص من البيانات الفريدة والأقل تمثيلاً ، وتقوية نتائجها على بيانات أقل تنوعًا ، في عملية مستمرة. الخبر السار هو أن هذا يعني أن الذكاء الاصطناعي لديه الآن سبب لإبقاء البشر على اطلاع دائم إذا تمكنا من إيجاد طريقة لتحديد المحتوى البشري وتحديد أولوياته للنماذج. هذه إحدى خطط رئيس OpenAI Sam Altman من خلال مشروع blockchain لفحص العين ، Worldcoin.

Tom Goldstein

هل الخيوط مجرد قائد خسارة لتدريب نماذج الذكاء الاصطناعي؟

تعد خيوط استنساخ Twitter خطوة غريبة بعض الشيء بواسطة Mark Zuckerberg لأنها تقضي على مستخدمي Instagram. تربح منصة مشاركة الصور ما يصل إلى 50 مليار دولار سنويًا ، ولكن من المتوقع أن تكسب حوالي عُشر ما تحصل عليه من الخيوط ، حتى في ظل السيناريو غير الواقعي المتمثل في حصولها على حصة سوقية بنسبة 100 ٪ من Twitter. يتوقع Alex Valaitis من Big Brain Daily أنه سيتم إغلاقها أو إعادة دمجها في Instagram في غضون 12 شهرًا ، ويقول إن السبب الحقيقي لإطلاقه الآن "هو الحصول على المزيد من المحتوى النصي لتدريب قدوة." AI from Meta ".

تم تدريب ChatGPT على كميات هائلة من بيانات Twitter ، ولكن Elon Musk اتخذ العديد من الخطوات التي لا تحظى بشعبية لمنع حدوث ذلك في المستقبل (فرض رسوم على الوصول إلى واجهة برمجة التطبيقات ، وتحديد المعدل ، وما إلى ذلك).

يمتلك Zuck نموذجًا في هذا الصدد ، حيث تم تدريب SEER على التعرف على الصور من Meta على صورة منشورة على Instagram. وافق المستخدمون على ذلك في سياسة الخصوصية ، وأكثر من عدد قليل لديهم تطبيق Thread يجمع بيانات عن كل شيء من البيانات الصحية إلى المعتقدات الدينية والعرق. ستُستخدم هذه البيانات حتمًا لتدريب نماذج الذكاء الاصطناعي مثل LLaMA الخاص بـ Facebook (نموذج Meta AI للغة الكبيرة). في غضون ذلك ، أطلق Musk للتو منافسًا يسمى OpenAI والذي سيعمل على استخراج بيانات Twitter من أجل LLM الخاص به.

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow