يقوم العلماء بإنشاء "OpinionGPT" لاستكشاف التحيزات البشرية الصريحة - ويمكن للجمهور اختبارها

نظرًا لطبيعة بيانات ضبط النموذج، فمن غير الواضح ما إذا كان هذا النظام قادرًا بالفعل على توليد نتائج تظهر تحيزات حقيقية. أخبار انضم الينا على الشبكات الاجتماعية
قام فريق من الباحثين من جامعة هومبولت في برلين بتطوير نموذج ذكاء اصطناعي واسع اللغة (AI) يتميز بأنه تم ضبطه عمدًا لتوليد نتائج ذات تحيزات واضحة.

يُطلق على نموذج الفريق اسم OpinionGPT، وهو نسخة محسنة من Meta's Llama 2، وهو نظام ذكاء اصطناعي يشبه في قدراته نظام ChatGPT من OpenAI أو Anthropic's Claude 2.

من خلال عملية تسمى الضبط الدقيق القائم على التعليمات، يمكن لـ OpinionGPT الاستجابة للمطالبات كما لو كانت تمثل واحدة من 11 مجموعة متحيزة: أمريكي، ألماني، أمريكي لاتيني، شرق أوسطي، مراهق، شخص يزيد عمره عن 30 عامًا. شخص مسن، رجل، امرأة، ليبرالي أو محافظ.

الإعلان عن "OpinionGPT: نموذج GPT متحيز للغاية"! جربه هنا: https://t.co/5YJjHlcV4n لدراسة تأثير التحيز على استجابات النموذج، طرحنا سؤالًا بسيطًا: ماذا لو قمنا بضبط نموذج #GPT فقط باستخدام النصوص المكتوبة بواسطة أشخاص ذوي تفكير سياسي صحيح ?

[1/3]
– آلان أقبيك (@alan_akbik) 8 سبتمبر 2023
تم تحسين OpinionGPT بناءً على مجموعة من البيانات المستمدة من مجتمعات "AskX"، والتي تسمى subreddits، على Reddit. من أمثلة هذه المنتديات الفرعية r/AskaWoman وr/AskAnAmerican.

بدأ الفريق بالعثور على منشورات فرعية على موقع Reddit تتعلق بالتحيزات الـ 11 المحددة واستخراج 25000 مشاركة من كل منها الأكثر شعبية. ثم احتفظ فقط بالمشاركات التي حققت الحد الأدنى من الأصوات المؤيدة، ولم تحتوي على اقتباس مضمن، وكانت أقل من 80 كلمة.

مع ما تبقى، يبدو أن الباحثين استخدموا نهجًا مشابهًا للذكاء الاصطناعي الدستوري الأنثروبيكي. بدلًا من إنشاء نماذج جديدة تمامًا لتمثيل كل علامة تحيز، قاموا بشكل أساسي بتعديل 7 مليار معلمة...

التشفير Sep 9, 2023 0 19 Add to Reading List

يقوم العلماء بإنشاء "OpinionGPT" لاستكشاف التحيزات البشرية الصريحة - ويمكن للجمهور اختبارها

نظرًا لطبيعة بيانات ضبط النموذج، فمن غير الواضح ما إذا كان هذا النظام قادرًا بالفعل على توليد نتائج تظهر تحيزات حقيقية. أخبار انضم الينا على الشبكات الاجتماعية

قام فريق من الباحثين من جامعة هومبولت في برلين بتطوير نموذج ذكاء اصطناعي واسع اللغة (AI) يتميز بأنه تم ضبطه عمدًا لتوليد نتائج ذات تحيزات واضحة.

يُطلق على نموذج الفريق اسم OpinionGPT، وهو نسخة محسنة من Meta's Llama 2، وهو نظام ذكاء اصطناعي يشبه في قدراته نظام ChatGPT من OpenAI أو Anthropic's Claude 2.

من خلال عملية تسمى الضبط الدقيق القائم على التعليمات، يمكن لـ OpinionGPT الاستجابة للمطالبات كما لو كانت تمثل واحدة من 11 مجموعة متحيزة: أمريكي، ألماني، أمريكي لاتيني، شرق أوسطي، مراهق، شخص يزيد عمره عن 30 عامًا. شخص مسن، رجل، امرأة، ليبرالي أو محافظ.

الإعلان عن "OpinionGPT: نموذج GPT متحيز للغاية"! جربه هنا: https://t.co/5YJjHlcV4n لدراسة تأثير التحيز على استجابات النموذج، طرحنا سؤالًا بسيطًا: ماذا لو قمنا بضبط نموذج #GPT فقط باستخدام النصوص المكتوبة بواسطة أشخاص ذوي تفكير سياسي صحيح ?

[1/3]

– آلان أقبيك (@alan_akbik) 8 سبتمبر 2023

تم تحسين OpinionGPT بناءً على مجموعة من البيانات المستمدة من مجتمعات "AskX"، والتي تسمى subreddits، على Reddit. من أمثلة هذه المنتديات الفرعية r/AskaWoman وr/AskAnAmerican.

بدأ الفريق بالعثور على منشورات فرعية على موقع Reddit تتعلق بالتحيزات الـ 11 المحددة واستخراج 25000 مشاركة من كل منها الأكثر شعبية. ثم احتفظ فقط بالمشاركات التي حققت الحد الأدنى من الأصوات المؤيدة، ولم تحتوي على اقتباس مضمن، وكانت أقل من 80 كلمة.

مع ما تبقى، يبدو أن الباحثين استخدموا نهجًا مشابهًا للذكاء الاصطناعي الدستوري الأنثروبيكي. بدلًا من إنشاء نماذج جديدة تمامًا لتمثيل كل علامة تحيز، قاموا بشكل أساسي بتعديل 7 مليار معلمة...