وصلت محاولات OpenAI لوضع علامة مائية على نص AI إلى حدود

هل كتب هذا الإنسان أو ChatGPT؟ قد يكون من الصعب تحديد ذلك - ربما يكون الأمر صعبًا للغاية ، كما يعتقد منشئها OpenAI ، ولهذا السبب يعمل على طريقة "وضع علامة مائية" على المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.

خلال محاضرة في جامعة أوستن ، كشف أستاذ علوم الكمبيوتر سكوت آرونسون ، وهو حاليًا باحث زائر في OpenAI ، أن OpenAI كان يطور أداة "لوضع علامة مائية إحصائية على مخرجات نص [نظام AI]". عندما يقوم نظام - على سبيل المثال ، ChatGPT - بإنشاء نص ، تقوم الأداة بتضمين "إشارة سرية غير محسوسة" تشير إلى مكان إنشاء النص.

بنى مهندس OpenAI Hendrik Kirchner نموذجًا أوليًا عمليًا ، كما يقول آرونسون ، والأمل هو دمجه في أنظمة OpenAI المستقبلية.

قال آرونسون في ملاحظاته: "نريد أن نجعل الأمر أكثر صعوبة في أخذ ناتج [نظام ذكاء اصطناعي] وتمريره كما لو أنه جاء من إنسان". "من الواضح أنه قد يكون مفيدًا في منع الانتحال الأكاديمي ، ولكن أيضًا ، على سبيل المثال ، الجيل الهائل من الدعاية - كما تعلمون ، إرسال رسائل غير مرغوب فيها إلى كل مدونة بتعليقات على ما يبدو حول الموضوع تدعم غزو روسيا لأوكرانيا دون وجود مبنى مليء بالمتصيدون في موسكو . أو انتحال أسلوب كتابة شخص ما لتجريمه ". استغل الفرصة

لماذا العلامة المائية ضرورية؟ ChatGPT مثال جيد. لقد استحوذ روبوت الدردشة الذي طورته شركة OpenAI على الإنترنت ، حيث أظهر استعدادًا ليس فقط للإجابة على الأسئلة الصعبة ، ولكن أيضًا لكتابة الشعر وحل ألغاز البرمجة والحصول على الشعر في عدد من الموضوعات الفلسفية.

على الرغم من أن ChatGPT ممتع ومفيد حقًا ، إلا أن هناك مشكلات أخلاقية واضحة في النظام. مثل العديد من أنظمة إنشاء النصوص قبله ، يمكن استخدام ChatGPT لكتابة رسائل بريد إلكتروني تصيدية عالية الجودة وبرامج ضارة أو الغش في مهام المدرسة. وباعتبارها أداة للأسئلة والأجوبة ، فهي غير متسقة من الناحية الواقعية - وهو عيب أدى إلى قيام موقع برمجة الأسئلة والأجوبة Stack Overflow بحظر الإجابات من ChatGPT حتى إشعار آخر.

لفهم الأسس التقنية لأداة العلامة المائية لـ OpenAI ، من المفيد معرفة سبب عمل أنظمة مثل ChatGPT بشكل جيد. تفهم هذه الأنظمة إدخال وإخراج النص كسلاسل من "الرموز" ، والتي يمكن أن تكون كلمات ولكن أيضًا علامات ترقيم وأجزاء من الكلمات. في جوهرها ، تنشئ الأنظمة باستمرار وظيفة رياضية تسمى توزيع الاحتمالات لتحديد الرمز المميز (على سبيل المثال ، كلمة) التي سيتم إخراجها بعد ذلك ، مع مراعاة جميع الرموز المميزة الناتجة سابقًا.

في حالة أنظمة OpenAI المستضافة مثل ChatGPT ، بمجرد إنشاء التوزيع ، يقوم خادم OpenAI بعمل أخذ عينات الرموز بناءً على التوزيع. هناك القليل من الصدفة في هذا الاختيار ؛ لهذا السبب قد تعطي المطالبة النصية إجابة مختلفة.

قال آرونسون في المؤتمر إن أداة العلامة المائية الخاصة بـ OpenAI تعمل بمثابة "غلاف" على أنظمة إنشاء النصوص الحالية ، مستفيدة من وظيفة التشفير التي تعمل على مستوى الخادم لتحديد الرمز المميز التالي "بشكل عشوائي زائف". من الناحية النظرية ، سيظل النص الذي تم إنشاؤه بواسطة النظام يبدو عشوائيًا بالنسبة لك أو لي ، ولكن أي شخص لديه "مفتاح" لوظيفة التشفير سيكون قادرًا على اكتشاف علامة مائية.

"من الناحية التجريبية ، يبدو أن بضع مئات من الرموز كافية للحصول على إشارة معقولة تفيد بأن هذا النص من [نظام ذكاء اصطناعي]. من حيث المبدأ ، يمكنك حتى أخذ نص طويل وعزل الأجزاء التي ربما كانت من [ من النظام] والأجزاء التي ربما لم تكن كذلك. "قال آرونسون." يمكن أن تؤدي [الأداة] العلامة المائية باستخدام مفتاح سري ويمكنها التحقق من العلامة المائية باستخدام نفس المفتاح. " القيود الرئيسية

العلامة المائية النصية التي تم إنشاؤها بواسطة الذكاء الاصطناعي ليست فكرة جديدة. اعتمدت المحاولات السابقة ، في الغالب على القواعد ، على تقنيات مثل استبدال المرادفات وتغييرات الكلمات الخاصة بالصياغة. ولكن بصرف النظر عن البحث النظري الذي نشره المعهد الألماني CISPA في آذار (مارس) الماضي ، يبدو أن OpenAI هو أحد أول أساليب التشفير لحل المشكلة.

عند الاتصال به للتعليق ، رفض آرونسون قول المزيد عن النموذج الأولي للعلامة المائية ، باستثناء أنه يتوقع المشاركة في تأليف ورقة بحثية في الأشهر المقبلة. رفضت شركة OpenAI أيضًا ، قائلة فقط إن العلامة المائية هي من بين العديد من "تقنيات المصدر" التي تستكشفها لاكتشاف المخرجات الناتجة عن الذكاء الاصطناعي.

غير منتسب ...

وصلت محاولات OpenAI لوضع علامة مائية على نص AI إلى حدود

هل كتب هذا الإنسان أو ChatGPT؟ قد يكون من الصعب تحديد ذلك - ربما يكون الأمر صعبًا للغاية ، كما يعتقد منشئها OpenAI ، ولهذا السبب يعمل على طريقة "وضع علامة مائية" على المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.

خلال محاضرة في جامعة أوستن ، كشف أستاذ علوم الكمبيوتر سكوت آرونسون ، وهو حاليًا باحث زائر في OpenAI ، أن OpenAI كان يطور أداة "لوضع علامة مائية إحصائية على مخرجات نص [نظام AI]". عندما يقوم نظام - على سبيل المثال ، ChatGPT - بإنشاء نص ، تقوم الأداة بتضمين "إشارة سرية غير محسوسة" تشير إلى مكان إنشاء النص.

بنى مهندس OpenAI Hendrik Kirchner نموذجًا أوليًا عمليًا ، كما يقول آرونسون ، والأمل هو دمجه في أنظمة OpenAI المستقبلية.

قال آرونسون في ملاحظاته: "نريد أن نجعل الأمر أكثر صعوبة في أخذ ناتج [نظام ذكاء اصطناعي] وتمريره كما لو أنه جاء من إنسان". "من الواضح أنه قد يكون مفيدًا في منع الانتحال الأكاديمي ، ولكن أيضًا ، على سبيل المثال ، الجيل الهائل من الدعاية - كما تعلمون ، إرسال رسائل غير مرغوب فيها إلى كل مدونة بتعليقات على ما يبدو حول الموضوع تدعم غزو روسيا لأوكرانيا دون وجود مبنى مليء بالمتصيدون في موسكو . أو انتحال أسلوب كتابة شخص ما لتجريمه ". استغل الفرصة

لماذا العلامة المائية ضرورية؟ ChatGPT مثال جيد. لقد استحوذ روبوت الدردشة الذي طورته شركة OpenAI على الإنترنت ، حيث أظهر استعدادًا ليس فقط للإجابة على الأسئلة الصعبة ، ولكن أيضًا لكتابة الشعر وحل ألغاز البرمجة والحصول على الشعر في عدد من الموضوعات الفلسفية.

على الرغم من أن ChatGPT ممتع ومفيد حقًا ، إلا أن هناك مشكلات أخلاقية واضحة في النظام. مثل العديد من أنظمة إنشاء النصوص قبله ، يمكن استخدام ChatGPT لكتابة رسائل بريد إلكتروني تصيدية عالية الجودة وبرامج ضارة أو الغش في مهام المدرسة. وباعتبارها أداة للأسئلة والأجوبة ، فهي غير متسقة من الناحية الواقعية - وهو عيب أدى إلى قيام موقع برمجة الأسئلة والأجوبة Stack Overflow بحظر الإجابات من ChatGPT حتى إشعار آخر.

لفهم الأسس التقنية لأداة العلامة المائية لـ OpenAI ، من المفيد معرفة سبب عمل أنظمة مثل ChatGPT بشكل جيد. تفهم هذه الأنظمة إدخال وإخراج النص كسلاسل من "الرموز" ، والتي يمكن أن تكون كلمات ولكن أيضًا علامات ترقيم وأجزاء من الكلمات. في جوهرها ، تنشئ الأنظمة باستمرار وظيفة رياضية تسمى توزيع الاحتمالات لتحديد الرمز المميز (على سبيل المثال ، كلمة) التي سيتم إخراجها بعد ذلك ، مع مراعاة جميع الرموز المميزة الناتجة سابقًا.

في حالة أنظمة OpenAI المستضافة مثل ChatGPT ، بمجرد إنشاء التوزيع ، يقوم خادم OpenAI بعمل أخذ عينات الرموز بناءً على التوزيع. هناك القليل من الصدفة في هذا الاختيار ؛ لهذا السبب قد تعطي المطالبة النصية إجابة مختلفة.

قال آرونسون في المؤتمر إن أداة العلامة المائية الخاصة بـ OpenAI تعمل بمثابة "غلاف" على أنظمة إنشاء النصوص الحالية ، مستفيدة من وظيفة التشفير التي تعمل على مستوى الخادم لتحديد الرمز المميز التالي "بشكل عشوائي زائف". من الناحية النظرية ، سيظل النص الذي تم إنشاؤه بواسطة النظام يبدو عشوائيًا بالنسبة لك أو لي ، ولكن أي شخص لديه "مفتاح" لوظيفة التشفير سيكون قادرًا على اكتشاف علامة مائية.

"من الناحية التجريبية ، يبدو أن بضع مئات من الرموز كافية للحصول على إشارة معقولة تفيد بأن هذا النص من [نظام ذكاء اصطناعي]. من حيث المبدأ ، يمكنك حتى أخذ نص طويل وعزل الأجزاء التي ربما كانت من [ من النظام] والأجزاء التي ربما لم تكن كذلك. "قال آرونسون." يمكن أن تؤدي [الأداة] العلامة المائية باستخدام مفتاح سري ويمكنها التحقق من العلامة المائية باستخدام نفس المفتاح. " القيود الرئيسية

العلامة المائية النصية التي تم إنشاؤها بواسطة الذكاء الاصطناعي ليست فكرة جديدة. اعتمدت المحاولات السابقة ، في الغالب على القواعد ، على تقنيات مثل استبدال المرادفات وتغييرات الكلمات الخاصة بالصياغة. ولكن بصرف النظر عن البحث النظري الذي نشره المعهد الألماني CISPA في آذار (مارس) الماضي ، يبدو أن OpenAI هو أحد أول أساليب التشفير لحل المشكلة.

عند الاتصال به للتعليق ، رفض آرونسون قول المزيد عن النموذج الأولي للعلامة المائية ، باستثناء أنه يتوقع المشاركة في تأليف ورقة بحثية في الأشهر المقبلة. رفضت شركة OpenAI أيضًا ، قائلة فقط إن العلامة المائية هي من بين العديد من "تقنيات المصدر" التي تستكشفها لاكتشاف المخرجات الناتجة عن الذكاء الاصطناعي.

غير منتسب ...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow