Hugging Face and ServiceNow يطلقان BigCode ، وهو مشروع لأنظمة الذكاء الاصطناعي يولد شفرة مفتوحة المصدر

أنظمة إنشاء الكود مثل DeepMind's AlphaCode و Amazon's CodeWhisperer و OpenAI's Codex ، التي تشغل خدمة Copilot من GitHub ، تقدم رؤية رائعة لما هو ممكن مع الذكاء الاصطناعي اليوم. اليوم في مجال برمجة الكمبيوتر. ولكن حتى الآن ، تم توفير عدد قليل فقط من أنظمة الذكاء الاصطناعي هذه مجانًا للجمهور والمصدر المفتوح ، مما يعكس الحوافز التجارية للشركات التي تبنيها.

في محاولة لتغيير ذلك ، أطلقت شركة Hugging Face و ServiceNow Research ، ذراع البحث والتطوير في ServiceNow ، اليوم BigCode ، وهو مشروع جديد يهدف إلى تطوير "أحدث أنظمة الذكاء الاصطناعي." رمز في بيئة "مفتوحة". و مسئول". الهدف هو إصدار مجموعة بيانات كبيرة بما يكفي لتشكيل نظام إنشاء رمز ، والتي سيتم استخدامها بعد ذلك لإنشاء نموذج أولي - نموذج 15 مليار معلمة ، أكبر من Codex (12 مليار معلمة) ولكن أصغر من AlphaCode (~ 41.4 مليار معلمة ) - استخدام مجموعة بطاقات الرسومات الداخلية الخاصة بـ ServiceNow. في التعلم الآلي ، المعلمات هي أجزاء نظام الذكاء الاصطناعي التي يتم تعلمها من بيانات التدريب السابقة وتحدد بشكل أساسي مهارة النظام في مشكلة ما ، مثل إنشاء الكود.

مستوحى من جهود BigScience التي تبذلها Hugging Face لفتح أنظمة إنشاء نصوص متطورة للغاية ، سيكون BigCode مفتوحًا لأي شخص لديه خلفية مهنية في أبحاث الذكاء الاصطناعي والذي يمكنه تخصيص وقت للمشروع ، كما يقول المنظمون. تم وضع نموذج الطلب على الإنترنت بعد ظهر اليوم.

"بشكل عام ، نتوقع أن يكون المرشحون تابعين لمنظمة بحثية (أكاديمية أو صناعية) وأن يعملوا على الجوانب التقنية / الأخلاقية / القانونية لـ [نماذج اللغات الكبيرة] لتطبيقات الترميز ، كتب ServiceNow في مدونة بريد. ينشر. "بمجرد تدريب [نظام إنشاء الشفرة] ، سنقوم بتقييم قدراته ... وسنسعى جاهدين لجعل التقييم أسهل وأوسع حتى نتمكن من معرفة المزيد حول إمكانيات [النظام]."

من خلال التطوير التعاوني لنظام إنشاء التعليمات البرمجية ، والذي سيكون مفتوح المصدر بموجب ترخيص يسمح للمطورين بإعادة استخدامه وفقًا لبنود وشروط معينة ، يسعى BigCode إلى حل بعض الخلافات التي نشأت حول ممارسة الذكاء الاصطناعي- توليد الكود المدعوم - خاصة عندما يتعلق الأمر بالاستخدام العادل. انتقدت منظمة Freedom Conservancy غير الهادفة للربح ، من بين آخرين ، GitHub و OpenAI لاستخدامهما كود المصدر العام ، الذي لم يتم ترخيصه بالكامل ، لتدريب Codex وتحقيق الدخل منه. يتوفر Codex من خلال واجهة برمجة تطبيقات OpenAI المدفوعة ، بينما بدأت GitHub مؤخرًا في فرض رسوم على الوصول إلى Copilot. من جانبهم ، يواصل GitHub و OpenAI التأكيد على أن Codex و Copilot لا ينتهكان أي شروط ترخيص.

يقول منظمو BigCode إنهم سيعملون على ضمان أن الملفات من المستودعات ذات التراخيص المسموح بها هي فقط التي تدخل في مجموعة بيانات التدريب المذكورة أعلاه. على طول الطريق ، كما يقولون ، سوف يسعون جاهدين لإنشاء ممارسات ذكاء اصطناعي "مسؤولة" للتدريب ومشاركة أنظمة إنشاء الشفرات من جميع الأنواع ، والسعي للحصول على تعليقات من أصحاب المصلحة المعنيين قبل المتابعة. اتخاذ قرارات سياسية.

لم تقدم ServiceNow و Hugging Face أي جداول زمنية لموعد اكتمال المشروع. لكنهم يتوقعون أن يستكشف العديد من أشكال إنشاء الكود خلال الأشهر القليلة المقبلة ، بما في ذلك الأنظمة التي تكمل وتوليف تلقائيًا التعليمات البرمجية من المقتطفات وأوصاف اللغة الطبيعية وتعمل في مجموعة واسعة من المجالات والمهام ولغات البرمجة.

بافتراض حل المشكلات الأخلاقية والتقنية والقانونية على الإطلاق ، يمكن لأدوات الترميز القائمة على الذكاء الاصطناعي أن تقلل بشكل كبير من تكاليف التطوير مع السماح للمبرمجين بالتركيز على مهام أكثر إبداعًا. وفقًا لدراسة أجرتها جامعة كامبريدج ، يذهب نصف جهود المطورين على الأقل إلى التصحيح وليس البرمجة النشطة ، مما يكلف صناعة البرمجيات ما يقدر بنحو 312 مليار دولار سنويًا.

Hugging Face and ServiceNow يطلقان BigCode ، وهو مشروع لأنظمة الذكاء الاصطناعي يولد شفرة مفتوحة المصدر

أنظمة إنشاء الكود مثل DeepMind's AlphaCode و Amazon's CodeWhisperer و OpenAI's Codex ، التي تشغل خدمة Copilot من GitHub ، تقدم رؤية رائعة لما هو ممكن مع الذكاء الاصطناعي اليوم. اليوم في مجال برمجة الكمبيوتر. ولكن حتى الآن ، تم توفير عدد قليل فقط من أنظمة الذكاء الاصطناعي هذه مجانًا للجمهور والمصدر المفتوح ، مما يعكس الحوافز التجارية للشركات التي تبنيها.

في محاولة لتغيير ذلك ، أطلقت شركة Hugging Face و ServiceNow Research ، ذراع البحث والتطوير في ServiceNow ، اليوم BigCode ، وهو مشروع جديد يهدف إلى تطوير "أحدث أنظمة الذكاء الاصطناعي." رمز في بيئة "مفتوحة". و مسئول". الهدف هو إصدار مجموعة بيانات كبيرة بما يكفي لتشكيل نظام إنشاء رمز ، والتي سيتم استخدامها بعد ذلك لإنشاء نموذج أولي - نموذج 15 مليار معلمة ، أكبر من Codex (12 مليار معلمة) ولكن أصغر من AlphaCode (~ 41.4 مليار معلمة ) - استخدام مجموعة بطاقات الرسومات الداخلية الخاصة بـ ServiceNow. في التعلم الآلي ، المعلمات هي أجزاء نظام الذكاء الاصطناعي التي يتم تعلمها من بيانات التدريب السابقة وتحدد بشكل أساسي مهارة النظام في مشكلة ما ، مثل إنشاء الكود.

مستوحى من جهود BigScience التي تبذلها Hugging Face لفتح أنظمة إنشاء نصوص متطورة للغاية ، سيكون BigCode مفتوحًا لأي شخص لديه خلفية مهنية في أبحاث الذكاء الاصطناعي والذي يمكنه تخصيص وقت للمشروع ، كما يقول المنظمون. تم وضع نموذج الطلب على الإنترنت بعد ظهر اليوم.

"بشكل عام ، نتوقع أن يكون المرشحون تابعين لمنظمة بحثية (أكاديمية أو صناعية) وأن يعملوا على الجوانب التقنية / الأخلاقية / القانونية لـ [نماذج اللغات الكبيرة] لتطبيقات الترميز ، كتب ServiceNow في مدونة بريد. ينشر. "بمجرد تدريب [نظام إنشاء الشفرة] ، سنقوم بتقييم قدراته ... وسنسعى جاهدين لجعل التقييم أسهل وأوسع حتى نتمكن من معرفة المزيد حول إمكانيات [النظام]."

من خلال التطوير التعاوني لنظام إنشاء التعليمات البرمجية ، والذي سيكون مفتوح المصدر بموجب ترخيص يسمح للمطورين بإعادة استخدامه وفقًا لبنود وشروط معينة ، يسعى BigCode إلى حل بعض الخلافات التي نشأت حول ممارسة الذكاء الاصطناعي- توليد الكود المدعوم - خاصة عندما يتعلق الأمر بالاستخدام العادل. انتقدت منظمة Freedom Conservancy غير الهادفة للربح ، من بين آخرين ، GitHub و OpenAI لاستخدامهما كود المصدر العام ، الذي لم يتم ترخيصه بالكامل ، لتدريب Codex وتحقيق الدخل منه. يتوفر Codex من خلال واجهة برمجة تطبيقات OpenAI المدفوعة ، بينما بدأت GitHub مؤخرًا في فرض رسوم على الوصول إلى Copilot. من جانبهم ، يواصل GitHub و OpenAI التأكيد على أن Codex و Copilot لا ينتهكان أي شروط ترخيص.

يقول منظمو BigCode إنهم سيعملون على ضمان أن الملفات من المستودعات ذات التراخيص المسموح بها هي فقط التي تدخل في مجموعة بيانات التدريب المذكورة أعلاه. على طول الطريق ، كما يقولون ، سوف يسعون جاهدين لإنشاء ممارسات ذكاء اصطناعي "مسؤولة" للتدريب ومشاركة أنظمة إنشاء الشفرات من جميع الأنواع ، والسعي للحصول على تعليقات من أصحاب المصلحة المعنيين قبل المتابعة. اتخاذ قرارات سياسية.

لم تقدم ServiceNow و Hugging Face أي جداول زمنية لموعد اكتمال المشروع. لكنهم يتوقعون أن يستكشف العديد من أشكال إنشاء الكود خلال الأشهر القليلة المقبلة ، بما في ذلك الأنظمة التي تكمل وتوليف تلقائيًا التعليمات البرمجية من المقتطفات وأوصاف اللغة الطبيعية وتعمل في مجموعة واسعة من المجالات والمهام ولغات البرمجة.

بافتراض حل المشكلات الأخلاقية والتقنية والقانونية على الإطلاق ، يمكن لأدوات الترميز القائمة على الذكاء الاصطناعي أن تقلل بشكل كبير من تكاليف التطوير مع السماح للمبرمجين بالتركيز على مهام أكثر إبداعًا. وفقًا لدراسة أجرتها جامعة كامبريدج ، يذهب نصف جهود المطورين على الأقل إلى التصحيح وليس البرمجة النشطة ، مما يكلف صناعة البرمجيات ما يقدر بنحو 312 مليار دولار سنويًا.

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow