ما هي الاهتمامات الرئيسية لعلماء البيانات؟ يحتوي تقرير حالة علم البيانات لعام 2022 على الإجابات

لتعزيز التزامنا بتوفير تغطية متطورة لتكنولوجيا البيانات ، يسر VentureBeat أن ترحب بأندرو بروست وتوني باير كمساهمين منتظمين. راقب مشاركاتهم في مسار البيانات.

تُعد علوم البيانات تقنية سريعة النمو حيث تتبنى المؤسسات من جميع الأحجام الذكاء الاصطناعي (AI) والتعلم الآلي (ML). إلى جانب هذا النمو ، لا يوجد نقص في المخاوف.

يحدد تقرير حالة علوم البيانات لعام 2022 ، الذي أصدرته اليوم أناكوندا ، مزود منصة علوم البيانات ، الاتجاهات والمخاوف الرئيسية لعلماء البيانات والمنظمات التي تستخدمهم. من بين الاتجاهات التي حددتها Anaconda أن لغة البرمجة مفتوحة المصدر Python تواصل السيطرة على مشهد علم البيانات.

من بين الاهتمامات الرئيسية التي تم تحديدها في التقرير العوائق التي تحول دون اعتماد علم البيانات بشكل عام.

"أحد المجالات التي فاجأتني هي أن ثلثي المستجيبين شعروا بأن أكبر عائق أمام تبني المؤسسة بنجاح لعلوم البيانات هو الاستثمار غير الكافي في هندسة البيانات والأدوات اللازمة لتمكين إنتاج نماذج جيدة" ، الرئيس التنفيذي لشركة Anaconda والمؤسس المشارك أخبر بيتر وانغ VentureBeat. "لقد عرفنا دائمًا أن علم البيانات والتعلم الآلي يمكن أن يعانيان من ضعف النماذج والمدخلات ، ولكن كان من المثير للاهتمام أن نرى أن المشاركين في الاستطلاع يرتبون هذا التصنيف أعلى من الفجوة بين المواهب والقوى العاملة." حدث

MetaBeat 2022

ستجمع MetaBeat قادة الفكر لتقديم المشورة بشأن الطريقة التي ستغير بها التكنولوجيا metaverse الطريقة التي تتواصل بها جميع الصناعات وتؤدي أعمالها في 4 أكتوبر في سان فرانسيسكو ، كاليفورنيا. سجل هنا إن تحيز الذكاء الاصطناعي في علم البيانات بعيد عن أن يكون مشكلة محلولة

إن مشكلة انحياز الذكاء الاصطناعي معروفة جيدًا في مجال علم البيانات. ما هو غير معروف هو بالضبط ما تفعله المنظمات في الواقع لمكافحة المشكلة.

في العام الماضي ، وجدت Anaconda's State of Data Science 2021 أن 40٪ من المنظمات كانت تخطط أو تفعل شيئًا لمعالجة مشكلة التحيز. أناكوندا لم تطرح نفس السؤال هذا العام ، واختارت بدلاً من ذلك نهجًا مختلفًا.

"بدلاً من التساؤل عما إذا كانت المنظمات تخطط للتصدي للتحيز ، أردنا النظر في الخطوات المحددة التي تتخذها حاليًا لضمان الإنصاف وتقليل التحيز" ، قال وانغ. "استنادًا إلى النتائج التي توصلنا إليها العام الماضي ، أدركنا أن المنظمات لديها خطط جارية لمعالجة هذه المشكلة ، لذلك أردنا في عام 2022 النظر في الخطوات التي اتخذوها ، إن وجدت ، وأين أولوياتهم."

كجزء من الجهود المبذولة لمنع التحيز المرتبط بالذكاء الاصطناعي ، قال 31٪ من المستجيبين إنهم يقيمون طرق جمع البيانات مقابل معايير الإنصاف المحددة داخليًا. في المقابل ، أشار 24٪ إلى عدم وجود معايير للحد من الإنصاف والتحيز في مجموعات البيانات والنماذج.

تعد قابلية شرح الذكاء الاصطناعي أمرًا أساسيًا للمساعدة في تحديد التحيز ومنعه. عند سؤالهم عن الأدوات المستخدمة لإمكانية شرح الذكاء الاصطناعي ، أشار 35٪ من المستجيبين إلى أن مؤسساتهم تقوم بإجراء سلسلة من الاختبارات الخاضعة للرقابة لتقييم قابلية تفسير النموذج ، في حين أن 24٪ ليس لديهم `` قياسات أو أدوات لضمان إمكانية شرح النموذج.

قال وانغ: "على الرغم من أن كل مقياس استجابة يحتوي على أقل من 50٪ من هذه الجهود في مكانها الصحيح ، فإن النتائج هنا تخبرنا أن المنظمات تتخذ نهجًا متنوعًا لتخفيف التحيز". "في نهاية اليوم ، تتخذ المنظمات إجراءات ، فهي فقط في بداية رحلتهم لمحاربة التحيز."

لدى علماء البيانات عدد من المهام المختلفة لأدائها كجزء من عملهم.

في حين أن نشر النماذج هو الهدف النهائي المنشود ، فإنه لا يقضي علماء البيانات معظم وقتهم. في الواقع ، وجدت الدراسة أن علماء البيانات يقضون 9٪ فقط من وقتهم في نشر النماذج. وبالمثل ، قال المشاركون إنهم يقضون 9٪ فقط من وقتهم في اختيار النماذج.

أكبر مضيعة للوقت هو إعداد البيانات وتنظيفها ، والتي تمثل 38٪ من الوقت. علاقة الحب والخوف بالمصدر المفتوح

...

ما هي الاهتمامات الرئيسية لعلماء البيانات؟ يحتوي تقرير حالة علم البيانات لعام 2022 على الإجابات

لتعزيز التزامنا بتوفير تغطية متطورة لتكنولوجيا البيانات ، يسر VentureBeat أن ترحب بأندرو بروست وتوني باير كمساهمين منتظمين. راقب مشاركاتهم في مسار البيانات.

تُعد علوم البيانات تقنية سريعة النمو حيث تتبنى المؤسسات من جميع الأحجام الذكاء الاصطناعي (AI) والتعلم الآلي (ML). إلى جانب هذا النمو ، لا يوجد نقص في المخاوف.

يحدد تقرير حالة علوم البيانات لعام 2022 ، الذي أصدرته اليوم أناكوندا ، مزود منصة علوم البيانات ، الاتجاهات والمخاوف الرئيسية لعلماء البيانات والمنظمات التي تستخدمهم. من بين الاتجاهات التي حددتها Anaconda أن لغة البرمجة مفتوحة المصدر Python تواصل السيطرة على مشهد علم البيانات.

من بين الاهتمامات الرئيسية التي تم تحديدها في التقرير العوائق التي تحول دون اعتماد علم البيانات بشكل عام.

"أحد المجالات التي فاجأتني هي أن ثلثي المستجيبين شعروا بأن أكبر عائق أمام تبني المؤسسة بنجاح لعلوم البيانات هو الاستثمار غير الكافي في هندسة البيانات والأدوات اللازمة لتمكين إنتاج نماذج جيدة" ، الرئيس التنفيذي لشركة Anaconda والمؤسس المشارك أخبر بيتر وانغ VentureBeat. "لقد عرفنا دائمًا أن علم البيانات والتعلم الآلي يمكن أن يعانيان من ضعف النماذج والمدخلات ، ولكن كان من المثير للاهتمام أن نرى أن المشاركين في الاستطلاع يرتبون هذا التصنيف أعلى من الفجوة بين المواهب والقوى العاملة." حدث

MetaBeat 2022

ستجمع MetaBeat قادة الفكر لتقديم المشورة بشأن الطريقة التي ستغير بها التكنولوجيا metaverse الطريقة التي تتواصل بها جميع الصناعات وتؤدي أعمالها في 4 أكتوبر في سان فرانسيسكو ، كاليفورنيا. سجل هنا إن تحيز الذكاء الاصطناعي في علم البيانات بعيد عن أن يكون مشكلة محلولة

إن مشكلة انحياز الذكاء الاصطناعي معروفة جيدًا في مجال علم البيانات. ما هو غير معروف هو بالضبط ما تفعله المنظمات في الواقع لمكافحة المشكلة.

في العام الماضي ، وجدت Anaconda's State of Data Science 2021 أن 40٪ من المنظمات كانت تخطط أو تفعل شيئًا لمعالجة مشكلة التحيز. أناكوندا لم تطرح نفس السؤال هذا العام ، واختارت بدلاً من ذلك نهجًا مختلفًا.

"بدلاً من التساؤل عما إذا كانت المنظمات تخطط للتصدي للتحيز ، أردنا النظر في الخطوات المحددة التي تتخذها حاليًا لضمان الإنصاف وتقليل التحيز" ، قال وانغ. "استنادًا إلى النتائج التي توصلنا إليها العام الماضي ، أدركنا أن المنظمات لديها خطط جارية لمعالجة هذه المشكلة ، لذلك أردنا في عام 2022 النظر في الخطوات التي اتخذوها ، إن وجدت ، وأين أولوياتهم."

كجزء من الجهود المبذولة لمنع التحيز المرتبط بالذكاء الاصطناعي ، قال 31٪ من المستجيبين إنهم يقيمون طرق جمع البيانات مقابل معايير الإنصاف المحددة داخليًا. في المقابل ، أشار 24٪ إلى عدم وجود معايير للحد من الإنصاف والتحيز في مجموعات البيانات والنماذج.

تعد قابلية شرح الذكاء الاصطناعي أمرًا أساسيًا للمساعدة في تحديد التحيز ومنعه. عند سؤالهم عن الأدوات المستخدمة لإمكانية شرح الذكاء الاصطناعي ، أشار 35٪ من المستجيبين إلى أن مؤسساتهم تقوم بإجراء سلسلة من الاختبارات الخاضعة للرقابة لتقييم قابلية تفسير النموذج ، في حين أن 24٪ ليس لديهم `` قياسات أو أدوات لضمان إمكانية شرح النموذج.

قال وانغ: "على الرغم من أن كل مقياس استجابة يحتوي على أقل من 50٪ من هذه الجهود في مكانها الصحيح ، فإن النتائج هنا تخبرنا أن المنظمات تتخذ نهجًا متنوعًا لتخفيف التحيز". "في نهاية اليوم ، تتخذ المنظمات إجراءات ، فهي فقط في بداية رحلتهم لمحاربة التحيز."

لدى علماء البيانات عدد من المهام المختلفة لأدائها كجزء من عملهم.

في حين أن نشر النماذج هو الهدف النهائي المنشود ، فإنه لا يقضي علماء البيانات معظم وقتهم. في الواقع ، وجدت الدراسة أن علماء البيانات يقضون 9٪ فقط من وقتهم في نشر النماذج. وبالمثل ، قال المشاركون إنهم يقضون 9٪ فقط من وقتهم في اختيار النماذج.

أكبر مضيعة للوقت هو إعداد البيانات وتنظيفها ، والتي تمثل 38٪ من الوقت. علاقة الحب والخوف بالمصدر المفتوح

...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow