ما هي الشبكات العصبية التلافيفية؟

توجد عدة أنواع من الشبكات العصبية التلافيفية ، بما في ذلك شبكات CNN التقليدية والشبكات العصبية المتكررة والشبكات التلافيفية بالكامل وشبكات المحولات المكانية وغيرها.

سي ان ان التقليدية

تتكون شبكات CNN التقليدية ، المعروفة أيضًا باسم شبكات CNN "الفانيليا" ، من سلسلة من طبقات الالتفاف والتجميع ، تليها طبقة أو أكثر من الطبقات المتصلة بالكامل. كما ذكرنا سابقًا ، تؤدي كل طبقة تلافيفية في هذه الشبكة سلسلة من التلافيفات باستخدام مجموعة من المرشحات القابلة للتعليم لاستخراج الميزات من صورة الإدخال.

توضح بنية Lenet-5 ، وهي إحدى أولى شبكات CNN الفعالة للتعرف على الأرقام المكتوبة بخط اليد ، شبكة CNN التقليدية. لها مجموعتان من الطبقات التلافيفية والتجميعية تتبع طبقتين متصلتين بالكامل. تم إثبات فعالية شبكات CNN في التعرف على الصور من خلال بنية Lenet-5 ، مما جعلها تُستخدم على نطاق واسع في مهام رؤية الكمبيوتر.

هندسة نموذج Lenet-5

الشبكات العصبية المتكررة

تعد الشبكات العصبية المتكررة (RNN) نوعًا من الشبكات العصبية التي يمكنها معالجة البيانات المتسلسلة عن طريق تتبع سياق المدخلات السابقة. يمكن للشبكات العصبية المتكررة التعامل مع مدخلات ذات أطوال متفاوتة وإنتاج مخرجات تعتمد على المدخلات السابقة ، على عكس الشبكات العصبية المغذية النموذجية ، التي تعالج بيانات الإدخال بترتيب ثابت فقط.

على سبيل المثال ، يمكن استخدام RNNs في أنشطة البرمجة اللغوية العصبية مثل إنشاء النص أو ترجمة اللغة. يمكن تدريب الشبكة العصبية المتكررة على أزواج من الجمل بلغتين مختلفتين لتعلم الترجمة بينهما.

بنية لشبكة عصبية متكررة

تعالج RNN الجمل واحدة تلو الأخرى ، وتنتج جملة ناتجة بناءً على جملة الإدخال والمخرجات السابقة في كل خطوة. يمكن لـ RNN إنتاج ترجمات صحيحة حتى للنصوص المعقدة لأنها تتعقب المدخلات والمخرجات السابقة. شبكات تلافيفية بالكامل

الشبكات التلافيفية بالكامل (FCNs) هي نوع من بنية الشبكات العصبية المستخدمة بشكل شائع في مهام رؤية الكمبيوتر مثل تجزئة الصورة واكتشاف الكائنات وتصنيف الصور. يمكن تدريب FCNs من طرف إلى طرف باستخدام backpropagation لتصنيف الصور أو تقسيمها.

تعد Backpropagation خوارزمية تدريب تحسب تدرجات دالة الخسارة مقابل أوزان الشبكة العصبية. يتم قياس قدرة نموذج التعلم الآلي على توقع المخرجات المتوقعة لإدخال معين بواسطة دالة الخسارة.

تعتمد شبكات FCN فقط على الطبقات التلافيفية ، حيث لا تحتوي على طبقات متصلة بالكامل ، مما يجعلها أكثر قابلية للتطوير وفعالية من الناحية الحسابية من الشبكات العصبية التلافيفية التقليدية. الشبكة التي تقبل صورة الإدخال وتقوم بإنشاء موقع وتصنيف الكائنات في الصورة هي مثال على FCN.

شبكة محولات الفضاء

تُستخدم شبكة المحولات المكانية (STN) في مهام رؤية الكمبيوتر لتحسين الثبات المكاني للميزات التي تعلمتها الشبكة. تُعرف قدرة الشبكة العصبية على التعرف على الأنماط أو الكائنات في صورة ما بشكل مستقل عن موقعها الجغرافي أو اتجاهها أو مقياسها باسم الثبات المكاني.

تعتبر الشبكة التي تطبق تحويلًا مكانيًا مكتسبًا على صورة إدخال قبل معالجتها بشكل أكبر مثالًا على STN. يمكن استخدام التحويل لمحاذاة الكائنات في الصورة ، أو تصحيح تشوه المنظور ، أو إجراء تغييرات مكانية أخرى لتحسين أداء الشبكة في وظيفة معينة.

يشير التحويل إلى أي عملية تقوم بتغيير الصورة بطريقة ما ، مثل التدوير أو القياس أو الاقتصاص. تشير المحاذاة إلى عملية التأكد من أن الكائنات في صورة ما تتمحور حولها أو توجيهها أو وضعها باستمرار وبشكل هادف.

عندما تظهر الكائنات في الصورة مائلة أو مشوهة بسبب الزاوية أو المسافة التي تم التقاط الصورة منها ، يحدث تشويه المنظور. يمكن استخدام العديد من التحويلات الرياضية على الصورة ، مثل التحويلات الأفينية ، لتصحيح تشوه المنظور. تحافظ التحويلات التقريبية على الخطوط المتوازية ونسب المسافة بين النقاط لتصحيح تشوه المنظور أو التغييرات المكانية الأخرى في الصورة.

تشير التغييرات المكانية إلى أي تغيير في البنية المكانية للصورة ، مثل قلب الصورة أو تدويرها أو ترجمتها. يمكن أن تزيد هذه التغييرات ...

ما هي الشبكات العصبية التلافيفية؟

توجد عدة أنواع من الشبكات العصبية التلافيفية ، بما في ذلك شبكات CNN التقليدية والشبكات العصبية المتكررة والشبكات التلافيفية بالكامل وشبكات المحولات المكانية وغيرها.

سي ان ان التقليدية

تتكون شبكات CNN التقليدية ، المعروفة أيضًا باسم شبكات CNN "الفانيليا" ، من سلسلة من طبقات الالتفاف والتجميع ، تليها طبقة أو أكثر من الطبقات المتصلة بالكامل. كما ذكرنا سابقًا ، تؤدي كل طبقة تلافيفية في هذه الشبكة سلسلة من التلافيفات باستخدام مجموعة من المرشحات القابلة للتعليم لاستخراج الميزات من صورة الإدخال.

توضح بنية Lenet-5 ، وهي إحدى أولى شبكات CNN الفعالة للتعرف على الأرقام المكتوبة بخط اليد ، شبكة CNN التقليدية. لها مجموعتان من الطبقات التلافيفية والتجميعية تتبع طبقتين متصلتين بالكامل. تم إثبات فعالية شبكات CNN في التعرف على الصور من خلال بنية Lenet-5 ، مما جعلها تُستخدم على نطاق واسع في مهام رؤية الكمبيوتر.

هندسة نموذج Lenet-5

الشبكات العصبية المتكررة

تعد الشبكات العصبية المتكررة (RNN) نوعًا من الشبكات العصبية التي يمكنها معالجة البيانات المتسلسلة عن طريق تتبع سياق المدخلات السابقة. يمكن للشبكات العصبية المتكررة التعامل مع مدخلات ذات أطوال متفاوتة وإنتاج مخرجات تعتمد على المدخلات السابقة ، على عكس الشبكات العصبية المغذية النموذجية ، التي تعالج بيانات الإدخال بترتيب ثابت فقط.

على سبيل المثال ، يمكن استخدام RNNs في أنشطة البرمجة اللغوية العصبية مثل إنشاء النص أو ترجمة اللغة. يمكن تدريب الشبكة العصبية المتكررة على أزواج من الجمل بلغتين مختلفتين لتعلم الترجمة بينهما.

بنية لشبكة عصبية متكررة

تعالج RNN الجمل واحدة تلو الأخرى ، وتنتج جملة ناتجة بناءً على جملة الإدخال والمخرجات السابقة في كل خطوة. يمكن لـ RNN إنتاج ترجمات صحيحة حتى للنصوص المعقدة لأنها تتعقب المدخلات والمخرجات السابقة. شبكات تلافيفية بالكامل

الشبكات التلافيفية بالكامل (FCNs) هي نوع من بنية الشبكات العصبية المستخدمة بشكل شائع في مهام رؤية الكمبيوتر مثل تجزئة الصورة واكتشاف الكائنات وتصنيف الصور. يمكن تدريب FCNs من طرف إلى طرف باستخدام backpropagation لتصنيف الصور أو تقسيمها.

تعد Backpropagation خوارزمية تدريب تحسب تدرجات دالة الخسارة مقابل أوزان الشبكة العصبية. يتم قياس قدرة نموذج التعلم الآلي على توقع المخرجات المتوقعة لإدخال معين بواسطة دالة الخسارة.

تعتمد شبكات FCN فقط على الطبقات التلافيفية ، حيث لا تحتوي على طبقات متصلة بالكامل ، مما يجعلها أكثر قابلية للتطوير وفعالية من الناحية الحسابية من الشبكات العصبية التلافيفية التقليدية. الشبكة التي تقبل صورة الإدخال وتقوم بإنشاء موقع وتصنيف الكائنات في الصورة هي مثال على FCN.

شبكة محولات الفضاء

تُستخدم شبكة المحولات المكانية (STN) في مهام رؤية الكمبيوتر لتحسين الثبات المكاني للميزات التي تعلمتها الشبكة. تُعرف قدرة الشبكة العصبية على التعرف على الأنماط أو الكائنات في صورة ما بشكل مستقل عن موقعها الجغرافي أو اتجاهها أو مقياسها باسم الثبات المكاني.

تعتبر الشبكة التي تطبق تحويلًا مكانيًا مكتسبًا على صورة إدخال قبل معالجتها بشكل أكبر مثالًا على STN. يمكن استخدام التحويل لمحاذاة الكائنات في الصورة ، أو تصحيح تشوه المنظور ، أو إجراء تغييرات مكانية أخرى لتحسين أداء الشبكة في وظيفة معينة.

يشير التحويل إلى أي عملية تقوم بتغيير الصورة بطريقة ما ، مثل التدوير أو القياس أو الاقتصاص. تشير المحاذاة إلى عملية التأكد من أن الكائنات في صورة ما تتمحور حولها أو توجيهها أو وضعها باستمرار وبشكل هادف.

عندما تظهر الكائنات في الصورة مائلة أو مشوهة بسبب الزاوية أو المسافة التي تم التقاط الصورة منها ، يحدث تشويه المنظور. يمكن استخدام العديد من التحويلات الرياضية على الصورة ، مثل التحويلات الأفينية ، لتصحيح تشوه المنظور. تحافظ التحويلات التقريبية على الخطوط المتوازية ونسب المسافة بين النقاط لتصحيح تشوه المنظور أو التغييرات المكانية الأخرى في الصورة.

تشير التغييرات المكانية إلى أي تغيير في البنية المكانية للصورة ، مثل قلب الصورة أو تدويرها أو ترجمتها. يمكن أن تزيد هذه التغييرات ...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow