مراحل تعلم الذكاء الاصطناعي
المبدأ الأساسي في آلية تعلم الذكاء الاصطناعي (AI) هو التعلم من البيانات. يتم في البداية إعداد كميات هائلة من المعلومات (نصوص، صور، مقاطع صوت وفيديو.. الخ)، ثم يتم تغذية النظام بها، ليقوم بتحليلها والتعلم منها بما يشبه إلى حد كبير تعلم الإنسان من خلال الكتب والمصادر المعرفية، ولكن الفرق في أن الذكاء الاصطناعي يتبع أسلوبا مختلفا يعتمد على اكتشاف الأنماط داخل البيانات، ومن خلال الفقرات التالية نتعرف على المراحل الأساسية لهذه العملية :
إعداد و تجهيز البيانات
(Data Preparation)
هذه هي الخطوة الأولى والمرحلة الأساسية من مراحل بناء النظام عموما وعملية التعلم الآلي بشكل خاص، وتأتي أهمية هذه العملية من اعتبارها الاساس الذي تبنى عليه كل المراحل اللاحقة، جودة وكمية البيانات التي يتم جمعها لها تأثير مباشر على أداء النموذج النهائي، فبغض النظر عن مدى تعقيد الخوارزمية، لن يكون النموذج فعالا إذا كانت البيانات التي تدرب عليها سيئة أو غير كافية.
مراحل إعداد وتجهيز البيانات
تجميع البيانات
(Data Collection)
يتم جمع البيانات الأولية من مصادر مختلفة وهناك طريقتين لجمع البيانات :
التجميع اليدوي: عن طريق إدخال البيانات يدويا، مثل تسجيل بيانات المرضى في المستشفى.
التجميع التلقائي: وهذا هو الأسلوب الأكثر شيوعا في الذكاء الاصطناعي، يتم استخدام برامج خاصة (مثل برامج الزحف على الويب) لجمع كميات هائلة من البيانات من مصادر مختلفة، كمواقع الإنترنت، ووسائل التواصل الاجتماعي، وأجهزة الاستشعار، بعد تجميع البيانات، يتم إعدادها وتنظيفها لتكون جاهزة لتدريب النظام، وهي عملية تعرف باسم معالجة البيانات المسبقة
تنظيف البيانات
(Data Cleaning)
معالجة البيانات المفقودة و إزالة القيم الشاذة وتصحيح الأخطاء، مثل حذف الصفوف الفارغة، ملء القيم المفقودة بمتوسط القيم، أو تصحيح الأخطاء الإملائية، حيث ان البيانات غير النظيفة قد تؤدي إلى نتائج غير دقيقة للنموذج، لذلك تعتبر هذه الخطوة أساسية قبل أي تدريب.
تنسيق البيانات
(Data Formatting)
بعد تنظيف البيانات، تأتي مرحلة تنسيق البيانات، وهي تهدف إلى تحويل البيانات إلى شكل موحد ومتوافق مع متطلبات النموذج أو الخوارزمية التي ستتعلم منها. في هذه المرحلة، يتم التأكد من أن جميع القيم تستخدم نفس الصيغ والوحدات، مثل توحيد التواريخ إلى صيغة واحدة (YYYY-MM-DD) أو تحويل الأطوال إلى وحدة واحدة مثل السنتيمتر. كما يتم ترتيب الحقول والأعمدة بشكل مناسب، وتحويل النصوص أو الفئات إلى تمثيل رقمي قابل للمعالجة بواسطة النموذج، مثل ترميز الكلمات أو تصنيف الفئات، تساعد هذه العملية على ضمان قدرة النموذج على فهم البيانات ومعالجتها بشكل صحيح ودقيق، وتكمل مرحلة معالجة البيانات المسبقة لتصبح البيانات جاهزة لتدريب نظام الذكاء الاصطناعي.
تحليل البيانات الاستكشافي (Exploratory Data Analysis - EDA)
يهدف إلى فهم طبيعة البيانات، اكتشاف الأنماط، التوزيعات، والارتباطات بين المتغيرات، مثل رسم مخطط التوزيع لقياس الطول، أو حساب العلاقة بين العمر والدخل.
هندسة الميزات (Feature Engineering)
تحويل البيانات الخام إلى ميزات قابلة للاستخدام من قبل النموذج، مثل استخراج العمر من تاريخ الميلاد، تحويل النصوص إلى أرقام، أو ترميز القيم الاسمية مثل الجنس (ذكر/أنثى) إلى رموز رقمية،هذه الخطوة تمكن النموذج من التعلم بشكل أفضل وتحسين قدرته على التنبؤ بدقة.
تغذية البيانات
(Feeding the Data)
مرحلة تغذية البيانات ( Feeding the Data) هي المرحلة التأسيسية في تعلم الذكاء الاصطناعي وتكوين ٱلية عمله، يتم في هذه المرحلة تزويد النظام بما يشبه مكتبة داخلية هي عبارة عن كميات هائلة من المعلومات قد تكون نصوصا مكتوبة أو صور او مقاطع صوتية أو فيديو، ثم يبدأ النظام بالتعرف والتدريب عليها بعملية تشبه عملية تعلم الإنسان من خلال التعرف على ما حوله و لكن الفرق أن الذكاء الاصطناعي لا يفهم المعلومات كما يفهمها الإنسان، فيبدأ بالبحث عن الأنماط المتكررة داخل هذه البيانات و يقوم بتصنيفها.
البحث عن الأنماط
(Feature Learning)
بعد تغذية النظام بالبيانات يبدأ هذا النظام مرحلة التعلم من خلال البحث عن الأنماط (Learning Patterns)، و لتوضيح هذا المفهوم، نأخذ مثالا على ذلك (كلب و حمار)، هناك خصائص وسمات مشتركة بين الاثنين، الكلب له أربعة أرجل و اذنين و ذيل و كذلك الأمر بالنسبة للحمار، و لكن يوجد صفات خاصة بالحمار و اخرى خاصة بالكلب فالكلب ينبح و الحمار ينهق، النباح جزء من النمط الخاص بالكلب و النهيق جزء من النمط الخاص بالحمار اضافة الى اجزاء اخرى، اذن الأنماط عبارة عن مجموعة خصائص و سمات تجتمع في كائن معين يميزه عن غيره، وما يفعله الذكاء الاصطناعي، أنه يبحث في قاعدة بياناته عن الخصائص أو الأنماط أو الهياكل المشتركة لكل عنصر من العناصر و يقوم بتصنيفها، و هذا المبدأ يطبق على الصورة او الصوت او حتى في أسلوب الكتابة فإن الذكاء الاصطناعي قادر على تمييز النصوص و معرفة كاتبها ان كان بشرا أو آلة من خلال عملية تسمى : الأسلوبية الحاسوبية او قياس الأسلوب (Stylometry) و نشير الى بعض المصطلحات العلمية المستخدمة في عملية البحث عن الانماط :
معالجة اللغة الطبيعية (Natural Language Processing NL) : يعتبر المجال العلمي الأوسع لكيفية فهم الحاسوب للغة البشرية .
التنقيب في النصوص ( Text Mining ) : هذا المصطلح يستخدم لوصف عملية تحليل كميات كبيرة من النصوص لاستخلاص معلومات جديدة وقيمة منها، بما في ذلك الأنماط المتكررة
نمذجة المواضيع (Topic Modeling) : هذه عملية خاصة تتستخدم لاكتشاف الأنماط المتعلقة بالمواضيع الرئيسية داخل مجموعة كبيرة من النصوص
أنواع الأنماط
1. الأنماط العددية (Numerical Patterns)
تتعلم الآلة الأنماط من البيانات التي تكون على شكل أرقام أو قيم كمية، مثال : تحليل أسعار الأسهم للتنبؤ باتجاهات السوق المستقبلية، أو التنبؤ بالطقس بناء على بيانات درجة الحرارة والرطوبة ..الخ
2. الأنماط التصنيفية (Categorical Patterns)
تتعلم الآلة الأنماط من البيانات التي يمكن تصنيفها إلى فئات محددة، مثل تصنيف رسائل البريد الإلكتروني إلى مهم وغير مهم (Spam) أو تصنيف صور المنتجات في متجر إلكتروني حسب نوعها (ملابس، الكترونيات، كتب)
3. الأنماط النصية (Textual Patterns)
تتعلم الآلة الأنماط من النصوص واللغة، هذا هو النوع الذي يستخدم في الحوارات من قبل النماذج اللغوية الكبيرة (Chat GPT و Gemini)، مثال : فهم أنماط بناء الجمل، وتحليل المشاعر في النصوص، أو تلخيص المقالات الطويلة.
4. الأنماط المرئية (Visual Patterns)
تتعلم الآلة الأنماط من الصور والفيديوهات، مثال : التعرف على الوجوه، أو تحديد الأشياء في صورة، أو مساعدة أنظمة القيادة الذاتية على التعرف على إشارات المرور والمشاة..
التطبيق والاستنتاج
بعد أن يتجاوز النظام كل المراحل السابقة يصبح قادرا على تطبيق ما تعلمه في مختلف المهام و الاختصاصات،و عبر مختلف التطبيقات و النماذج، وهذا التطبيق العملي لما يتعلمه النظام يتم تنفيذه ضمن عملية تكامل و توزيع أدوار بين مختلف انواع الذكاء الاصطناعي (التنبؤي، التحليلي، التوليدي..) و من أهم ما يتعلمه النظام هو القدرة على التحليل و التنبؤ و تقديم الحلول
التحليل و الحلول
(Analysis and Solutions)
نضع هنا مثالا على قدرة الذكاء الاصطناعي، باستخدام ما تعلمه من اكتشاف الانماط في تحليل المشاكل وإيجاد الحلول المناسبة، نفترض أن متجرا لديه مشكلة في المبيعات لجأ إلى الذكاء الاصطناعي للمساعدة حينها، يقوم الذكاء الاصطناعي بمراجعة بيانات المبيعات السابقة للمتجر، سيكتشف أن أكبر حجم للمبيعات هو في أيام الجمعة، وأن أقل حجم للمبيعات هو في الأيام الماطرة، بناء على هذه المراجعة للسجلات، تتكون لدى الذكاء الاصطناعي (قاعدة) مفادها أن يوم الجمعة هو يوم جيد للمبيعات، (نمط) وأن اليوم الماطر تقل فيه نسبة المبيعات (نمط)، هذه هي أنماط المشكلة التي تعلمها، لكن الذكاء الاصطناعي لا يتوقف عند هذا الحد، فهو لا يكتفي بتشخيص (انماط المشكلة) و انتظار ما يحدث، بل يقترح (انماط حلول) على قاعدة الرؤية الدقيقة لأبعاد المشكلة، بعد مراجعة السحلات، فيقترح : أن تقديم العروض (نمط) يسهم في زيادة المبيعات، و ان زيادة البضائع على أرفف المتجر(نمط) يضمن تلبية الطلب المرتفع، و أن توصيل الطلبات (نمط) يمكن أن يعوض انخفاض الزيارات للمتجر ويزيد المبيعات أثناء الأيام الماطرة، وباختصار: الذكاء الاصطناعي يتعلم من المشكلة تماما كما يتعلم الإنسان من تجاربه السابقة في حل مشاكله، و بالعودة الى المثال قد يقول قائل إذا كان اليوم الممطر هو يوم الأحد مثلا، فلماذا لم يقرر الذكاء الاصطناعي أن انخفاض المبيعات في هذا اليوم كان بسبب كونه يوم الأحد، وكيف أدرك أن السبب هو المطر وليس اليوم نفسه؟ هنا تكمن دقة الذكاء الاصطناعي فهو لا ينظر إلى عامل واحد بمعزل عن غيره، عندما قام الذكاء الاصطناعي بمراجعة حجم المبيعات السابقة للمتج، وعلى قاعدة البحث عن الأنماط، لم يجد أن ضعف المبيعات هو نمط متعلق بيوم الأحد بحد ذاته بشكل ثابت. بل وجد أن هذا النمط (ضعف المبيعات) كان متعلقا بشكل مباشر ومتكرر باليوم الماطر، وأن المشكلة تكررت في أيام ماطرة سابقة، بغض النظر عن كونها جمعة أو أحد أو أي يوم آخر، هذا ما جعله يدرك أن المطر هو السبب الحقيقي وراء هذا الانخفاض، بناء على هذا الفهم الدقيق اقترح الحلول، ايضا، ولكن كيف اوجد الحلول؟ هو قام بمراجعة سجلات المبيعات فاكتشف (انماط) زيادة المبيعات التي اقترح الحلول بناء عليها، وقد يستفيد ايضا من تجارب متاجر مشابهة تعلمها اثناء التدريب او يقوم بعملية (البحث اللحظي) عبر الانترنت للبحث عن مشاكل مشابهة.
و لا يتوقف عمل الذكاء الاصطناعي عند حدود التحليل و الحلول بل يتجاوز ذلك الى تقديم طرق و اساليب مبتكرة للتطوير في مختلف جوانب الحياة البشرية سواء في الطب او التعليم أو النقل و الصناعة و الاعمال و غيرها، مما يؤشر الى مستقبل يقوم على الرقمية و الارقام و الخوارزميات.

تعليقات
إرسال تعليق