معايير الجمال لدى الذكاء الاصطناعي

صورة تمثل انسان يصافح امرأة قوامها ارقام بمايمثل المرأة الرقمية

 الحب من أول نظرة هو ظاهرة نفسية تتعلق بالانجذاب الشديد نحو الطرف الآخر بسرعة و باستخدام حاسة واحدة هي البصر، والذي يعتبره علماء النفس استجابة عصبية ناتجة عن عوامل بيولوجية واجتماعية، بينما يتناوله الفلاسفة كظاهرة ذات أبعاد وجودية تتعلق بالبحث عن الكمال والجمال، أو كاختبار لرؤية العالم من خلال العدسة العاطفية وليس المعرفية، وتختلف الآراء و تنقسم حول هذا المفهوم بين تأكيد ونفي لحقيقته وواقعيته، أو تشكيك بنتائجه.

وأيا تكن مواضع و نتائج الاختلاف فإن المقولة في النهاية تشير إلى احتمالية انجذاب طرف بشري الى طرف بشري آخر، وهذا الاعتقاد اصبح يشكل جزءا من ثقافة (الرومانسيات المفرطة) و ادواتها ومطوريها و ليس أولهم عمرو دياب (يا هناه) أو إليسا و أغنية (عايشالك) التى تؤكد كلماتها مفهوم النظرة الأولى التي توقع الإنسان في الحب او الاعجاب و الذي يمكن تفهمه أو تصديقه.

 لكن ما لا يمكن أن يصدق إلا في عصر الذكاء الاصطناعي، هو أن يقع شخص في حب عملية رياضية وأرقام قام الذكاء الاصطناعي بترتيبها و معالجتها بخوارزميات لا قلوب لها، وشبكة عصبية لا أعصاب لها ولا شرايين، بهذه الخلطة الرقمية و هذه الأدوات فان الذكاء الاصطناعي لديه القدرة والموهبة على أن ينتج لك حبيبتك الحسناء، مع امكانية انتقالها على نفقتك من حاسوب في وادي السيليكون الى قلبك المتيم، تستنزف عواطفك و رصيد بطاقتك الائتمانية مقابل ما تقدمه لك من (الدعم العاطفي) عبر تطبيقات مدفوعة.

 في هذه المقالة نتعرف كيف تمكن هذا (الذكي) الاصطناعي من صناعة فتاة أحلامك الرقمية عبر توليفة من الأرقام والبكسلات تعلم صناعتها بمهارة تصل الى حد الابداع.

مفهوم الصورة و معايير الجمال لدى الذكاء الاصطناعي 

الذكاء الاصطناعي لا يدرك ولا يتفاعل مع مواطن الجمال لدى البشر، هو لا يعي ولا يفهم معايير الجمال لدى جميلة مثل هيفا وهبي و لا يدرك الرسائل العاطفية التي ترسلها عبر اغنيتها الشهيرة (بوس الواوا)، الواوا في الشبكة العصبية العميقة للذكاء الاصطناعي لا (تباس)، بل (تقاس) وفق معادلات رقمية و أوزان و انحيازات، وصورة هيفا الجميلة لا يراها الذكاء الاصطناعي إلا كتلة أرقام تؤخذ و تطحن الى قيم رقمية رياضية يعاد تدويرها و تشكيلها كمتجهات رقمية مرتبة على مساحته الرياضية، يستطيع استخدام أجزاءها من رموش و أظافر وعيون في تشكيل صورة لجميلة أخرى تبعا للأمر النصي (Prompt) الذي تكتبه، او أن يبتدع جميلة قوامها خليط صفات وانماط لحسناوات تعرف عليهن في قاعدة بياناته، فأعاد تشكيلها و عرضها على منصات الدعم العاطفي المدفوعة، بما يشبه تجارة الأعضاء الرقمية.

العملية تقنيا تتلخص في تحويل كل بكسل في الصورة إلى قيمة رقمية، ثم توزع هذه القيم كمتجهات رقمية على ما يشبه خارطة تسمى (المساحة الرياضية) و يمكن تشبيهها بمخزن يضم هذه الكتل الرقمية (المتجهات) بترتيب و تنسيق يفهمه الذكاء الاصطناعي، مثلا تكون كتلة الأرقام التي تمثل متجه كلمة (الرموش) قريبة من متجه كلمة (عين) أو (حاجب)، ثم يأخذ الذكاء الاصطناعي هذه المتجهات كأنماط و يقوم باعادة تشكيلها بصورة جديدة، 

المراحل التقنية لإنتاج الصورة (من النص إلى البكسل)

على سبيل المثال لو أننا قمنا بكتابة أمر نصي (Prompt) لتوليد صورة لفتاة:(صورة مقربة ملتقطة في الاستوديو لشابة بمظهر شرق أوسطي. تبدو في الثلاثينيات من عمرها، شعرها طويل داكن متموج، ومصفف ليبرز وجهها، وترتدي أقراطا ذهبية دائرية كبيرة. وجهها مزين بمكياج احترافي، بما في ذلك ظلال عيون ورموش اصطناعية كثيفة، وأحمر شفاه غير لامع بلون البيج، عيناها فاتحتا اللون، تسند ذقنها على يدها، وأصابعها تغطي فمها جزئيا، أظافرها مطلية باللون الأسود، الخلفية رمادية ناعمة وهادئة، الإضاءة موزعة وجذابة، تضفي لمسة من التألق، تذكرنا بصور الموضة والجمال). 

هذا النص تم توليده بالذكاء الاصطناعي كوصف لصورة عبر خاصية تحويل الصورة إلى نص (Image to Prompt)، عملية إعادة إنتاج هذه الصورة تتم بخطوات نذكرها بالتفصيل مع الابتعاد عن ذكر المصطلحات و التقنيات العقدة المستخدمة في العملية تبسيطا للمسألة:

عندما تدخل هذا الوصف المفصل إلى برنامج الذكاء الاصطناعي (مثل Midjourney أو Stable Diffusion)، تجري سلسلة من الخطوات المعقدة، يمكننا تقسيمها إلى ثلاث مراحل رئيسية:

المرحلة الأولى: ترجمة الفكرة إلى أرقام

يقوم الذكاء الاصطناعي بأخذ كل كلمة وعبارة في الوصف (صورة مقربة، مظهر شرق أوسطي، أقراط ذهبية، خلفية رمادية) وتحويلها إلى متجهات أو كتل رقمية.

 هذه الكتل الرقمية هي ملفات تعريف دقيقة للمعنى. فكتلة (الشعر الطويل الداكن المموج) تحمل الخصائص الرياضية للشعر الطويل والمموج التي رآها الذكاء الاصطناعي في ملايين الصور التي تدرب عليها.

الهدف هو تحويل الوصف البشري المعقد إلى لغة الأرقام التي تفهمها الآلة، لكي يتمكن النموذج من الرجوع إلى هذه (لكتل المعنوية) أثناء الرسم.

المرحلة الثانية: تشكيل الصورة (الرسم الموجه)

البدء من العشوائية: يبدأ الذكاء الاصطناعي برسم صورة أولية عبارة عن ضوضاء عشوائية (أو ما يشبه شاشة تلفزيون قديم مليئة بالنقاط المتلألئة)، هذه النقطة هي الأساس الخام الذي سيبني عليه الصورة، وسبب البدء بالضوضاء أن هذه هي طريقة النموذج في (التفكير)، فبدلا من الرسم على قماش أبيض، يبدأ بتوزيع عشوائي ثم ينظف هذا العشوائية ليظهر الشكل النهائي.

التنظيف الموجه: هذه هي الخطوة الأهم التي تتكرر عشرات المرات في خطوات سريعة جدا حيث يقارن الذكاء الاصطناعي الكتل الرقمية لأجزاء الصورة العشوائية الحالية مع (الكتل الرقمية المعنوية) الواردة في نص الوصف، ويقوم أيضا بعملية توجيه يقرر خلالها الذكاء الاصطناعي بعض الإجراءات (ازالة الضوضاء من هذه المنطقة وجعلها تبدو كرموش اصطناعية كثيفة)، أو (تغييرهذه البقعة لتصبح لونا رماديا ناعما كالخلفية الرمادية المطلوبة)، كما يقوم النموذج بعملية ضبط و تعديل ألوان وقيم البكسلات تدريجيا ليجعلها تتطابق أكثر فأكثر مع الوصف.

مثلا عندما يصل إلى وصف (تسند ذقنها على يدها، وأصابعها تغطي فمها جزئيا)، فإن النموذج يستخدم التدريب المكاني الذي حصل عليه ليرتب البكسلات المتعلقة باليد والأصابع في مكان وزاوية منطقية بالنسبة للوجه، مع مراعاة وصف (الاقتراب).

دمج العناصر الجمالية والإخراجية: يتم معالجة المتجهات المتعلقة باسلوب الإخراج (صورة مقربة في الاستوديو، إضاءة موزعة وجذابة، جمالية ساحرة ومصقولة) في مراحل متأخرة لضمان جودة الصورة النهائية.

هذا يعني أن النموذج لا يضيف العناصر فحسب، بل يضيفها بالأسلوب البصري الذي جاء في النص.

المرحلة الثالثة: إظهار الصورة النهائية

بعد اكتمال خطوات التنظيف الموجه وإزالة الضوضاء بالكامل، تصبح الصورة عبارة عن تمثيل رقمي نقي في ذاكرة الذكاء الاصطناعي،

يتم تحويل هذا التمثيل الرقمي إلى مصفوفة من البكسلات الملونة التي يمكنك رؤيتها على الشاشة، فالنموذج اذن لا يرسم، بل ينظف ضوضاء عشوائية بشكل متكرر، وفي كل مرة يمارس التنظيف، فإنه بقترب أكثر من خريطة المعنى (الرقمية) التي ولدها من النص المفصل، حتى تظهر صورة طبق الأصل للوصف.

 و يعتمد الذكاء الاصطناعي على ما تعلمه في تدريبه من معايير الجمال التي وردت آلاف المرات في بياناته، فيعيد استخدامها كأنماط جمالية دون فهم أو تقدير لها،

الاستثمار في الأرقام

بعد هذا الشرح لآلية إنتاج و توليد الصورة وحقيقتها، يتضح لنا حجم المفارقة في تطويع المشاعر الانسانية لدى شرائح من المراهقين، واستغلالها في استثمارات تجارية تمارسها بعض شركات صناعة التقنية باستخدام الأرقام المجردة و العمليات الحسابية، و لذلك فإن الوعي و الفهم الحقيقي لما ينتجه الذكاء الاصطناعي هو مفتاح النجاة من الوقوع في شباك التقنية، و التعامل معها كأداة و مساعد فعال في أتمتة المهام بعيدا عن المشاعر و الأحاسيس التي لا يفهمها الذكاء الاصطناعي، و لا يمكنه امتلاكها مهما بلغت تعقيدات مكوناته.

.




تعليقات

المشاركات الشائعة