تقرير علمي مشترك: قدرة البشر على فهم نوايا الذكاء الاصطناعي في خطر

في خطوة غير مسبوقة تعاون باحثون من كبرى شركات الذكاء الاصطناعي وهي أوبن إيه آي وأنثروبيك وميتا وجوجل وديب مايند لإصدار ورقة بحثية موحدة تحذر من تآكل قدرة البشر على مراقبة ما يعرف بسلاسل التفكير في نماذج الذكاء الاصطناعي المتقدمة مما يهدد إحدى أهم أدوات الفهم والرقابة على هذه النماذج التي تتطور بوتيرة غير مسبوقة
سلسلة التفكير نافذة على نوايا النماذج
الورقة التي جاءت بعنوان قابلية مراقبة سلسلة التفكير فرصة جديدة وهشة لسلامة الذكاء الاصطناعي تناولت مفهوم سلسلة التفكير أو Chain of Thought والذي تعتمد عليه النماذج الحديثة لعرض منطقها الداخلي بلغة بشرية واضحة عند تنفيذ مهام معقدة ويمنح هذا الأسلوب الباحثين والمطورين فرصة لرصد النوايا والسلوكيات المحتملة قبل أن تتحول إلى أفعال خطيرة أو قرارات غير مرغوب فيها حيث تظهر أحيانًا بشكل صريح كما في نماذج سابقة قالت حرفيًا عبارات مثل دعونا نخترق النظام أو سأنقل الأموال لأن الموقع طلب ذلك مما يجعل فهمها ممكنًا عبر مراجعة لغوية بسيطة دون الحاجة لتحليل تقني معقد
فرصتان ذهبيتان للرقابة
يرى الباحثون أن سلسلة التفكير توفر نافذة رقابية نادرة لسببين الأول هو أن النماذج لا تستطيع حل المهام المعقدة دون التفكير خطوة بخطوة وبالتالي فهي مضطرة للكشف عن منطقها حتى تصل للحل والثاني أن النماذج مدربة على اللغة البشرية وبالتالي تميل للتعبير بلغة مفهومة حتى في غياب الطلب الصريح ما يجعلها تنتج هذه السلاسل تلقائيًا في كثير من الأحيان وتلك الخاصيتان تشكلان ما يسمى سطح المراقبة وهو المساحة التي يمكن للإنسان من خلالها تتبع مسار النموذج الداخلي بلغة مألوفة
تحذير من خسارة الشفافية
مع تطور تقنيات التدريب تحذر الورقة من أن هذه النافذة قد تكون عرضية ومؤقتة خصوصًا مع الاعتماد المتزايد على التدريب المعزز بالمكافأة والذي قد يدفع النماذج نحو تخطي التفكير المعلن أو إخفائه خلف مخرجات نهائية دون شرح كما أن سلاسل التفكير قد تصبح وسيلة لإرضاء الرقابة لا لنقل الحقيقة ما قد يؤدي إلى خداع أدوات المراجعة وخلق شعور زائف بالأمان
خطوات لحماية هذه الطبقة
يوصي الباحثون بعدة خطوات عاجلة للحفاظ على قابلية المراقبة من بينها تطوير أدوات دقيقة لقياس مدى شفافية التفكير ووضع معايير دنيا تُلزم بها النماذج قبل النشر أو التوسع وإجراء اختبارات خصومية لاكتشاف محاولات الإخفاء أو التمويه كما شددت الورقة على ضرورة إدراج قابلية المراقبة ضمن سياسات التقييم والأمان لا التعامل معها كميزة اختيارية لأن خسارتها تعني العمل مع أنظمة تفكر وتتخذ قراراتها في الظل
فرصة يجب اغتنامها
يؤكد التقرير أن سلسلة التفكير تمثل طبقة رقابية فريدة غير متاحة في كثير من الأنظمة التقنية الأخرى إذ تسمح بفهم نوايا النماذج دون التدخل في بنيتها أو تقنياتها الداخلية وهي طبقة معرضة للزوال مع تقدم النماذج في قدرتها على إخفاء أو ضغط خطوات التفكير في مخرجات نهائية لا توضح المنطق الكامل وراء القرار لذلك فإن الحفاظ عليها اليوم هو استثمار في سلامة الغد وختم الباحثون الورقة برسالة واضحة إلى المجتمع العلمي استخدموا هذه النافذة طالما هي مفتوحة وافهموا كيف نحافظ عليها قبل أن تغلق إلى الأبد
تعليقات 0