حتى الأذكى نماذج الذكاء الاصطناعي هي في الأساس مقلدة. إنهم يتعلمون إما عن طريق استهلاك أمثلة من العمل البشري أو عن طريق محاولة حل المشكلات التي تم تعيينها لهم من قبل المدربين البشريين.
ولكن ربما يستطيع الذكاء الاصطناعي، في الواقع، أن يتعلم بطريقة أكثر إنسانية، من خلال اكتشاف أسئلة مثيرة للاهتمام ليطرحها على نفسه ومحاولة العثور على الإجابة الصحيحة. يُظهر مشروع من جامعة تسينغهوا، ومعهد بكين للذكاء الاصطناعي العام (BIGAI)، وجامعة ولاية بنسلفانيا، أن الذكاء الاصطناعي يمكنه تعلم التفكير بهذه الطريقة من خلال اللعب برموز الكمبيوتر.
ابتكر الباحثون نظامًا يسمى “السبب الصفري المطلق” (AZR) الذي يستخدم أولاً نموذجًا لغويًا كبيرًا لإنشاء مشكلات ترميز بايثون الصعبة ولكن القابلة للحل. ثم يستخدم نفس النموذج لحل تلك المشكلات قبل التحقق من عمله من خلال محاولة تشغيل التعليمات البرمجية. وأخيرًا، يستخدم نظام AZR النجاحات والإخفاقات كإشارة لتحسين النموذج الأصلي، وزيادة قدرته على طرح مشكلات أفضل وحلها.
وجد الفريق أن نهجهم أدى إلى تحسين مهارات الترميز والاستدلال بشكل كبير لكل من 7 مليارات و14 مليار نسخة معلمة من نموذج اللغة مفتوحة المصدر Qwen. ومن المثير للإعجاب أن النموذج تفوق في الأداء على بعض النماذج التي تلقت بيانات برعاية الإنسان.
لقد تحدثت إلى أندرو تشاو، طالب الدكتوراه في جامعة تسينغهوا الذي جاء بالفكرة الأصلية للصفر المطلق، وكذلك زيلونج تشنغ، الباحث في BIGAI الذي عمل معه في المشروع، عبر Zoom.
أخبرني تشاو أن هذا النهج يشبه الطريقة التي يذهب بها التعلم البشري إلى ما هو أبعد من الحفظ عن ظهر قلب أو التقليد. وقال: “في البداية تقلد والديك وتفعل مثل معلميك، ولكن بعد ذلك عليك أن تطرح أسئلتك الخاصة”. “وفي النهاية يمكنك التفوق على أولئك الذين علموك في المدرسة.”
وأشار تشاو وتشينغ إلى أن فكرة تعلم الذكاء الاصطناعي بهذه الطريقة، والتي يطلق عليها أحيانًا اسم “اللعب الذاتي”، تعود إلى سنوات مضت، وقد تم استكشافها سابقًا من قبل أمثال يورغن شميدهوبر، أحد رواد الذكاء الاصطناعي المعروفين، وبيير إيف أوديير، عالم الكمبيوتر في إنريا في فرنسا.
أحد العناصر الأكثر إثارة في المشروع، وفقًا لـ Zheng، هو الطريقة التي يتم بها قياس مهارات النموذج في طرح المشكلات وحل المشكلات. ويقول: “إن مستوى الصعوبة ينمو كلما أصبح النموذج أكثر قوة”.
ويتمثل التحدي الرئيسي في أن النظام في الوقت الحالي يعمل فقط على المشكلات التي يمكن التحقق منها بسهولة، مثل تلك التي تتضمن الرياضيات أو البرمجة. مع تقدم المشروع، قد يكون من الممكن استخدامه في مهام الذكاء الاصطناعي الوكيل مثل تصفح الويب أو القيام بالأعمال المكتبية. قد يتضمن ذلك محاولة نموذج الذكاء الاصطناعي الحكم على ما إذا كانت تصرفات الوكيل صحيحة.
أحد الاحتمالات الرائعة لنهج مثل الصفر المطلق هو أنه من الممكن، من الناحية النظرية، السماح للنماذج بالذهاب إلى ما هو أبعد من التدريس البشري. قال لي تشنغ: “بمجرد أن نحصل على ذلك، تصبح هذه طريقة للوصول إلى الذكاء الفائق”.
هناك دلائل مبكرة على أن نهج الصفر المطلق بدأ ينتشر في بعض مختبرات الذكاء الاصطناعي الكبيرة.
يتضمن مشروع يسمى Agent0، من Salesforce وستانفورد وجامعة نورث كارولينا في تشابل هيل، وكيلًا يستخدم أداة برمجية يعمل على تحسين نفسه من خلال اللعب الذاتي. كما هو الحال مع الصفر المطلق، يتحسن النموذج في التفكير العام من خلال حل المشكلات التجريبي. تقدم ورقة بحثية حديثة كتبها باحثون من جامعة ميتا وجامعة إلينوي وجامعة كارنيجي ميلون نظامًا يستخدم نوعًا مشابهًا من اللعب الذاتي في هندسة البرمجيات. يقترح مؤلفو هذا العمل أنه يمثل “خطوة أولى نحو نماذج التدريب لوكلاء البرمجيات فائقة الذكاء”.
من المرجح أن يكون إيجاد طرق جديدة لتعلم الذكاء الاصطناعي موضوعًا كبيرًا في صناعة التكنولوجيا هذا العام. ومع أن المصادر التقليدية للبيانات أصبحت أكثر ندرة وأكثر تكلفة، وبينما تبحث المختبرات عن طرق جديدة لجعل النماذج أكثر قدرة، فإن مشروع مثل “الصفر المطلق” قد يؤدي إلى أنظمة ذكاء اصطناعي أقل شبهاً بالمقلدين وأكثر شبهاً بالبشر.










