نموذج الذكاء الاصطناعي مفتوح المصدر الأكثر كفاءة حتى الآن قد يعزز قدرات وكلاء الذكاء الاصطناعي

قد يؤدي نموذج الذكاء الاصطناعي مفتوح المصدر الأكثر كفاءة مع القدرات البصرية حتى الآن إلى قيام المزيد من المطورين والباحثين والشركات الناشئة بتطوير وكلاء الذكاء الاصطناعي الذين يمكنهم تنفيذ مهام مفيدة على أجهزة الكمبيوتر الخاصة بك.

أصدر معهد ألين للذكاء الاصطناعي (Ai2) اليوم نموذج اللغة المفتوحة المتعدد الوسائط، أو Molmo، والذي يمكنه تفسير الصور وكذلك المحادثة من خلال واجهة الدردشة. وهذا يعني أنه يمكنه فهم شاشة الكمبيوتر، مما قد يساعد وكيل الذكاء الاصطناعي في أداء مهام مثل تصفح الويب، والتنقل عبر أدلة الملفات، وكتابة مسودات المستندات.

يقول علي فرهادي، الرئيس التنفيذي لشركة Ai2، وهي منظمة بحثية مقرها سياتل بواشنطن، وعالم كمبيوتر في جامعة واشنطن: “مع هذا الإصدار، يمكن لعدد أكبر من الأشخاص نشر نموذج متعدد الوسائط. وينبغي أن يكون هذا بمثابة عامل تمكين لتطبيقات الجيل التالي”.

إن ما يسمى بوكلاء الذكاء الاصطناعي يتم الترويج لهم على نطاق واسع باعتبارهم الشيء الكبير القادم في مجال الذكاء الاصطناعي، حيث تتسابق OpenAI وGoogle وغيرهما لتطويرهم. لقد أصبح الوكلاء كلمة طنانة في الآونة الأخيرة، ولكن الرؤية الكبرى هي أن يتجاوز الذكاء الاصطناعي الدردشة إلى اتخاذ إجراءات معقدة ومتطورة بشكل موثوق على أجهزة الكمبيوتر عند إعطائها أمرًا. لم تتحقق هذه القدرة بعد على أي نطاق.

تتمتع بعض نماذج الذكاء الاصطناعي القوية بالفعل بقدرات بصرية، بما في ذلك GPT-4 من OpenAI، وClaude من Anthropic، وGemini من Google DeepMind. يمكن استخدام هذه النماذج لتشغيل بعض وكلاء الذكاء الاصطناعي التجريبيين، ولكنها مخفية عن الأنظار ولا يمكن الوصول إليها إلا عبر واجهة برمجة تطبيقات مدفوعة الأجر، أو API.

أطلقت شركة Meta مجموعة من نماذج الذكاء الاصطناعي تسمى Llama بموجب ترخيص يحد من استخدامها التجاري، لكنها لم تقدم للمطورين حتى الآن نسخة متعددة الوسائط. ومن المتوقع أن تعلن شركة Meta عن العديد من المنتجات الجديدة، ربما بما في ذلك نماذج Llama AI الجديدة، في حدث Connect اليوم.

يقول أوفير بريس، باحث ما بعد الدكتوراه في جامعة برينستون والذي يعمل على وكلاء الذكاء الاصطناعي: “إن وجود نموذج مفتوح المصدر ومتعدد الوسائط يعني أن أي شركة ناشئة أو باحث لديه فكرة يمكنه محاولة تنفيذها”.

يقول بريس إن حقيقة كون مولمو مفتوح المصدر تعني أن المطورين سيكونون قادرين بسهولة أكبر على ضبط وكلائهم لأداء مهام محددة، مثل العمل مع جداول البيانات، من خلال توفير بيانات تدريب إضافية. لا يمكن ضبط نماذج مثل GPT-4 إلا بدرجة محدودة من خلال واجهات برمجة التطبيقات الخاصة بها، في حين يمكن تعديل نموذج مفتوح المصدر بالكامل على نطاق واسع. يقول بريس: “عندما يكون لديك نموذج مفتوح المصدر مثل هذا، فلديك العديد من الخيارات الأخرى”.

تطلق Ai2 عدة أحجام من Molmo اليوم، بما في ذلك نموذج يحتوي على 70 مليار معامل وآخر يحتوي على مليار معامل صغير بما يكفي لتشغيله على جهاز محمول. يشير عدد معاملات النموذج إلى عدد الوحدات التي يحتوي عليها لتخزين البيانات ومعالجتها ويتوافق تقريبًا مع قدراته.

وتقول شركة Ai2 إن Molmo يتمتع بنفس قدرة النماذج التجارية الأكبر حجمًا على الرغم من صغر حجمه نسبيًا، وذلك لأنه تم تدريبه بعناية على بيانات عالية الجودة. كما أن النموذج الجديد مفتوح المصدر بالكامل، حيث لا توجد قيود على استخدامه، على عكس Llama من Meta. كما تنشر Ai2 بيانات التدريب المستخدمة لإنشاء النموذج، مما يوفر للباحثين مزيدًا من التفاصيل حول عمله.

إن إطلاق نماذج قوية ليس بالأمر الخالي من المخاطر. إذ يمكن بسهولة أكبر تكييف مثل هذه النماذج لتحقيق غايات شريرة؛ فقد نشهد ذات يوم، على سبيل المثال، ظهور وكلاء الذكاء الاصطناعي الخبيثين المصممين لأتمتة اختراق أنظمة الكمبيوتر.

ويزعم فرهادي من شركة Ai2 أن كفاءة مولمو وقابليته للنقل سوف تسمح للمطورين ببناء وكلاء برمجيين أكثر قوة يعملون بشكل أصلي على الهواتف الذكية وغيرها من الأجهزة المحمولة. ويقول: “يعمل نموذج المليار معلمة الآن على نفس مستوى أو في فئة النماذج التي يزيد حجمها عن عشرة أضعاف على الأقل”.

ولكن بناء وكلاء الذكاء الاصطناعي المفيدين قد يعتمد على أكثر من مجرد نماذج متعددة الوسائط أكثر كفاءة. ويتمثل التحدي الرئيسي في جعل النماذج تعمل بشكل أكثر موثوقية. وقد يتطلب هذا المزيد من الاختراقات في قدرات الذكاء الاصطناعي على التفكير المنطقي ــ وهو الأمر الذي سعت شركة OpenAI إلى معالجته بأحدث نموذج لها o1، والذي يوضح مهارات التفكير المنطقي خطوة بخطوة. وقد تكون الخطوة التالية هي إعطاء النماذج المتعددة الوسائط مثل هذه القدرات على التفكير المنطقي.

في الوقت الحالي، يعني إصدار Molmo أن وكلاء الذكاء الاصطناعي أصبحوا أقرب من أي وقت مضى – وقد يكونون مفيدين قريبًا حتى خارج الشركات العملاقة التي تحكم عالم الذكاء الاصطناعي.