تقدم Anthropic ترقية Mythos لشركاء الإنترنت وإصدارًا "آمنًا" لبقيتكم

أصدرت Anthropic نموذجين جديدين للذكاء الاصطناعي يسمى Claude Fable 5 وClaude Mythos 5 يوم الثلاثاء، واللذان تقول الشركة إنهما يتمتعان بقدرات أكبر من نموذج Mythos Preview الذي أطلقته في أبريل لمجموعة محدودة من شركاء صناعة التكنولوجيا. قالت Anthropic إن الإصدار الأولي المحدود ينبع من مخاوف من إمكانية استغلال قدرات النموذج من قبل جهات فاعلة سيئة لتطوير أدوات قرصنة يمكن أن تفاجئ المدافعين.

تقوم Anthropic حاليًا بإصدار Claude Mythos 5 فقط لمجموعة محدودة من شركاء الصناعة، وقد حصل الكثير منهم على إمكانية الوصول إلى Mythos Preview، وتقول الشركة إنها تتعاون مع الحكومة الأمريكية في عملية الطرح.

يستخدم Claude Fable 5، الذي تم إصداره علنًا، نفس النموذج الأساسي مثل Mythos 5، ولكن سيكون به “حواجز حماية” عند الإطلاق، حسبما قالت الشركة يوم الثلاثاء، مما سيمنع النموذج من الإجابة على العديد من أسئلة المستخدم المتعلقة بالأمن السيبراني والبيولوجيا والكيمياء. سيتم بدلاً من ذلك إعادة توجيه هذه الطلبات إلى نموذج الذكاء الاصطناعي الأقدم، Claude Opus 4.8. إذا اشتبهت شركة Anthropic في أن أحد المستخدمين يحاول إجراء عملية التقطير – أي تدريب نموذج أصغر للذكاء الاصطناعي على استجابات نموذج ذكاء اصطناعي أكبر – في Claude Fable 5، فسيتم إعادة توجيه هذه الطلبات أيضًا إلى Claude Opus 4.8، كما تقول الشركة.

في مقابلة مع WIRED، قالت رئيسة إدارة المنتجات في Anthropic، Diane Penn، إن الشركة كانت تتصارع مع مسألة كيفية التعامل مع قدرات اكتشاف الثغرات الأمنية في برنامج Mythos وغيرها من القدرات المتقدمة منذ ما قبل إصدارها في أبريل، ولكن هذا الاختبار وإدخال المستخدم منذ ذلك الحين ساعد في صقل الإستراتيجية.

يقول بن: “نحن نحاول إجراء تحسينات بطريقة مفيدة، حتى لو لم يكن لدينا (الحل) الأمثل لبدء كل حالة استخدام”. “من بين جميع الأساليب المختلفة، ظهر هذا باعتباره الأكثر قابلية للتطبيق والأفضل. وانتهى بنا الأمر إلى الشعور بأن هذا هو أفضل خيار منتج للمستخدمين للحصول على أقصى قيمة من Fable 5.”

في الوقت الحالي، يقول بن إن آلية الحماية مبنية على الخطأ من جانب الحذر، مما يعني أنه قد يتم توجيه بعض استفسارات المستخدم إلى نموذج الذكاء الاصطناعي الأقل قدرة حتى لو كانت حميدة. وبمرور الوقت، تأمل شركة أنثروبيك أن تجعل أدوات التصنيف الخاصة بها أكثر دقة، لكن بن يقول إن هذه كانت الطريقة الآمنة الوحيدة التي يمكن للشركة من خلالها إطلاق النموذج على نطاق واسع في هذا الوقت.

وقالت الشركة يوم الثلاثاء إنه بالإضافة إلى تقديم Claude Mythos 5 لشركاء مشروع Glasswing، فإنها تتيح أيضًا إمكانية الوصول إلى “باحثين مختارين في علم الأحياء”. بالإضافة إلى ذلك، أشارت Anthropic في منشور مدونتها حول الإطلاق يوم الثلاثاء إلى أنها توفر إصدارات غير مقيدة لهذه المجموعات الصغيرة من العملاء “حتى يتوفر برنامج الوصول الموثوق لدينا”، في إشارة إلى الخطط المستقبلية لتوسيع الوصول بشكل أكبر. منذ إطلاق Mythos في أبريل، أكدت Anthropic مرارًا وتكرارًا أن منافسيها في نهاية المطاف في كل من المساحات الخاصة وحتى الوزن المفتوح سيقدمون حتمًا نماذج بقدرات على مستوى Mythos.

إن قدرة كلود ميثوس وغيره من نماذج الذكاء الاصطناعي الجديدة على تصميم أدوات القرصنة التي يمكنها العثور على نقاط الضعف واستغلالها في كل من البرامج الجديدة والقديمة، أجبرت شركات التكنولوجيا والحكومات في جميع أنحاء العالم على تأمين دفاعات برامجها قبل أن تصبح نماذج الذكاء الاصطناعي من هذا المستوى متاحة على نطاق واسع للمهاجمين. أطلقت Anthropic لأول مرة Mythos لشركاء الصناعة في إطار اتحاد يسمى Project Glasswing، مع فكرة أن هذا يمكن أن يمنح الأعضاء بداية مبكرة في إعداد أنظمتهم الخاصة ووزن الحلول العالمية للتهديد قبل إصدار أوسع.

كتب Anthropic في تحديث حول مشروع Glasswing الأسبوع الماضي: “نحن نعمل بأسرع ما يمكن لإصدار قدرات على مستوى Mythos بأمان في الوصول العام. وللقيام بذلك، سنحتاج إلى ضمانات قوية للغاية تمنع إساءة استخدام القدرات السيبرانية للنموذج – وهي ضمانات لم نقم نحن (وعلى حد علمنا، جميع مطوري الذكاء الاصطناعي الآخرين) بتطويرها”.