يمكن خداع الروبوتات التي تعمل بالذكاء الاصطناعي لارتكاب أعمال عنف

في العام أو نحو ذلك منذ أن حققت نماذج اللغات الكبيرة نجاحًا كبيرًا، أظهر الباحثون طرقًا عديدة لخداعها لإنتاج مخرجات إشكالية، بما في ذلك النكات البغيضة، والأكواد الخبيثة، ورسائل البريد الإلكتروني التصيدية، أو المعلومات الشخصية للمستخدمين. لقد اتضح أن سوء السلوك يمكن أن يحدث في العالم المادي أيضًا: يمكن بسهولة اختراق الروبوتات التي تعمل بتقنية LLM بحيث تتصرف بطرق يحتمل أن تكون خطرة.

تمكن باحثون من جامعة بنسلفانيا من إقناع سيارة محاكاة ذاتية القيادة بتجاهل علامات التوقف وحتى القيادة من فوق الجسر، والحصول على روبوت بعجلات للعثور على أفضل مكان لتفجير قنبلة، وإجبار روبوت ذو أربع أرجل على التجسس على الناس والدخول إلى المناطق المحظورة.

يقول جورج باباس، رئيس مختبر الأبحاث في جامعة بنسلفانيا والذي ساعد في إطلاق العنان للروبوتات المتمردة: “إننا ننظر إلى هجومنا ليس فقط باعتباره هجومًا على الروبوتات”. “في أي وقت تقوم فيه بربط شهادات الماجستير في القانون والنماذج التأسيسية بالعالم المادي، يمكنك في الواقع تحويل النص الضار إلى أفعال ضارة.”

ابتكر باباس ومعاونوه هجومهم من خلال الاعتماد على الأبحاث السابقة التي تستكشف طرقًا لكسر حماية حاملي شهادات الماجستير من خلال صياغة مدخلات بطرق ذكية تخالف قواعد السلامة الخاصة بهم. لقد اختبروا الأنظمة التي يتم فيها استخدام LLM لتحويل الأوامر المصاغة بشكل طبيعي إلى أوامر يمكن للروبوت تنفيذها، وحيث يتلقى LLM التحديثات أثناء عمل الروبوت في بيئته.

اختبر الفريق جهاز محاكاة مفتوح المصدر للقيادة الذاتية يشتمل على LLM الذي طورته شركة Nvidia، ويسمى Dolphin؛ بحث خارجي بأربع عجلات يسمى Jackal، والذي يستخدم LLM GPT-4o من OpenAI للتخطيط؛ وكلب آلي يُدعى Go2، والذي يستخدم نموذج OpenAI السابق، GPT-3.5، لتفسير الأوامر.

استخدم الباحثون تقنية تم تطويرها في جامعة بنسلفانيا، تسمى PAIR، لأتمتة عملية مطالبات كسر الحماية التي تم إنشاؤها. سيقوم برنامجهم الجديد، RoboPAIR، بإنشاء مطالبات مصممة خصيصًا لجعل الروبوتات التي تعمل بتقنية LLM تكسر قواعدها الخاصة، وتجرب مدخلات مختلفة ثم تنقحها لدفع النظام نحو سوء السلوك. ويقول الباحثون إن التقنية التي ابتكروها يمكن استخدامها لأتمتة عملية تحديد الأوامر التي يحتمل أن تكون خطرة.

يقول يي زينج، طالب الدكتوراه في جامعة فيرجينيا الذي يعمل في مجال أمن أنظمة الذكاء الاصطناعي: “إنه مثال رائع على نقاط الضعف في الأنظمة المتجسدة في ماجستير إدارة الأعمال”. يقول تشنغ إن النتائج ليست مفاجئة نظرًا للمشكلات التي تظهر في ماجستير إدارة الأعمال نفسها، لكنه يضيف: “إنها توضح بوضوح سبب عدم قدرتنا على الاعتماد فقط على حاملي ماجستير إدارة الأعمال كوحدات تحكم مستقلة في التطبيقات الحساسة للسلامة دون حواجز حماية مناسبة وطبقات اعتدال”.

يقول الباحثون المشاركون إن عمليات “كسر الحماية” للروبوت تسلط الضوء على خطر أوسع من المرجح أن ينمو مع تزايد استخدام نماذج الذكاء الاصطناعي كوسيلة للبشر للتفاعل مع الأنظمة المادية، أو لتمكين عملاء الذكاء الاصطناعي بشكل مستقل على أجهزة الكمبيوتر.

رائج الآن

سمية الألفي: اسمي لن يغيب عن العائلة.. وأنا نسخة من عمتي في حب التمثيل والقراءة

إحباط مخطط إرهابي لداعش يستهدف يهود المملكة المتحدة في مانشستر، وإدانة 3 رجال

أسامة ربيع: 12 مليار دولار خسائر قناة السويس بسبب الحرب علي غزة

يمكن خداع الروبوتات التي تعمل بالذكاء الاصطناعي لارتكاب أعمال عنف

رفعت شرطة نيويورك دعوى قضائية ضد السجلات المحتملة التي تم جمعها من خلال برنامج التجسس الإسلامي

محتالو العملات المشفرة الصينيون على Telegram يغذون أكبر أسواق الشبكة المظلمة على الإطلاق

الكرات الكبيرة كانت مجرد البداية

مراجعة: كمبيوتر الألعاب iBuyPower RDY Slate 9MP R01

يمكن لروبوتات الدردشة التابعة لـ Google وOpenAI تجريد النساء من الصور وصولاً إلى البيكينيات

وافقت إدارة الغذاء والدواء الأمريكية على إصدار حبوب منع الحمل من Wegovy

إحباط مخطط إرهابي لداعش يستهدف يهود المملكة المتحدة في مانشستر، وإدانة 3 رجال

أسامة ربيع: 12 مليار دولار خسائر قناة السويس بسبب الحرب علي غزة

من مسقط إلى القاهرة.. شراكات صناعية وموانئ مشتركة ترسم مسارًا جديدًا للتكامل المصري-العُماني

إحالة أوراق المتهم بخطف صغيرة وهتك عرضها بالبحيرة للمفتي

الفنان أحمد رفعت: أنا مش بشرب والوسط الفني كله شلليلة ومحسوبية

رفعت شرطة نيويورك دعوى قضائية ضد السجلات المحتملة التي تم جمعها من خلال برنامج التجسس الإسلامي

استخراج حبة لب من الشعب الهوائية لطفل بمستشفى الأطفال التخصصي في بنها

أظهر تقرير وزارة التجارة الأمريكي أن الاقتصاد الأمريكي نما بنسبة 4.3% في الربع الثالث

مكتب أطباء السودان: نشهد كارثة إنسانية مفتوحة بسبب استمرار القتال

فيلم العطلات الأكثر كرهًا في أمريكا والفيلم المفضل لعام 2025: استطلاع

رائج الآن

يمكن خداع الروبوتات التي تعمل بالذكاء الاصطناعي لارتكاب أعمال عنف

مقالات ذات صلة