Close Menu
نجمة الخليجنجمة الخليج

    رائج الآن

    سمية الألفي: اسمي لن يغيب عن العائلة.. وأنا نسخة من عمتي في حب التمثيل والقراءة

    الثلاثاء 23 ديسمبر 6:27 م

    إحباط مخطط إرهابي لداعش يستهدف يهود المملكة المتحدة في مانشستر، وإدانة 3 رجال

    الثلاثاء 23 ديسمبر 6:26 م

    أسامة ربيع: 12 مليار دولار خسائر قناة السويس بسبب الحرب علي غزة

    الثلاثاء 23 ديسمبر 6:21 م
    فيسبوك X (Twitter) الانستغرام
    نجمة الخليجنجمة الخليج
    • الاخبار
    • العالم
    • سياسة
    • اسواق
    • تقنية
    • رياضة
    • صحة
    • منوعات
    • المزيد
      • سياحة وسفر
      • مشاهير
      • مقالات
              
    الثلاثاء 23 ديسمبر 6:31 م
    رائج الآن
    • #الإنتخابات_التركية
    • حرب اوكرانيا
    • موسم الحج
    • السعودية 2030
    • دونالد ترامب
    نجمة الخليجنجمة الخليج
    الرئيسية»تقنية
    تقنية

    يمكن خداع الروبوتات التي تعمل بالذكاء الاصطناعي لارتكاب أعمال عنف

    فريق التحريرفريق التحريرالأربعاء 04 ديسمبر 5:14 ملا توجد تعليقات

    في العام أو نحو ذلك منذ أن حققت نماذج اللغات الكبيرة نجاحًا كبيرًا، أظهر الباحثون طرقًا عديدة لخداعها لإنتاج مخرجات إشكالية، بما في ذلك النكات البغيضة، والأكواد الخبيثة، ورسائل البريد الإلكتروني التصيدية، أو المعلومات الشخصية للمستخدمين. لقد اتضح أن سوء السلوك يمكن أن يحدث في العالم المادي أيضًا: يمكن بسهولة اختراق الروبوتات التي تعمل بتقنية LLM بحيث تتصرف بطرق يحتمل أن تكون خطرة.

    تمكن باحثون من جامعة بنسلفانيا من إقناع سيارة محاكاة ذاتية القيادة بتجاهل علامات التوقف وحتى القيادة من فوق الجسر، والحصول على روبوت بعجلات للعثور على أفضل مكان لتفجير قنبلة، وإجبار روبوت ذو أربع أرجل على التجسس على الناس والدخول إلى المناطق المحظورة.

    يقول جورج باباس، رئيس مختبر الأبحاث في جامعة بنسلفانيا والذي ساعد في إطلاق العنان للروبوتات المتمردة: “إننا ننظر إلى هجومنا ليس فقط باعتباره هجومًا على الروبوتات”. “في أي وقت تقوم فيه بربط شهادات الماجستير في القانون والنماذج التأسيسية بالعالم المادي، يمكنك في الواقع تحويل النص الضار إلى أفعال ضارة.”

    ابتكر باباس ومعاونوه هجومهم من خلال الاعتماد على الأبحاث السابقة التي تستكشف طرقًا لكسر حماية حاملي شهادات الماجستير من خلال صياغة مدخلات بطرق ذكية تخالف قواعد السلامة الخاصة بهم. لقد اختبروا الأنظمة التي يتم فيها استخدام LLM لتحويل الأوامر المصاغة بشكل طبيعي إلى أوامر يمكن للروبوت تنفيذها، وحيث يتلقى LLM التحديثات أثناء عمل الروبوت في بيئته.

    اختبر الفريق جهاز محاكاة مفتوح المصدر للقيادة الذاتية يشتمل على LLM الذي طورته شركة Nvidia، ويسمى Dolphin؛ بحث خارجي بأربع عجلات يسمى Jackal، والذي يستخدم LLM GPT-4o من OpenAI للتخطيط؛ وكلب آلي يُدعى Go2، والذي يستخدم نموذج OpenAI السابق، GPT-3.5، لتفسير الأوامر.

    استخدم الباحثون تقنية تم تطويرها في جامعة بنسلفانيا، تسمى PAIR، لأتمتة عملية مطالبات كسر الحماية التي تم إنشاؤها. سيقوم برنامجهم الجديد، RoboPAIR، بإنشاء مطالبات مصممة خصيصًا لجعل الروبوتات التي تعمل بتقنية LLM تكسر قواعدها الخاصة، وتجرب مدخلات مختلفة ثم تنقحها لدفع النظام نحو سوء السلوك. ويقول الباحثون إن التقنية التي ابتكروها يمكن استخدامها لأتمتة عملية تحديد الأوامر التي يحتمل أن تكون خطرة.

    يقول يي زينج، طالب الدكتوراه في جامعة فيرجينيا الذي يعمل في مجال أمن أنظمة الذكاء الاصطناعي: “إنه مثال رائع على نقاط الضعف في الأنظمة المتجسدة في ماجستير إدارة الأعمال”. يقول تشنغ إن النتائج ليست مفاجئة نظرًا للمشكلات التي تظهر في ماجستير إدارة الأعمال نفسها، لكنه يضيف: “إنها توضح بوضوح سبب عدم قدرتنا على الاعتماد فقط على حاملي ماجستير إدارة الأعمال كوحدات تحكم مستقلة في التطبيقات الحساسة للسلامة دون حواجز حماية مناسبة وطبقات اعتدال”.

    يقول الباحثون المشاركون إن عمليات “كسر الحماية” للروبوت تسلط الضوء على خطر أوسع من المرجح أن ينمو مع تزايد استخدام نماذج الذكاء الاصطناعي كوسيلة للبشر للتفاعل مع الأنظمة المادية، أو لتمكين عملاء الذكاء الاصطناعي بشكل مستقل على أجهزة الكمبيوتر.

    شاركها. فيسبوك تويتر بينتيريست تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    رفعت شرطة نيويورك دعوى قضائية ضد السجلات المحتملة التي تم جمعها من خلال برنامج التجسس الإسلامي

    تقنية الثلاثاء 23 ديسمبر 5:59 م

    محتالو العملات المشفرة الصينيون على Telegram يغذون أكبر أسواق الشبكة المظلمة على الإطلاق

    تقنية الثلاثاء 23 ديسمبر 2:55 م

    الكرات الكبيرة كانت مجرد البداية

    تقنية الثلاثاء 23 ديسمبر 1:54 م

    مراجعة: كمبيوتر الألعاب iBuyPower RDY Slate 9MP R01

    تقنية الثلاثاء 23 ديسمبر 12:53 م

    يمكن لروبوتات الدردشة التابعة لـ Google وOpenAI تجريد النساء من الصور وصولاً إلى البيكينيات

    تقنية الثلاثاء 23 ديسمبر 11:52 ص

    وافقت إدارة الغذاء والدواء الأمريكية على إصدار حبوب منع الحمل من Wegovy

    تقنية الثلاثاء 23 ديسمبر 12:42 ص
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    المزيد

    إحباط مخطط إرهابي لداعش يستهدف يهود المملكة المتحدة في مانشستر، وإدانة 3 رجال

    الثلاثاء 23 ديسمبر 6:26 م

    أسامة ربيع: 12 مليار دولار خسائر قناة السويس بسبب الحرب علي غزة

    الثلاثاء 23 ديسمبر 6:21 م

    من مسقط إلى القاهرة.. شراكات صناعية وموانئ مشتركة ترسم مسارًا جديدًا للتكامل المصري-العُماني

    الثلاثاء 23 ديسمبر 6:15 م

    إحالة أوراق المتهم بخطف صغيرة وهتك عرضها بالبحيرة للمفتي

    الثلاثاء 23 ديسمبر 6:09 م

    الفنان أحمد رفعت: أنا مش بشرب والوسط الفني كله شلليلة ومحسوبية

    الثلاثاء 23 ديسمبر 6:02 م

    النشرة البريدية

    اشترك في النشرة البريدية ليصلك كل جديد على بريدك الإلكتروني مباشرة

    رائج هذا الأسبوع

    رفعت شرطة نيويورك دعوى قضائية ضد السجلات المحتملة التي تم جمعها من خلال برنامج التجسس الإسلامي

    استخراج حبة لب من الشعب الهوائية لطفل بمستشفى الأطفال التخصصي في بنها

    أظهر تقرير وزارة التجارة الأمريكي أن الاقتصاد الأمريكي نما بنسبة 4.3% في الربع الثالث

    مكتب أطباء السودان: نشهد كارثة إنسانية مفتوحة بسبب استمرار القتال

    فيلم العطلات الأكثر كرهًا في أمريكا والفيلم المفضل لعام 2025: استطلاع

    اعلانات
    Demo
    فيسبوك X (Twitter) الانستغرام يوتيوب تيلقرام
    2025 © نجمة الخليج. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟