Close Menu
نجمة الخليجنجمة الخليج

    رائج الآن

    مقتــ.ـل وإصابة 20 شخصًا في إطلاق نار بالقرب من جوهانسبرج بجنوب إفريقيا

    الأحد 21 ديسمبر 5:23 ص

    يناقشه مجلس الشيوخ اليوم.. كيف يُسهم قانون منع الممارسات الاحتكارية في تعزيز بيئة الاستثمار؟

    الأحد 21 ديسمبر 5:16 ص

    «تعيين غير مُختص أشعل الأزمة».. عمرو الخشاب يروي تفاصيل استبعاده عن منتخب مصر قبل كأس العرب

    الأحد 21 ديسمبر 5:10 ص
    فيسبوك X (Twitter) الانستغرام
    نجمة الخليجنجمة الخليج
    • الاخبار
    • العالم
    • سياسة
    • اسواق
    • تقنية
    • رياضة
    • صحة
    • منوعات
    • المزيد
      • سياحة وسفر
      • مشاهير
      • مقالات
              
    الأحد 21 ديسمبر 5:29 ص
    رائج الآن
    • #الإنتخابات_التركية
    • حرب اوكرانيا
    • موسم الحج
    • السعودية 2030
    • دونالد ترامب
    نجمة الخليجنجمة الخليج
    الرئيسية»تقنية
    تقنية

    فشلت درجات السلامة في Deepseek كل اختبار ألقاه باحثين في AI chatbot

    فريق التحريرفريق التحريرالجمعة 31 يناير 10:17 ملا توجد تعليقات

    “لا تزال عمليات السجن السريعة تستمر ببساطة لأن التخلص منها تمامًا تقريبًا – مثل نقاط الضعف في التدفق المخزن المؤقت في البرمجيات (التي كانت موجودة لأكثر من 40 عامًا) أو عيوب حقن SQL في تطبيقات الويب (التي ابتليت بها فرق أمنية لأكثر من عقدين)” ، أليكس أخبر Polyakov ، الرئيس التنفيذي لشركة الأمن Adversa AI ، Wired في رسالة بريد إلكتروني.

    يجادل Sampath من Cisco بأن الشركات تستخدم المزيد من أنواع الذكاء الاصطناعى في تطبيقاتها ، يتم تضخيم المخاطر. يقول سامباث: “يبدأ الأمر في أن تصبح صفقة كبيرة عندما تبدأ في وضع هذه النماذج في أنظمة معقدة مهمة وتؤدي تلك السجون التي تؤدي فجأة إلى أشياء تزيد من المسؤولية ، وتزيد من مخاطر العمل ، وتزيد من جميع أنواع المشكلات للمؤسسات”.

    قام باحثو Cisco برسم 50 مطالبات تم اختيارها عشوائيًا لاختبار R1 Deepseek من مكتبة معروفة من مطالبات التقييم الموحدة المعروفة باسم Harmbench. اختبروا مطالبات من ست فئات هارسبنش ، بما في ذلك الضرر العام وجريمة الإنترنت والمعلومات الخاطئة والأنشطة غير القانونية. قاموا بالتحقيق في النموذج الذي يعمل محليًا على الآلات وليس من خلال موقع أو تطبيق Deepseek ، الذي يرسل بيانات إلى الصين.

    علاوة على ذلك ، يقول الباحثون إنهم شاهدوا أيضًا بعض النتائج المحتملة من اختبار R1 مع هجمات أكثر تشاركًا غير لغوية باستخدام أشياء مثل الأحرف السيريلية والبرامج النصية المصممة لتحقيق تنفيذ التعليمات البرمجية. لكن للاختبارات الأولية ، يقول سامباث ، أراد فريقه التركيز على النتائج التي تنبع من معيار معترف به عمومًا.

    تضمنت Cisco أيضًا مقارنات لأداء R1 ضد هاربينش يطالب بأداء النماذج الأخرى. والبعض الآخر ، مثل Meta's Llama 3.1 ، تعثرت بشدة مثل Deepseek's R1. لكن Sampath يؤكد على أن R1 Deepseek هو نموذج تفكير محدد ، والذي يستغرق وقتًا أطول لإنشاء إجابات ولكنه يتجول في عمليات أكثر تعقيدًا لمحاولة تحقيق نتائج أفضل. لذلك ، يجادل Sampath بأن أفضل مقارنة مع نموذج التفكير O1 من Openai ، والذي كان أداء أفضل من جميع النماذج التي تم اختبارها. (لم يستجب ميتا على الفور لطلب التعليق).

    يوضح Polyakov ، من Adversa AI ، أن Deepseek يبدو أنه يكتشف ويرفض بعض هجمات كسر السجن المعروفة ، قائلاً “يبدو أن هذه الاستجابات غالبًا ما يتم نسخها من مجموعة بيانات Openai”. ومع ذلك ، يقول Polyakov أنه في اختبارات شركته لأربعة أنواع مختلفة من عمليات السجن-من تلك اللغوية إلى الحيل القائمة على الكود-يمكن تجاوز قيود Deepeek بسهولة.

    يقول بولياكوف: “لقد عملت كل طريقة واحدة بلا عيب”. يقول: “ما هو أكثر إثارة للقلق هو أن هذه الأشياء ليست جديدة” صفر “في يوم صفر-كانت معروفة بشكل علني لسنوات” ، مدعيا أنه رأى أن النموذج يعمق أكثر مع بعض التعليمات حول المخدرات مما رأى أي شيء نموذج آخر إنشاء.

    “إن Deepseek هو مجرد مثال آخر على كيفية كسر كل نموذج – إنه مجرد مسألة جهد بذلها. قد يتم تصحيح بعض الهجمات ، لكن سطح الهجوم لا حصر له” ، يضيف Polyakov. “إذا لم تكن حمراء في تقوية الذكاء الاصطناعي بشكل مستمر ، فأنت تعرض للخطر بالفعل.”

    شاركها. فيسبوك تويتر بينتيريست تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    Gear News of the Week: أطلقت LG لأول مرة تلفزيون RGB LED، وGoogle توفر Find Hub لنظام التشغيل Wear OS

    تقنية السبت 20 ديسمبر 3:41 م

    7 نصائح مفيدة لأي شخص يتصل بشبكة Wi-Fi عامة

    تقنية السبت 20 ديسمبر 2:40 م

    سرق المتسللون بيانات الملايين من مستخدمي PornHub بغرض الابتزاز

    تقنية السبت 20 ديسمبر 1:39 م

    خطة إنقاذ الزراعة التي قام بها ترامب تنفر قاعدة MAHA الخاصة به

    تقنية السبت 20 ديسمبر 12:38 م

    25 عرضًا من عروض Amazon Super Saturday على هدايا اللحظة الأخيرة التي اختبرناها (2025)

    تقنية السبت 20 ديسمبر 11:37 ص

    عروض وأكواد خصم Loop Earplugs: وفر على سماعات الأذن ومجموعات الهدايا

    تقنية السبت 20 ديسمبر 7:33 ص
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    المزيد

    يناقشه مجلس الشيوخ اليوم.. كيف يُسهم قانون منع الممارسات الاحتكارية في تعزيز بيئة الاستثمار؟

    الأحد 21 ديسمبر 5:16 ص

    «تعيين غير مُختص أشعل الأزمة».. عمرو الخشاب يروي تفاصيل استبعاده عن منتخب مصر قبل كأس العرب

    الأحد 21 ديسمبر 5:10 ص

    احذر .. الحبس سنة عقوبة التواجد داخل حرم السكة الحديد بقصد السرقة

    الأحد 21 ديسمبر 5:04 ص

    500 ألف نازح .. الداخلية الكمبودية تحذّر: الوضع على الحدود بالغ السوء

    الأحد 21 ديسمبر 4:58 ص

    التاريخ والأرقام تنحاز للفراعنة.. مدرب أنجولا السابق لـ منتخب مصر: احذروا هذا الثلاثي

    الأحد 21 ديسمبر 4:52 ص

    النشرة البريدية

    اشترك في النشرة البريدية ليصلك كل جديد على بريدك الإلكتروني مباشرة

    رائج هذا الأسبوع

    السائق تفحّم .. سقوط تريلا من أعلى دائري ترسا واشتعال النيران بها | شاهد

    ما يجب معرفته عن الموسم الرابع من مسلسل The White Lotus: من المواقع المحتملة إلى طاقم الممثلين المحتملين المرصع بالنجوم

    مواعيد مباريات كأس أمم إفريقيا 2025 .. تعرّف عليها

    محمد صبحي يكشف سر نجاحه: الفنان الذي يصمت يفقد وجوده قبل أن يبدأ |فيديو

    كاليفورنيا تغرق في الظلام .. 130 ألف منزل بدون كهرباء بـ «سان فرانسيسكو»

    اعلانات
    Demo
    فيسبوك X (Twitter) الانستغرام يوتيوب تيلقرام
    2025 © نجمة الخليج. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟