Close Menu
نجمة الخليجنجمة الخليج

    رائج الآن

    سامسونج تكشف عن ثلاجة Bespoke ذكية مدعومة بتقنيات Google Gemini في CES 2025

    الأحد 21 ديسمبر 8:30 م

    ريجيم القرفة.. معلومات عن صَيحة إنقاص الوزن الجديدة

    الأحد 21 ديسمبر 8:22 م

    ملخص الشوط الأول.. منتخب المغرب يفشل في فك لغز دفاع جزر القمر

    الأحد 21 ديسمبر 8:13 م
    فيسبوك X (Twitter) الانستغرام
    نجمة الخليجنجمة الخليج
    • الاخبار
    • العالم
    • سياسة
    • اسواق
    • تقنية
    • رياضة
    • صحة
    • منوعات
    • المزيد
      • سياحة وسفر
      • مشاهير
      • مقالات
              
    الأحد 21 ديسمبر 8:35 م
    رائج الآن
    • #الإنتخابات_التركية
    • حرب اوكرانيا
    • موسم الحج
    • السعودية 2030
    • دونالد ترامب
    نجمة الخليجنجمة الخليج
    الرئيسية»تقنية
    تقنية

    لماذا يحاول نموذج الذكاء الاصطناعى الجديد في بعض الأحيان “snitch”

    فريق التحريرفريق التحريرالأربعاء 28 مايو 7:48 ملا توجد تعليقات

    يقول بومان إن السيناريوهات الافتراضية التي قدمها الباحثون على OPUS 4 والتي أثارت سلوك المبلغين عن المخالفات العديد من الأرواح البشرية على المحك وخطأ لا لبس فيه تمامًا. ومن الأمثلة النموذجية أن يكتشف كلود أن المصنع الكيميائي سمح عن علم بتسرب سام للاستمرار ، مما تسبب في مرض شديد لآلاف الأشخاص – فقط لتجنب خسارة مالية بسيطة في ذلك الربع.

    إنه أمر غريب ، ولكنه أيضًا نوع من تجربة التفكير التي يحبها باحثو سلامة الذكاء الاصطناعي تشريحها. إذا اكتشف النموذج السلوك الذي يمكن أن يضر المئات ، إن لم يكن الآلاف ، من الناس – فهل يتفجر الصافرة؟

    يقول بومان: “لا أثق في كلود في أن يكون لديك السياق الصحيح ، أو لاستخدامه بطريقة دقيقة وذات حذرة بما يكفي ، لإجراء مكالمات الحكم من تلقاء نفسها. لذلك نحن لسنا سعداء لأن هذا يحدث”. “هذا شيء ظهر كجزء من التدريب وقفز علينا كواحد من سلوكيات الحافة التي نشعر بالقلق”.

    في صناعة الذكاء الاصطناعي ، يشار إلى هذا النوع من السلوك غير المتوقع على نطاق واسع على أنه اختلال – عندما يعرض النموذج ميولًا لا تتماشى مع القيم الإنسانية. (هناك مقال مشهور يحذر من ما يمكن أن يحدث إذا تم إخبار الذكاء الاصطناعى ، على سبيل المثال ، بزيادة إنتاج الدبوسات الورقية دون أن تتوافق مع القيم الإنسانية – قد يحول الأرض بأكملها إلى دبوسات ورقية وتقتل الجميع في هذه العملية.) عندما سئل عن ما إذا كان سلوك المبلغين عن المخالفات أو عدمه ، وصفه بومان بأنه مثال على الخطية.

    ويوضح قائلاً: “إنه ليس شيئًا صممناه فيه ، وليس شيئًا أردنا رؤيته كنتيجة لأي شيء كنا نصممه”. يخبر جاريد كابلان كبير مسؤولي العلوم في الإنسان جاريد كابلان Wired أنه “بالتأكيد لا يمثل نيتنا”.

    هذا النوع من العمل يسلط الضوء على هذا يستطيع نشأت ، وأننا نحتاج إلى البحث عنها وتخفيفها للتأكد من أننا نتوافق مع سلوكيات كلود مع ما نريده بالضبط ، حتى في هذه الأنواع من السيناريوهات الغريبة “، يضيف كابلان.

    هناك أيضًا مسألة اكتشاف سبب “اختيار” كلود إلى Whistleblow عند تقديمه مع المستخدم غير القانوني من قبل المستخدم. هذا إلى حد كبير مهمة فريق التفسير في الإنسان ، والذي يعمل على اكتشاف القرارات التي يتخذها النموذج في عملية الإجابات. إنها مهمة صعبة بشكل مدهش – يتم دعم النماذج من خلال مجموعة واسعة ومعقدة من البيانات التي يمكن أن تكون غامضة للبشر. لهذا السبب ليس بومان متأكداً تمامًا من سبب “Snitched”.

    يقول بومان: “هذه الأنظمة ، ليس لدينا سيطرة مباشرة عليها”. ما لاحظته الأنثروبور حتى الآن هو أنه مع اكتساب النماذج قدرات أكبر ، فإنها تختار أحيانًا الانخراط في إجراءات أكثر تطرفًا. يقول بومان: “أعتقد هنا ، هذا يخطئ قليلاً. نحن نحصل على المزيد من” التصرف كما يفعل الشخص المسؤول “دون ما يكفي من مثل ،” انتظر ، أنت نموذج لغة ، والذي قد لا يكون لديه سياق كافٍ لاتخاذ هذه الإجراءات “.

    لكن هذا لا يعني أن كلود سوف ينفجر صافرة السلوك الفظيع في العالم الحقيقي. الهدف من هذه الأنواع من الاختبارات هو دفع النماذج إلى حدودها ومعرفة ما ينشأ. هذا النوع من الأبحاث التجريبية ينمو بشكل متزايد لأن الذكاء الاصطناعى يصبح أداة تستخدمها حكومة الولايات المتحدة والطلاب والشركات الضخمة.

    يقول بومان ، إنه ليس مجرد كلود قادرًا على عرض هذا النوع من السلوك المُخلى ، مشيرًا إلى مستخدمي X الذين وجدوا أن نماذج Openai و Xai تعمل بشكل مشابه عندما تتم مطالبتها بطرق غير عادية. (لم يستجب Openai لطلب التعليق في الوقت المناسب للنشر).

    “Snitch Claude” ، كما يحب Sheitposters أن نسميه ، هو ببساطة سلوك حالة الحافة التي يظهرها نظام تم دفعه إلى أقصى الحدود. يقول بومان ، الذي كان يلتقي بالاجتماع معي من فناء الفناء الخلفي المشمس خارج سان فرانسيسكو ، إنه يأمل أن يصبح هذا النوع من الاختبار معيارًا في الصناعة. ويضيف أيضًا أنه تعلم صياغة مشاركاته حول هذا الموضوع في المرة القادمة.

    يقول بومان وهو ينظر إلى المسافة: “كان بإمكاني القيام بعمل أفضل في ضرب حدود الجملة للتغريد ، لجعل الأمر أكثر وضوحًا أنه تم سحبه من الخيط”. ومع ذلك ، يلاحظ أن الباحثين المؤثرين في مجتمع الذكاء الاصطناعى يشاركون في أخذ الأسئلة والأسئلة استجابة لمشاركته. “بالمناسبة ، كان هذا النوع من الفوضى الفوضوية ، والأكثر هوية بشكل كبير من Twitter قد أسيء فهمه على نطاق واسع.”

    شاركها. فيسبوك تويتر بينتيريست تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    يكشف البحث عن الطريقة المثلى للتحسين

    تقنية الأحد 21 ديسمبر 2:03 م

    أفضل الشاشات لجهاز Mac Mini

    تقنية الأحد 21 ديسمبر 1:02 م

    ما هو الصوت الذي لا يفقد البيانات، وهل تحتاج إليه حقًا؟

    تقنية الأحد 21 ديسمبر 12:01 م

    Gear News of the Week: أطلقت LG لأول مرة تلفزيون RGB LED، وGoogle توفر Find Hub لنظام التشغيل Wear OS

    تقنية السبت 20 ديسمبر 3:41 م

    7 نصائح مفيدة لأي شخص يتصل بشبكة Wi-Fi عامة

    تقنية السبت 20 ديسمبر 2:40 م

    سرق المتسللون بيانات الملايين من مستخدمي PornHub بغرض الابتزاز

    تقنية السبت 20 ديسمبر 1:39 م
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    المزيد

    ريجيم القرفة.. معلومات عن صَيحة إنقاص الوزن الجديدة

    الأحد 21 ديسمبر 8:22 م

    ملخص الشوط الأول.. منتخب المغرب يفشل في فك لغز دفاع جزر القمر

    الأحد 21 ديسمبر 8:13 م

    ثروات غير مستغلة.. مصر تمتلك 17 معدنا نادرا وطفرة غير مسبوقة بقطاع التعدين

    الأحد 21 ديسمبر 8:07 م

    المدير التنفيذي لشركة Google يفكر في إبطاء الطلب على الذكاء الاصطناعي والطاقة في الولايات المتحدة

    الأحد 21 ديسمبر 8:01 م

    تعرف علي أبرز أرقام مواجهة انجولا وجنوب أفريقيا قبل موقعة أمم أفريقيا

    الأحد 21 ديسمبر 7:58 م

    النشرة البريدية

    اشترك في النشرة البريدية ليصلك كل جديد على بريدك الإلكتروني مباشرة

    رائج هذا الأسبوع

    شكل جذاب وطعم حلو .. طريقة عمل شوربة جزر بمذاق مميز

    يكشف نجوم “This Is Us” من حصل بالفعل على دعوة للانضمام إلى “Tracker” لجوستين هارتلي – ومن لا يزال ينتظر (حصريًا)

    قبل مواجهة زيمبابوي.. لميس الحديدي: لا صوت يعلو فوق دعم المنتخب

    وزير خارجية جنوب السودان: رسالة رئاسية إلى الرئيس السيسي لتكثيف التنسيق ودعم الشراكة الإفريقية

    ببلاش.. تردد القنوات الناقلة لبطولة كأس أمم إفريقيا

    اعلانات
    Demo
    فيسبوك X (Twitter) الانستغرام يوتيوب تيلقرام
    2025 © نجمة الخليج. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟