Close Menu
نجمة الخليجنجمة الخليج

    رائج الآن

    عبلة سلامة تتصدر التريند مع كندة علوش بعد تصريحاتها الأخيرة

    الأحد 21 ديسمبر 3:48 م

    انتقدت أمي على بيان الحضانة

    الأحد 21 ديسمبر 3:47 م

    من هو بوب تشيسني؟ تعرف على مدرب كرة القدم جيمس ماديسون

    الأحد 21 ديسمبر 3:46 م
    فيسبوك X (Twitter) الانستغرام
    نجمة الخليجنجمة الخليج
    • الاخبار
    • العالم
    • سياسة
    • اسواق
    • تقنية
    • رياضة
    • صحة
    • منوعات
    • المزيد
      • سياحة وسفر
      • مشاهير
      • مقالات
              
    الأحد 21 ديسمبر 3:52 م
    رائج الآن
    • #الإنتخابات_التركية
    • حرب اوكرانيا
    • موسم الحج
    • السعودية 2030
    • دونالد ترامب
    نجمة الخليجنجمة الخليج
    الرئيسية»تقنية
    تقنية

    يتفوق نموذج الأنثروبور الجديد في التفكير والتخطيط – ولديه مهارات بوكيمون لإثبات ذلك

    فريق التحريرفريق التحريرالخميس 22 مايو 10:25 ملا توجد تعليقات

    عندما لعب كلود 3.7 Sonnet اللعبة ، واجهت بعض التحديات: لقد أمضت “عشرات الساعات” عالقة في مدينة واحدة وتواجه مشكلة في تحديد الشخصيات غير اللاعبين ، مما أدى إلى توقف تقدمه بشكل كبير في اللعبة. مع Claude 4 Opus ، لاحظ هيرشي تحسنًا في قدرات كلود على المدى الطويل وقدرات التخطيط عندما شاهدها وهي تتنقل في مسعى بوكيمون معقد. بعد إدراك أنها تحتاج إلى قوة معينة للمضي قدمًا ، أمضت الذكاء الاصطناعى يومين في تحسين مهاراتها قبل الاستمرار في اللعب. يعتقد هيرشي أن هذا النوع من التفكير متعدد الأطراف ، مع عدم وجود ردود فعل فورية ، يظهر مستوى جديدًا من التماسك ، مما يعني أن النموذج لديه قدرة أفضل على المسار الصحيح.

    يقول هيرشي: “هذه واحدة من طرقي المفضلة للتعرف على نموذج. مثل ، هكذا أفهم ما هي نقاط قوته ، وما هي نقاط ضعفها”. “إنها طريقتي للوصول إلى هذا النموذج الجديد الذي نحن على وشك طرحه ، وكيفية العمل معه.”

    الجميع يريد وكيل

    يعد Research Pokémon الخاص بشهر الأنثروبور بمثابة نهج جديد لمعالجة مشكلة موجودة مسبقًا – كيف نفهم القرارات التي تتخذها الذكاء الاصطناعى عند الاقتراب من المهام المعقدة ، ويدفعها في الاتجاه الصحيح؟

    إن الإجابة على هذا السؤال جزء لا يتجزأ من تقدم وكلاء الذكاء الاصطناعى في الصناعة-AAI التي يمكنها معالجة المهام المعقدة مع الاستقلال النسبي. في بوكيمون ، من المهم ألا يفقد النموذج السياق أو “نسيان” المهمة المطروحة. ينطبق ذلك أيضًا على وكلاء الذكاء الاصطناعى الذين طلبوا أتمتة سير العمل – حتى يستغرق مئات الساعات.

    يقول هيرشي: “نظرًا لأن المهمة تنتقل من كونها مهمة مدتها خمس دقائق إلى مهمة مدتها 30 دقيقة ، يمكنك أن ترى قدرة النموذج على الحفاظ على تماسك ، لتذكر كل الأشياء التي يحتاجها لإنجاز (المهمة) بنجاح مع مرور الوقت”.

    وتأمل الأنثروبور ، مثل العديد من مختبرات الذكاء الاصطناعي ، في إنشاء وكلاء قويين للبيع كمنتج للمستهلكين. يقول كريجر إن “أفضل الهدف” للأنثروبور هذا العام هو “القيام بساعات من العمل من أجلك”.

    يقول كريجر ، في إشارة إلى عملية إعادة هيكلة كمية كبيرة من التعليمات البرمجية: “هذا النموذج يقدمه الآن-لقد رأينا أن أحد عملائنا في وقت مبكر من الوصول إلى النموذج ينفجر لمدة سبع ساعات ويقومون بإعادة صياغة كبيرة” ، في إشارة إلى عملية إعادة هيكلة كمية كبيرة من التعليمات البرمجية ، غالبًا لجعلها أكثر كفاءة وتنظيمًا.

    هذا هو المستقبل الذي تعمل فيه شركات مثل Google و Openai. في وقت سابق من هذا الأسبوع ، أصدرت Google Mariner ، وكيل الذكاء الاصطناعي المدمج في كروم يمكنه القيام بمهام مثل شراء البقالة (مقابل 249.99 دولار شهريًا). أصدرت Openai مؤخراً وكيل ترميز ، وبعد بضعة أشهر من المشغل الذي تم إطلاقه ، وهو وكيل يمكنه تصفح الويب نيابة عن المستخدم.

    مقارنةً بمنافسيها ، يُنظر إلى الأنثروبور غالبًا على أنه المحرك الأكثر حذراً ، حيث يسير بسرعة في البحث ولكنه أبطأ في النشر. ومع الذكاء الاصطناعى القوي ، من المحتمل أن يكون هذا إيجابيًا: هناك الكثير الذي قد يحدث خطأ مع وكيل لديه إمكانية الوصول إلى معلومات حساسة مثل تسجيل الدخول إلى البريد الوارد للمستخدم أو تسجيل الدخول إلى البنك. في منشور مدونة يوم الخميس ، يقول الأنثروبور ، “لقد قللنا بشكل كبير من السلوك حيث تستخدم النماذج اختصارات أو ثغرات لإكمال المهام”. تقول الشركة أيضًا أن كلا من كلود 4 أوبوس وكلود سونيت 4 أقل عرضة بنسبة 65 في المائة للانخراط في هذا السلوك ، والمعروفة باسم مكافأة القرصنة ، من النماذج السابقة – على الأقل في مهام الترميز.

    شاركها. فيسبوك تويتر بينتيريست تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    يكشف البحث عن الطريقة المثلى للتحسين

    تقنية الأحد 21 ديسمبر 2:03 م

    أفضل الشاشات لجهاز Mac Mini

    تقنية الأحد 21 ديسمبر 1:02 م

    ما هو الصوت الذي لا يفقد البيانات، وهل تحتاج إليه حقًا؟

    تقنية الأحد 21 ديسمبر 12:01 م

    Gear News of the Week: أطلقت LG لأول مرة تلفزيون RGB LED، وGoogle توفر Find Hub لنظام التشغيل Wear OS

    تقنية السبت 20 ديسمبر 3:41 م

    7 نصائح مفيدة لأي شخص يتصل بشبكة Wi-Fi عامة

    تقنية السبت 20 ديسمبر 2:40 م

    سرق المتسللون بيانات الملايين من مستخدمي PornHub بغرض الابتزاز

    تقنية السبت 20 ديسمبر 1:39 م
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    المزيد

    انتقدت أمي على بيان الحضانة

    الأحد 21 ديسمبر 3:47 م

    من هو بوب تشيسني؟ تعرف على مدرب كرة القدم جيمس ماديسون

    الأحد 21 ديسمبر 3:46 م

    أمين تنظيم حزب الجيل: كلمة الرئيس في منتدى «روسيا–أفريقيا» ترسخ رؤية مصر للتنمية الشاملة بالقارة

    الأحد 21 ديسمبر 3:40 م

    جنوب أفريقيا: هجوم مسلح على حانة يخلف 9 قتلى و10 جرحى

    الأحد 21 ديسمبر 3:36 م

    عبد العاطي: لا خلافات لمصر مع دول حوض النيل سوى واحدة.. ومنفتحون على التعاون وتعديل الاتفاق الإطاري

    الأحد 21 ديسمبر 3:32 م

    النشرة البريدية

    اشترك في النشرة البريدية ليصلك كل جديد على بريدك الإلكتروني مباشرة

    رائج هذا الأسبوع

    رئيس الوزراء يتابع الموقف التنفيذي لمشروعات تطوير قطاع الغزل والنسيج

    مران الأهلي .. الفريق يبدأ الاستعداد لمباراة غزل المحلة

    جهاز تنظيم إدارة المخلفات يناقش آليات ضمان جودة الكمبوست فى مصر

    إطلاق خطوط مواصلات مجانية لخدمة رواد “مركز الإسماعيلية التجاري” الجديد

    محافظ الفيوم: الانتهاء من تنفيذ 969 مشروعاً ضمن مبادرة حياة كريمة

    اعلانات
    Demo
    فيسبوك X (Twitter) الانستغرام يوتيوب تيلقرام
    2025 © نجمة الخليج. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟