Close Menu
نجمة الخليجنجمة الخليج

    رائج الآن

    عفت نصار: الزمالك سيتوج بالدوري وبيراميدز في المركز الثاني

    الإثنين 06 أبريل 3:31 ص

    مستقبل كامافينجا مع ريال مدريد يثير الجدل

    الإثنين 06 أبريل 3:25 ص

    هل يمكن علاج مرض الكلى المزمن؟.. اعرف الحقيقة

    الإثنين 06 أبريل 3:13 ص
    فيسبوك X (Twitter) الانستغرام
    نجمة الخليجنجمة الخليج
    • الاخبار
    • العالم
    • سياسة
    • اسواق
    • تقنية
    • رياضة
    • صحة
    • منوعات
    • المزيد
      • سياحة وسفر
      • مشاهير
      • مقالات
              
    الإثنين 06 أبريل 3:33 ص
    رائج الآن
    • #الإنتخابات_التركية
    • حرب اوكرانيا
    • موسم الحج
    • السعودية 2030
    • دونالد ترامب
    نجمة الخليجنجمة الخليج
    الرئيسية»تقنية
    تقنية

    قابل وكيل الذكاء الاصطناعى مع شخصيات متعددة

    فريق التحريرفريق التحريرالأربعاء 16 أبريل 5:10 ملا توجد تعليقات

    في السنوات القادمة ، من المتوقع على نطاق واسع أن يتولى الوكلاء المزيد والمزيد من الأعمال نيابة عن البشر ، بما في ذلك استخدام أجهزة الكمبيوتر والهواتف الذكية. في الوقت الحالي ، رغم ذلك ، فهي عرضة للخطأ للغاية لاستخدامها كثيرًا.

    يجمع وكيل جديد يسمى S2 ، الذي تم إنشاؤه بواسطة بدء التشغيل Simular AI ، بين النماذج الحدودية والنماذج المتخصصة لاستخدام أجهزة الكمبيوتر. يحقق الوكيل أداءً أحدث في مهام مثل استخدام التطبيقات ومعالجة الملفات-ويشير إلى أن التحول إلى نماذج مختلفة في مواقف مختلفة قد يساعد الوكلاء على التقدم.

    يقول Ang Li ، المؤسس والرئيس التنفيذي لشركة Simular: “تختلف عوامل استخدام الكمبيوتر عن نماذج اللغة الكبيرة وتختلف عن الترميز”. “إنه نوع مختلف من المشكلة.”

    في نهج Simular ، يتم استخدام نموذج AI قوي للأغراض العامة ، مثل GPT-4O من Openai أو كلود 3.7 من Openai ، للتسبب في أفضل طريقة لإكمال المهمة في متناول اليد-في حين تدخل نماذج المصادر المفتوحة الأصغر في المهام مثل تفسير صفحات الويب.

    يوضح لي ، الذي كان باحثًا في Google DeepMind قبل تأسيس Simular في عام 2023 ، أن نماذج اللغة الكبيرة تتفوق في التخطيط ولكنها ليست جيدة في التعرف على عناصر واجهة المستخدم الرسومية.

    تم تصميم S2 للتعلم من التجربة مع وحدة ذاكرة خارجية تسجل الإجراءات وتعليقات المستخدمين وتستخدم تلك التسجيلات لتحسين الإجراءات المستقبلية.

    في المهام المعقدة بشكل خاص ، يعمل S2 أفضل من أي نموذج آخر على OSWorld ، وهو معيار يقيس قدرة الوكيل على استخدام نظام تشغيل الكمبيوتر.

    على سبيل المثال ، يمكن لـ S2 إكمال 34.5 في المائة من المهام التي تتضمن 50 خطوة ، متغلبًا على مشغل Openai ، والتي يمكن أن تكمل 32 في المائة. وبالمثل ، فإن S2 ينجم بنسبة 50 في المائة على Androidworld ، وهو معيار لوكلاء استخدام الهواتف الذكية ، في حين أن أفضل وكيل أفضل بنسبة 46 في المائة.

    يعتقد فيكتور تشونغ ، عالم الكمبيوتر في جامعة واترلو في كندا وأحد منشئو OSWorld ، أن نماذج الذكاء الاصطناعى المستقبلية قد تتضمن بيانات التدريب التي تساعدهم على فهم العالم البصري وفهم واجهات المستخدم الرسومية.

    يقول تشونغ: “هذا سيساعد الوكلاء على التنقل في واجهة المستخدم الرسومية بدقة أعلى بكثير”. “أعتقد أنه في غضون ذلك ، قبل هذه الاختراقات الأساسية ، ستشبه أحدث الأنظمة على أحدث طرازات من حيث أنها تجمع بين نماذج متعددة لتصحيح قيود النماذج المفردة.”

    للتحضير لهذا العمود ، استخدمت Simular لحجز الرحلات الجوية وحسن الأمازون في الصفقات ، ويبدو أنه أفضل من بعض وكلاء المصادر المفتوحة التي حاولت العام الماضي ، بما في ذلك Autogen و VIMGPT.

    ولكن حتى أذكى وكلاء الذكاء الاصطناعى ، على ما يبدو ، لا يزالون مضطربين بسبب حالات الحافة ويظهرون أحيانًا سلوكًا غريبًا. في إحدى الحالات ، عندما طلبت من S2 المساعدة في العثور على معلومات الاتصال للباحثين وراء OSWorld ، تعثر الوكيل في حلقة التنقل بين صفحة المشروع وتسجيل الدخول لخلاف OSWorld.

    تُظهر معايير OSWorld سبب بقاء الوكلاء ضجيجًا أكثر من الواقع في الوقت الحالي. في حين يمكن للبشر إكمال 72 في المائة من مهام OSWorld ، يتم إحباط الوكلاء بنسبة 38 في المائة من الوقت في المهام المعقدة. ومع ذلك ، عندما تم تقديم المعيار في أبريل 2024 ، يمكن لأفضل وكيل إكمال 12 في المائة فقط من المهام.

    شاركها. فيسبوك تويتر بينتيريست تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    الاختراق الذي كشف الإخفاقات الأمنية الكاسحة في سوريا

    تقنية الأحد 05 أبريل 1:55 م

    أفضل فرق ساعات Apple Watch لعام 2026: Nike وHermés والمزيد

    تقنية الأحد 05 أبريل 12:54 م

    مراجعة: Heatbit Maxi Bitcoin Miner and Heater

    تقنية الأحد 05 أبريل 11:53 ص

    تثبت ارتفاعات أسعار PS5 من سوني أن جيل وحدة التحكم هذا لم ينته بعد. جيد.

    تقنية الأحد 05 أبريل 10:52 ص

    مع وجود مليون نازح، يلجأ لبنان إلى المحافظ الرقمية للحصول على المساعدات

    تقنية الأحد 05 أبريل 9:51 ص

    يعد مسار مهمة Artemis II Moon بمثابة إنجاز هندسي

    تقنية السبت 04 أبريل 2:32 م
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    المزيد

    مستقبل كامافينجا مع ريال مدريد يثير الجدل

    الإثنين 06 أبريل 3:25 ص

    هل يمكن علاج مرض الكلى المزمن؟.. اعرف الحقيقة

    الإثنين 06 أبريل 3:13 ص

    رحلة كانتاس المتجهة إلى الولايات المتحدة تعود أدراجها بعد حالة طوارئ طبية في الجو

    الإثنين 06 أبريل 3:10 ص

    ما حكم سماع الرقية الشرعية أثناء النوم من الهاتف؟.. الإفتاء تجيب

    الإثنين 06 أبريل 3:06 ص

    سعر اقتصادي.. مواصفات سوزوكي ديزاير 2026 في السعودية| صور

    الإثنين 06 أبريل 3:00 ص

    النشرة البريدية

    اشترك في النشرة البريدية ليصلك كل جديد على بريدك الإلكتروني مباشرة

    رائج هذا الأسبوع

    انفجارات متعددة تهز طهران ومناطق جنوبية وشمالية من إيران

    تعظ سيارا ميلر من Summer House بأهمية “الأخوة” وسط كشف أماندا والرومانسية الغربية

    قُتلت أم شابة ومراهقة وطفل في مأساة صيد بيض عيد الفصح

    شبانة ينتقد تصريحات حسام غالي: عقد رعاية الأهلي يصل إلى 4 مليارات جنيه

    الموت يخطف عريس قبل الزفاف بأيام.. وخطيبته: كنت مستنية أشوفك ببدلة الفرح سبقتني بالكفن

    اعلانات
    Demo
    فيسبوك X (Twitter) الانستغرام يوتيوب تيلقرام
    2026 © نجمة الخليج. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟