أعلنت شركة OpenAI هذا الأسبوع عن خدمة تتيح لأي شخص تقريبًا إنشاء نسخة مخصصة من ChatGPT، دون الحاجة إلى مهارات برمجية. تقترح الشركة أن المستخدمين قد يرغبون في إنشاء روبوت يعرف قواعد جميع ألعاب الطاولة، أو يعلم الأطفال الرياضيات، أو يمكنه تقديم نصائح الطهي. يمكن لـ GPTs، كما يطلق عليها OpenAI، أيضًا تنفيذ إجراءات بسيطة من خلال الاتصال بخدمات الإنترنت، على سبيل المثال البحث عبر رسائل البريد الإلكتروني أو طلب المنتجات من متجر عبر الإنترنت.

لا يمكنك أن تلوم OpenAI لمحاولتها البناء على النجاح الذي حققته ChatGPT. ولكن ربما لا يكون المزيد من روبوتات الدردشة هو ما نحتاجه؟

تطلق شركة Adept AI، وهي شركة ناشئة في سان فرانسيسكو أسسها خبراء في OpenAI وGoogle وDeepMind، اليوم وكيلًا تجريبيًا للذكاء الاصطناعي يعمل على أتمتة المهام الشائعة بطريقة أكثر تعقيدًا وربما قوية من روبوتات الدردشة مثل ChatGPT. بدلاً من الاقتصار على استخدام الخدمات عبر الإنترنت التي توفر واجهات برمجة التطبيقات (APIs) لجعلها في متناول البرامج، يحاول ACT-2 استخدام الكمبيوتر بشكل أشبه بالإنسان – من خلال فهم وحدات البكسل الموجودة على الشاشة ثم اتخاذ الإجراء للتحكم في المتصفح والإنترنت خدمات.

تُظهر العروض التوضيحية التي يقدمها Adept كيف يمكن استخدام ACT-2 للقيام بأشياء مثل جمع المعلومات من رسائل البريد الإلكتروني والمستندات لملء مطالبات التأمين، وإدخال المعلومات من الفواتير المرسلة عبر البريد الإلكتروني في برامج الحسابات مستحقة الدفع، والخروج بجولة سيرًا على الأقدام للمدينة من خلال التفاعل مع خرائط جوجل.

إن الطريقة التي يحاول بها ACT-2 استخدام واجهات المستخدم نفسها التي يستخدمها البشر تعد بجعله أكثر قدرة وتوسعًا. من الناحية النظرية، يمكن لهذا النهج أن يسمح لروبوت الدردشة بفعل أي شيء قد يفعله الشخص على هاتفه أو جهاز الكمبيوتر الخاص به. لكن العمل بهذه الطريقة يمثل أيضًا تحديًا أكبر للخوارزميات، وفي الوقت الحالي يجعل الوكيل أكثر عرضة للخطأ.

تحت الغطاء، يستخدم ACT-2 نموذجًا لغويًا كبيرًا يسمى Fuyu. إنه مشابه لتلك التي تشغل العديد من برامج الدردشة الآلية، ولكن مثل ChatGPT يمكنه التعامل مع كل من النصوص والصور (مما يجعله “نموذجًا متعدد الوسائط”). يقوم النموذج بتحليل ما يراه على شاشة الكمبيوتر ويحاول ترجمة الطلب الذي كتبه المستخدم إلى إجراءات مفيدة يجب على الروبوت اتخاذها. يستخدم Adept التعلم المعزز – وهي تقنية تستخدم لتعليم مهام الكمبيوتر بما في ذلك لعب ألعاب الطاولة وألعاب الفيديو – لتوجيه الذكاء الاصطناعي الخاص به حول كيفية أداء مهام مختلفة. يتضمن ذلك مشاهدة الكثير من البشر وهم يؤدون مهام محددة ويحاولون تحقيق أداء مماثل لنفسهم.

يقول ديفيد لوان، المؤسس والرئيس التنفيذي لشركة Adept ونائب الرئيس السابق للهندسة في OpenAI، إنه على الرغم من أن روبوتات الدردشة قد أذهلت الجميع بقدراتها، إلا أنه ثبت أنه من الصعب إقناع وكلاء الذكاء الاصطناعي بالعمل بشكل موثوق. لكنه يعتقد أن شركة Adept والآخرين يقتربون كثيرًا من حل هذه المشكلة.

يقول لوان عن عملاء اليوم، بما في ذلك عملاؤه: “هذا العام لم يكونوا موجودين هناك”. “أعتقد أن ما سيحدث هو أنه في العام المقبل ستكون هناك حرب عملاقة حول العملاء الذين ينجحون بالفعل.” تقوم شركة Adept في البداية بتصميم وكلاءها لأداء عدد محدود فقط من المهام المكتبية البسيطة ولكن الشائعة، وتقول إنهم أصبحوا الآن موثوقين بنسبة 95 بالمائة على الأقل، وهو ما يكفي لنشرهم تجاريًا في عدد قليل من الشركات.

يعد الوصول إلى هذا المستوى من الموثوقية للمهام الأولية المحدودة التي تم تصميم ACT-2 من أجلها إنجازًا كبيرًا. لسنوات عديدة، كانت هناك أدوات لأتمتة المهام المكتبية – ما يعرف بأتمتة العمليات الروبوتية – ولكن هذه الأدوات صعبة البناء وعرضة للكسر. إذا تمكن Adept وآخرون من استخدام الذكاء الاصطناعي لأتمتة الكثير من المهام بشكل موثوق، فقد يؤدي ذلك إلى إحداث تحول في العمل المكتبي وزيادة الإنتاجية.

إذا كان لوان على حق، فإن المعركة من أجل أتمتة أعمالك الروتينية الأكثر مملة يمكن أن تجعل حروب الدردشة الآلية في عام 2023 تبدو هادئة نسبيًا.

شاركها.
اترك تعليقاً

Exit mobile version