تستعد شركة أمازون لإعادة إطلاق مساعدها الرقمي Alexa الذي يعمل بالصوت باعتباره “وكيلًا” للذكاء الاصطناعي يمكنه إكمال المهام العملية، حيث تتسابق مجموعة التكنولوجيا لحل التحديات التي أعاقت إصلاح الذكاء الاصطناعي للنظام.

سعت الشركة التي تبلغ قيمتها 2.4 تريليون دولار على مدى العامين الماضيين إلى إعادة تصميم أليكسا، نظام المحادثة الخاص بها المدمج في 500 مليون جهاز استهلاكي في جميع أنحاء العالم، بحيث يتم زرع “عقل” البرنامج باستخدام الذكاء الاصطناعي التوليدي.

وقال روهيت براساد، الذي يقود فريق الذكاء الاصطناعي العام (AGI) في أمازون، لصحيفة فايننشال تايمز إن المساعد الصوتي لا يزال بحاجة للتغلب على العديد من العقبات التقنية قبل بدء التشغيل.

ويشمل ذلك حل مشكلة “الهلوسة” أو الإجابات الملفقة، وسرعة استجابتها أو “كمونها”، ووثوقيتها. وقال براساد: “يجب أن تكون الهلوسة قريبة من الصفر”. “إنها لا تزال مشكلة مفتوحة في الصناعة، ولكننا نعمل بجد على حلها.”

وتتلخص رؤية قادة أمازون في تحويل أليكسا، الذي لا يزال يُستخدم حالياً لمجموعة ضيقة من المهام البسيطة مثل تشغيل الموسيقى وضبط المنبهات، إلى منتج “وكيل” يعمل بمثابة بواب شخصي. يمكن أن يشمل ذلك أي شيء بدءًا من اقتراح المطاعم وحتى ضبط الأضواء في غرفة النوم بناءً على دورات نوم الشخص.

كانت إعادة تصميم Alexa قيد التنفيذ منذ إطلاق ChatGPT من OpenAI، بدعم من Microsoft، في أواخر عام 2022. وبينما قامت Microsoft وGoogle وMeta وغيرها بسرعة بدمج الذكاء الاصطناعي التوليدي في منصات الحوسبة الخاصة بهم وتعزيز خدماتهم البرمجية، تساءل النقاد عما إذا كانت أمازون قادرة على ذلك حل صراعاتها الفنية والتنظيمية في الوقت المناسب للتنافس مع منافسيها.

وفقًا للعديد من الموظفين الذين عملوا في فرق المساعد الصوتي في أمازون في السنوات الأخيرة، فإن جهودها كانت تعاني من التعقيدات وتأتي بعد سنوات من البحث والتطوير في مجال الذكاء الاصطناعي.

قال العديد من العاملين السابقين إن الانتظار الطويل لبدء التشغيل يرجع إلى حد كبير إلى الصعوبات غير المتوقعة التي ينطوي عليها التبديل والجمع بين الخوارزميات الأبسط والمحددة مسبقًا التي بنيت عليها Alexa، مع نماذج لغوية كبيرة أكثر قوة ولكن لا يمكن التنبؤ بها.

ورداً على ذلك، قالت أمازون إنها “تعمل جاهدة لتمكين مساعدة أكثر استباقية وقدرة” لمساعدها الصوتي. وأضافت أن التنفيذ الفني لهذا النطاق، في خدمة حية ومجموعة من الأجهزة التي يستخدمها العملاء في جميع أنحاء العالم، كان غير مسبوق، ولم يكن بهذه البساطة مثل تراكب شهادة LLM على خدمة Alexa.

قال براساد، كبير المهندسين السابق لشركة Alexa، إن إطلاق نماذج Amazon Nova الداخلية للشركة الشهر الماضي – بقيادة فريق AGI الخاص به – كان مدفوعًا جزئيًا بالاحتياجات المحددة للسرعة والتكلفة والموثوقية المثلى، من أجل مساعدة الذكاء الاصطناعي. تطبيقات مثل Alexa “تصل إلى الميل الأخير، وهو أمر صعب حقًا”.

وقال براساد إنه لكي يعمل كوكيل، يجب أن يكون “عقل” Alexa قادرًا على الاتصال بمئات من برامج وخدمات الطرف الثالث.

“في بعض الأحيان نقلل من عدد الخدمات المدمجة في Alexa، وهو رقم هائل. تتلقى هذه التطبيقات مليارات الطلبات أسبوعيًا، لذلك عندما تحاول تنفيذ إجراءات موثوقة بسرعة. . . وأضاف: “يجب أن تكون قادرًا على القيام بذلك بطريقة فعالة من حيث التكلفة”.

يأتي التعقيد من مستخدمي Alexa الذين يتوقعون استجابات سريعة بالإضافة إلى مستويات عالية للغاية من الدقة. تتعارض هذه الصفات مع الطبيعة الاحتمالية المتأصلة للذكاء الاصطناعي التوليدي اليوم، وهو برنامج إحصائي يتنبأ بالكلمات بناءً على أنماط الكلام واللغة.

ويشير بعض الموظفين السابقين أيضًا إلى الصعوبات التي يواجهونها للحفاظ على سمات المساعد الأصلية، بما في ذلك اتساقه ووظيفته، مع إضفاء سمات توليدية جديدة عليه مثل الإبداع والحوار الحر.

ونظرًا للطبيعة الشخصية والثرثارة لبرامج LLM، تخطط الشركة أيضًا لتوظيف خبراء لتشكيل شخصية الذكاء الاصطناعي وصوته وإلقاءه بحيث يظل مألوفًا لمستخدمي Alexa، وفقًا لشخص مطلع على الأمر.

قال أحد كبار الأعضاء السابقين في فريق Alexa إنه على الرغم من أن ماجستير إدارة الأعمال (LLM) متطور للغاية، إلا أنه ينطوي على مخاطر، مثل إنتاج إجابات “تم اختراعها بالكامل في بعض الأحيان”.

وقالوا: “بالحجم الذي تعمل به أمازون، يمكن أن يحدث ذلك أعدادًا كبيرة من المرات يوميًا”، مما يضر بعلامتها التجارية وسمعتها.

في حزيران (يونيو)، قال ميهايل إريك، عالم التعلم الآلي السابق في شركة أليكسا والعضو المؤسس في “فريق النمذجة التحادثية”، علناً إن أمازون “أسقطت الكرة” عندما أصبحت “الشركة الرائدة بشكل لا لبس فيه في السوق في مجال الذكاء الاصطناعي التحادثي” مع أليكسا.

قال إريك إنه على الرغم من امتلاك الشركة موهبة علمية قوية وموارد مالية “ضخمة”، إلا أن الشركة كانت “مليئة بالمشاكل الفنية والبيروقراطية”، مما يشير إلى أن “البيانات كانت مشروحة بشكل سيئ” و”الوثائق كانت إما غير موجودة أو قديمة”.

وفقا لاثنين من الموظفين السابقين الذين يعملون على الذكاء الاصطناعي المرتبط بأليكسا، فإن التكنولوجيا التاريخية التي يقوم عليها المساعد الصوتي كانت غير مرنة ويصعب تغييرها بسرعة، ومثقلة بقاعدة تعليمات برمجية قديمة وغير منظمة وفريق هندسي “منتشر للغاية”.

كان برنامج Alexa الأصلي، المبني على التكنولوجيا التي تم الحصول عليها من شركة Evi البريطانية الناشئة في عام 2012، عبارة عن آلة للإجابة على الأسئلة تعمل من خلال البحث داخل عالم محدد من الحقائق للعثور على الاستجابة الصحيحة، مثل الطقس اليوم أو حالة معينة. أغنية في مكتبة الموسيقى الخاصة بك.

يستخدم Alexa الجديد مجموعة من نماذج الذكاء الاصطناعي المختلفة للتعرف على الاستفسارات الصوتية وترجمتها وإنشاء الاستجابات، بالإضافة إلى تحديد انتهاكات السياسة، مثل التقاط الاستجابات والهلوسة غير المناسبة. كان إنشاء برامج للترجمة بين الأنظمة القديمة ونماذج الذكاء الاصطناعي الجديدة بمثابة عقبة رئيسية في تكامل Alexa-LLM.

وتشمل النماذج برامج أمازون الداخلية، بما في ذلك أحدث موديلات نوفا، بالإضافة إلى كلود، نموذج الذكاء الاصطناعي من شركة أنثروبيك الناشئة، والتي استثمرت فيها أمازون 8 مليارات دولار على مدار الـ 18 شهرًا الماضية.

قال داريو أمودي، الرئيس التنفيذي لشركة أنثروبيك، لصحيفة فايننشال تايمز العام الماضي: “إن الأمر الأكثر تحديًا فيما يتعلق بعملاء الذكاء الاصطناعي هو التأكد من أنهم آمنون وموثوقون ويمكن التنبؤ بهم”.

يحتاج برنامج الذكاء الاصطناعي الشبيه بالوكيل إلى الوصول إلى النقطة “حيث . . . وأضاف: “يمكن للناس أن يثقوا بالفعل في النظام”. “بمجرد أن نصل إلى هذه النقطة، سنطلق هذه الأنظمة.”

وقال أحد الموظفين الحاليين إنه لا تزال هناك حاجة إلى مزيد من الخطوات، مثل تركيب مرشحات سلامة الأطفال واختبار عمليات التكامل المخصصة مع Alexa مثل الأضواء الذكية وجرس الباب Ring.

وأضاف الموظف: “الموثوقية هي المشكلة – جعلها تعمل بنسبة تقارب 100 في المائة من الوقت”. “لهذا السبب ترانا. . . أو تقوم Apple أو Google بالشحن ببطء وتدريجي.

قالت العديد من الأطراف الثالثة التي تعمل على تطوير “مهارات” أو ميزات لـ Alexa إنها غير متأكدة من موعد طرح الجهاز الجديد الذي يدعم الذكاء الاصطناعي وكيفية إنشاء وظائف جديدة له.

وقال توماس ليندغرين، المؤسس المشارك لشركة تطوير المحتوى السويدية Wanderword: “نحن في انتظار التفاصيل والتفاهم”. “عندما بدأنا العمل معهم، كانوا أكثر انفتاحًا. . . ثم مع مرور الوقت تغيروا.”

وقال شريك آخر إنه بعد فترة أولية من “الضغط” الذي مارسته أمازون على المطورين لبدء الاستعداد للجيل القادم من أليكسا، هدأت الأمور.

التحدي الدائم الذي يواجه فريق Alexa في أمازون – والذي تعرض لعمليات تسريح كبيرة للعمال في عام 2023 – هو كيفية كسب المال. وقال جاريد روش، المؤسس المشارك لمجموعة الذكاء الاصطناعي التوليدي OctoAI، إن اكتشاف كيفية جعل المساعدين “رخيصين بما يكفي لتشغيلهم على نطاق واسع” سيكون مهمة كبيرة.

وقال موظف سابق في Alexa إن الخيارات التي تتم مناقشتها تشمل إنشاء خدمة اشتراك جديدة في Alexa، أو الحصول على حصة من مبيعات السلع والخدمات.

وقال براساد إن هدف أمازون هو إنشاء مجموعة متنوعة من نماذج الذكاء الاصطناعي التي يمكن أن تكون بمثابة “اللبنات الأساسية” لمجموعة متنوعة من التطبيقات خارج نطاق Alexa.

قال براساد: “ما نرتكز عليه دائمًا هو العملاء والذكاء الاصطناعي العملي، فنحن لا نقوم بالعلم من أجل العلم”. “نحن نفعل هذا.” . . لتقديم القيمة والتأثير للعملاء، وهو الأمر الذي أصبح في عصر الذكاء الاصطناعي التوليدي هذا أكثر أهمية من أي وقت مضى لأن العملاء يريدون رؤية عائد على الاستثمار.

شاركها.
اترك تعليقاً

Exit mobile version