يكشف تفكيك النسخة الأحدث من تطبيق Google على أندرويد أن Gemini Live يستعد للحصول على مجموعة ترقيات كبيرة، في مقدمتها وضع جديد باسم Live Thinking Mode وحزمة Live Experimental Features ضمن قسم Labs داخل التطبيق. 

يعرف الكود الداخلي Live Thinking Mode بأنه “نسخة من Gemini Live تستغرق وقتًا أطول للتفكير وتقديم ردود أكثر تفصيلًا”، ما يشير إلى انتقال التجربة الصوتية من الاعتماد الحالي على نموذج Gemini 2.5 Flash إلى نماذج Gemini 3 الأثقل مثل Thinking أو Pro للحصول على إجابات أعمق.

أما Live Experimental Features فتوصف بأنها “أحدث الميزات المتقدمة” وتضم قدرات مثل الذاكرة متعددة الوسائط (multimodal memory)، وتحسين التعامل مع الضوضاء، والقدرة على الاستجابة عندما يرى النظام شيئًا ما، إضافة إلى نتائج مخصّصة اعتمادًا على تطبيقات جوجل وبيانات المستخدم المتصلة.

 يشير التقرير إلى أن هذه القدرات هي نفسها تقريبًا التي تقدمها تجربة الدردشة مع Gemini 3 Flash وPro، بما في ذلك ما يعرف بـ Personal Intelligence عبر التطبيقات المتصلة وسجل المحادثات السابق.

تحضير لوصول Gemini Agent وميزات التحكم بالهاتف

تتضمن التسريبات في النسخة 17.2 من تطبيق Google أيضًا مختبرين إضافيين داخل Gemini Live:

UI Control: بوصف نصّي يقول إن “الوكيل يتحكم بالهاتف لإكمال المهام”، في إشارة إلى قدرة Gemini Agent على تنفيذ إجراءات مباشرة على واجهة أندرويد مثل فتح التطبيقات أو تغيير الإعدادات.

Deep Research: مع وصف “تفويض مهام بحث معقدة”، ما يوحي بوضع يتيح لـ Gemini تنفيذ سلاسل بحث وتحليل متعددة الخطوات نيابة عن المستخدم.

يربط التقرير بين هذه الإشارات وما تعمل عليه جوجل في ميزة Computer Use ضمن إصدارات Android 16 QPR3، والتي تهدف إلى تمكين الذكاء الاصطناعي من التحكم شبه الكامل بالهاتف لتنفيذ مهام مطوّلة دون تدخل يدوي في كل خطوة. 

ورغم عدم وضوح الشكل النهائي لـ Deep Research حتى الآن، فإن ظهوره جنبًا إلى جنب مع UI Control يعزز التوقعات بقرب وصول Gemini Agent إلى أندرويد كميزة رسمية داخل Gemini Live.

ترقية من Gemini 2.5 Flash إلى Gemini 3

يؤكد التقرير أن Gemini Live حاليًا مبني على نموذج Gemini 2.5 Flash، وهو نسخة خفيفة وسريعة مخصصة للاستجابات الفورية في المحادثات الصوتية. 

لكن وجود أوضاع مثل Live Thinking Mode وLive Experimental Features داخل Labs يوحي بأن جوجل تستعد لاستخدام نماذج Gemini 3 الأحدث في الخلفية، على الأقل عند تفعيل هذه الأوضاع الاختيارية، لتحقيق توازن بين سرعة الاستجابة وعمق وتحليل الإجابات.

بعض القدرات المذكورة – مثل الاستجابة لما “تراه” الكاميرا أو التعامل الأفضل مع الضوضاء في البيئة المحيطة – قد ترتبط مباشرة بمشروع Project Astra، وهو مشروع سابق من جوجل لدمج الفهم متعدد الوسائط (صوت، صورة، سياق مكاني) في مساعد واحد أكثر ذكاءً. 

ومع أن جوجل لم تعلن بعد رسميًا عن هذه الأوضاع داخل Gemini Live للمستخدمين، فإن وجود سلاسل النصوص الكاملة في الكود يعكس أن التجربة باتت في مرحلة متقدمة من التطوير.

شاركها.
اترك تعليقاً

Exit mobile version