شركة الذكاء الاصطناعي الصينية SenseTime الخاضعة للعقوبات تطلق نموذجًا مصورًا مصممًا للسرعة

SenseTime، صيني أصدرت شركة الذكاء الاصطناعي المعروفة بتكنولوجيا التعرف على الوجه، نموذجًا جديدًا مفتوح المصدر يوم الثلاثاء تدعي أنه يمكنه إنشاء وتفسير الصور بشكل أسرع بكثير من النماذج العليا التي طورها المنافسون الأمريكيون. يمكن أن يساعد SenseNova U1 الشركة في استعادة الأرض المفقودة بعد أن تراجعت عن مكانتها بين اللاعبين الرئيسيين في سباق تطوير الذكاء الاصطناعي في الصين.

والخلطة السرية لهذا النموذج هي قدرته على “قراءة” الصور دون ترجمتها إلى نص أولاً، مما يؤدي إلى تسريع العملية وتقليل مقدار الطاقة الحاسوبية المطلوبة. قال داهوا لين، المؤسس المشارك وكبير العلماء في SenseTime، في مقابلة مع WIRED: “لم تعد عملية الاستدلال الخاصة بالنموذج بأكملها مقتصرة على النص. يمكنها الاستدلال باستخدام الصور أيضًا”.

ويقول لين، وهو أيضًا أستاذ هندسة المعلومات في جامعة هونغ كونغ الصينية، إن النماذج القادرة على معالجة الصور مباشرة ستمكن الروبوتات من فهم العالم المادي بشكل أفضل في المستقبل.

مثل أحدث طراز رائد من DeepSeek، تقول SenseTime إن U1 يمكن تشغيله بواسطة شرائح صينية الصنع. يقول لين: “لقد انتهى العديد من صانعي الرقائق المحليين الصينيين من تحسين التوافق مع نموذجنا الجديد”. في يوم الإصدار، أعلن 10 مصممي شرائح صينيين، بما في ذلك Cambricon وBiren Technology، عن أجهزتهم التي تدعم U1.

وهذه المرونة مهمة لأن ضوابط التصدير الأمريكية تقيد الشركات الصينية من الوصول إلى رقائق الذكاء الاصطناعي الأكثر تقدما في العالم، وخاصة تلك المستخدمة للتدريب، والتي يتم تطويرها في هذه المرحلة في المقام الأول من قبل شركات غربية مثل نفيديا. يقول لين: “سنواصل الضغط من أجل التدريب على المزيد من الرقائق المختلفة”. لكنه يقر أيضًا بأن SenseTime “ربما لا يزال بحاجة إلى استخدام أفضل الرقائق لضمان سرعة التكرار”.

أصدرت SenseTime تطبيق U1 مجانًا على Hugging Face وGitHub، وهي علامة أخرى على أن الشركات الصينية أصبحت من أكثر المساهمين نشاطًا في الذكاء الاصطناعي مفتوح المصدر.

تأسست شركة SenseTime في عام 2014 وأصبحت رائدة عالميًا في مجال الرؤية الحاسوبية، والتي تُستخدم في تطبيقات مثل التعرف على الوجه والقيادة الذاتية. ولكن عندما أصبح ChatGPT وأنظمة الذكاء الاصطناعي الأخرى المدعومة بمعالجة اللغة الطبيعية هي الشيء الأكثر رواجًا في صناعة التكنولوجيا، بدأت SenseTime تكافح من أجل تحقيق الربح وتخلفت عن الشركات الناشئة الصينية الأحدث مثل DeepSeek وMiniMax.

تقول SenseTime إنها تأمل أن يساعد إطلاق SenseNova-U1 علنًا ليستخدمه أي شخص في اللحاق بلاعبي الذكاء الاصطناعي المحليين والغربيين. يقول لين إن الشركة اتخذت أخيرًا قرارًا في العام الماضي بالتركيز على المصادر المفتوحة بسبب التعليقات المفيدة التي تتلقاها من الباحثين، والتي تمكن الشركة من التكرار بشكل أسرع. “في هذا اليوم وهذا العصر، كون المصدر مفتوحًا أو مغلقًا ليس هو العامل الفائز، بل سرعة التكرار،” يوضح لين.

كما يساعد التحول إلى المصدر المفتوح SenseTime على مواصلة التعاون مع الباحثين الدوليين دون تدخل الجغرافيا السياسية. وقد فرضت الحكومة الأمريكية عقوبات على الشركة مرارًا وتكرارًا في السنوات الأخيرة بسبب مزاعم بأن تقنية التعرف على الوجه الخاصة بها ساعدت في تشغيل أنظمة المراقبة المستخدمة لرصد واحتجاز الأويغور ومجموعات الأقليات الأخرى في منطقة شينجيانغ الصينية. ونتيجة لذلك، يُمنع على الشركات الأمريكية الاستثمار في SenseTime وبيع تقنيات معينة لها دون ترخيص. (نفى SenseTime هذه المزاعم).

الرؤية بوضوح

وفي تقرير فني مصاحب، تدعي SenseTime أن SenseNova-U1 يولد صورًا ذات جودة أعلى من جميع النماذج مفتوحة المصدر الأخرى الموجودة حاليًا في السوق. يمكن مقارنة أدائها بالنماذج الصينية الرائدة مغلقة المصدر مثل Qwen من Alibaba وSeedream من ByteDance، لكنها لا تزال متخلفة عن رواد الصناعة مثل GPT-Image-2.0، الذي صدر قبل أسبوع واحد فقط.

لكن نقطة البيع الرئيسية للنموذج هي قدرته على توليد الصور بشكل أسرع بكثير من كل تلك النماذج. وهو يعتمد على بنية تقنية مبتكرة تسمى NEO-Unify والتي قام SenseTime بمعاينتها في وقت سابق من هذا العام.