ومع ذلك ، لا يزال السعر الحقيقي لتطوير نماذج Deepseek غير معروف ، لأن رقم واحد مقتبس في ورقة بحث واحدة قد لا يلتقط الصورة الكاملة لتكاليفها. يقول Umesh Padval ، العضو المنتدب لشركة Thomvest Ventures ، وهي شركة استثمرت في Cohere وشركات الذكاء الاصطناعى: “لا أعتقد أن هذا هو 6 ملايين دولار ، ولكن حتى لو كان 60 مليون دولار ، فهو مغير للألعاب”. “سوف يضغط على ربحية الشركات التي تركز على AI المستهلك.”
بعد فترة وجيزة من كشف Deepseek عن تفاصيل نموذجها الأخير ، يقول Ghodsi of Databricks ، بدأ العملاء يسألون ما إذا كان بإمكانهم استخدامها بالإضافة إلى تقنيات Deepseek الأساسية لخفض التكاليف في مؤسساتهم الخاصة. ويضيف أن أحد الأساليب التي يستخدمها مهندسي Deepseek ، والمعروفة باسم التقطير ، والتي تنطوي على استخدام الإخراج من نموذج لغة كبير لتدريب نموذج آخر ، هو رخيص ومباشر نسبيًا.
يقول بادوفال إن وجود نماذج مثل ديبسيك سيفيد الشركات في النهاية التي تتطلع إلى إنفاق أقل على الذكاء الاصطناعي ، لكنه يقول إن العديد من الشركات قد يكون لها تحفظات على الاعتماد على نموذج صيني للمهام الحساسة. حتى الآن ، أعلنت شركة منظمة العفو الدولية البارزة على الأقل ، وهي في حيرة ، أنها تستخدم نموذج R1 الخاص بـ Deepseek ، لكنها تقول إنها يتم استضافتها “مستقلة تمامًا عن الصين”.
أخبر Amjad Massad ، الرئيس التنفيذي لشركة Repress ، وهي شركة ناشئة توفر أدوات ترميز الذكاء الاصطناعي ، Wired أنه يعتقد أن نماذج Deepseek الأخيرة رائعة. على الرغم من أنه لا يزال يجد نموذج Sonnet الخاص بشهر الأنثروبور أفضل في العديد من المهام الهندسية للكمبيوتر ، فقد وجد أن R1 جيد بشكل خاص في تحويل أوامر النص إلى رمز يمكن تنفيذه على جهاز كمبيوتر. ويضيف: “نحن نستكشف استخدامه خاصةً لتفكير الوكيل”.
إن أحدث عرضين لـ Deepseek-Deepseek R1 و Deepseek R1-Zero-قادران على نفس النوع من التفكير المحاكي مثل الأنظمة الأكثر تقدماً من Openai و Google. يعملون جميعًا من خلال تقسيم المشكلات إلى أجزاء مكونة من أجل معالجتها بشكل أكثر فعالية ، وهي عملية تتطلب قدرًا كبيرًا من التدريب الإضافي لضمان وصول الذكاء الاصطناعى بشكل موثوق إلى الإجابة الصحيحة.
تحدد ورقة نشرها باحثو Deepeek الأسبوع الماضي النهج الذي استخدمته الشركة لإنشاء نماذج R1 الخاصة بها ، والتي تدعي أنها تؤديها على بعض المعايير حول نموذج التفكير الرائد في Openai المعروف باسم O1. تتضمن Tactics Deepseek طريقة أكثر تلقائيًا لتعلم كيفية حل المشكلات بشكل صحيح بالإضافة إلى استراتيجية لنقل المهارات من نماذج أكبر إلى نماذج أصغر.
واحدة من أهم موضوعات التكهنات حول Deepseek هي الأجهزة التي قد تكون قد استخدمتها. وتجدر الإشارة إلى السؤال بشكل خاص لأن حكومة الولايات المتحدة قدمت سلسلة من ضوابط التصدير وغيرها من القيود التجارية على مدى السنوات القليلة الماضية تهدف إلى الحد من قدرة الصين على الحصول على وتصنيع الرقائق المتطورة المطلوبة لبناء الذكاء الاصطناعي المتقدم.
في ورقة بحثية من أغسطس 2024 ، أشار Deepseek إلى أنه يتمتع بإمكانية الوصول إلى مجموعة من 10000 من رقائق Nvidia A100 ، والتي تم وضعها تحت قيود الولايات المتحدة التي تم الإعلان عنها في أكتوبر 2022. تم إنشاؤه المسمى Deepseek-V2 باستخدام مجموعات من رقائق الكمبيوتر NVIDIA H800 ، وهو مكون أقل قدرة تم تطويره بواسطة NVIDIA للامتثال لعناصر التحكم في التصدير الأمريكية.
ويقدر مصدر في شركة واحدة من الذكاء الاصطناعى تدريب نماذج منظمة العفو الدولية الكبيرة ، التي طلبت أن تكون مجهولة على حماية علاقاتها المهنية ، أن Deepseek من المحتمل أن تستخدم حوالي 50000 رقائق Nvidia لبناء تقنيتها.
رفضت Nvidia التعليق مباشرة على أي من رقائقها Deepseek قد تعتمد عليها. وقال متحدث باسم NVIDIA في بيان “Deepseek هو تقدم ممتاز من الذكاء الاصطناعي” ، مضيفًا أن نهج التفكير في بدء التشغيل “يتطلب أعدادًا كبيرة من معالجة الرسومات NVIDIA والشبكات عالية الأداء”.
ومع ذلك ، تم بناء نماذج Deepseek ، يبدو أنها تُظهر أن نهجًا أقل إغلاقًا لتطوير الذكاء الاصطناعى يكتسب زخماً. في ديسمبر / كانون الأول ، توقع كليم ديلانجوي ، الرئيس التنفيذي لشركة Huggingface ، وهي منصة تستضيف نماذج الذكاء الاصطناعي ، أن تتولى شركة صينية زمام المبادرة في AI بسبب سرعة الابتكار التي تحدث في نماذج المصادر المفتوحة ، والتي تبنتها الصين إلى حد كبير. يقول: “لقد سار هذا أسرع مما اعتقدت”.