Close Menu
نجمة الخليجنجمة الخليج

    رائج الآن

    تنقسم وسائل التواصل الاجتماعي حول مقال “THR” الذي يعيد صياغة مقابلة العشاء مع روب راينر وابنه نيك

    الأربعاء 17 ديسمبر 12:52 ص

    اسم القذافي يعود للواجهة .. اتهامات جديدة تطارد ساركوزي

    الأربعاء 17 ديسمبر 12:49 ص

    أستاذ علوم سياسية: دبلوماسية مصر «نشطة» وسط توترات إقليمية.. وموقف حاسم من الأزمة السودانية

    الأربعاء 17 ديسمبر 12:43 ص
    فيسبوك X (Twitter) الانستغرام
    نجمة الخليجنجمة الخليج
    • الاخبار
    • العالم
    • سياسة
    • اسواق
    • تقنية
    • رياضة
    • صحة
    • منوعات
    • المزيد
      • سياحة وسفر
      • مشاهير
      • مقالات
              
    الأربعاء 17 ديسمبر 12:56 ص
    رائج الآن
    • #الإنتخابات_التركية
    • حرب اوكرانيا
    • موسم الحج
    • السعودية 2030
    • دونالد ترامب
    نجمة الخليجنجمة الخليج
    الرئيسية»تقنية
    تقنية

    يقول الباحثون إن نماذج اللغة الصغيرة هي الغضب الجديد

    فريق التحريرفريق التحريرالأحد 13 أبريل 6:28 صلا توجد تعليقات

    النسخة الأصلية من هذه القصة ظهرت في مجلة Quanta.

    نماذج اللغة الكبيرة تعمل بشكل جيد لأنها كبيرة جدًا. تستخدم أحدث النماذج من Openai و Meta و Deepseek مئات المليارات من “المعلمات” – المقابض القابلة للتعديل التي تحدد الاتصالات بين البيانات وتحصل على تعديل أثناء عملية التدريب. مع المزيد من المعلمات ، تكون النماذج أكثر قدرة على تحديد الأنماط والاتصالات ، مما يجعلها بدورها أكثر قوة ودقة.

    لكن هذه القوة تأتي بتكلفة. تدريب نموذج مع مئات المليارات من المعلمات يأخذ موارد حسابية ضخمة. لتدريب طراز Gemini 1.0 Ultra ، على سبيل المثال ، قيل إن Google أنفقت 191 مليون دولار. تتطلب نماذج اللغة الكبيرة (LLMS) أيضًا قوة حسابية كبيرة في كل مرة يجيبون فيها على طلب ، مما يجعلها خنازير الطاقة سيئة السمعة. يستهلك استعلام واحد لـ ChatGPT حوالي 10 أضعاف الطاقة مثل بحث Google واحد ، وفقًا لمعهد أبحاث الطاقة الكهربائية.

    رداً على ذلك ، يفكر بعض الباحثين الآن. أصدرت IBM و Google و Microsoft و Openai جميع طرز اللغة الصغيرة (SLMs) التي تستخدم بضعة مليارات من المعلمات – جزء من نظرائهم LLM.

    لا يتم استخدام النماذج الصغيرة كأدوات للأغراض العامة مثل أبناء عمومتها الأكبر. لكن يمكنهم التفوق على مهام محددة وأكثر ضيقة ، مثل تلخيص المحادثات ، والإجابة على أسئلة المريض باعتبارها chatbot للرعاية الصحية ، وجمع البيانات في الأجهزة الذكية. وقال زيكو كولتر ، عالم الكمبيوتر بجامعة كارنيجي ميلون: “بالنسبة للعديد من المهام ، فإن نموذج المليار البالغ 8 مليارات من المعايير هو في الواقع جيد للغاية”. يمكنهم أيضًا تشغيل جهاز كمبيوتر محمول أو هاتف محمول ، بدلاً من مركز بيانات ضخم. (لا يوجد إجماع على التعريف الدقيق لـ “Small” ، ولكن النماذج الجديدة جميعها تصل إلى حوالي 10 مليارات من المعلمات.)

    لتحسين عملية التدريب لهذه النماذج الصغيرة ، يستخدم الباحثون بعض الحيل. غالبًا ما تتخلص النماذج الكبيرة من بيانات التدريب الخام من الإنترنت ، ويمكن أن تكون هذه البيانات غير منظمة وفوضوية ويصعب معالجتها. لكن هذه النماذج الكبيرة يمكنها إنشاء مجموعة بيانات عالية الجودة يمكن استخدامها لتدريب نموذج صغير. يحصل النهج ، الذي يسمى تقطير المعرفة ، على النموذج الأكبر لتمرير تدريبه بشكل فعال ، مثل المعلم الذي يقدم دروسًا للطالب. وقال كولتر: “السبب في (SLMS) يفيد مع مثل هذه النماذج الصغيرة ومثل هذه البيانات الصغيرة هو أنها تستخدم بيانات عالية الجودة بدلاً من الأشياء الفوضوية”.

    لقد استكشف الباحثون أيضًا طرقًا لإنشاء نماذج صغيرة من خلال البدء بأعداد كبيرة وتقطيعها. تستلزم إحدى الطرق ، المعروفة باسم التقليم ، إزالة أجزاء غير ضرورية أو غير فعالة من شبكة عصبية – شبكة المترامية الأطراف لنقاط البيانات المتصلة التي تكمن وراء نموذج كبير.

    استلهم التقليم من شبكة عصبية واقعية ، الدماغ البشري ، الذي يكتسب الكفاءة عن طريق قص الوصلات بين المشابك كشخص. تعود نهج التقليم اليوم إلى ورقة عام 1989 حيث جادل عالم الكمبيوتر يان ليكون ، الآن في ميتا ، أنه يمكن إزالة ما يصل إلى 90 في المائة من المعلمات في شبكة عصبية مدربة دون التضحية بالكفاءة. ودعا طريقة “تلف الدماغ الأمثل”. يمكن أن يساعد التقليم للباحثين في ضبط نموذج لغة صغير لمهمة أو بيئة معينة.

    بالنسبة للباحثين المهتمين بكيفية قيام نماذج اللغة بالأشياء التي تقوم بها ، تقدم النماذج الأصغر طريقة غير مكلفة لاختبار الأفكار الجديدة. ولأن لديهم معلمات أقل من النماذج الكبيرة ، فقد يكون تفكيرهم أكثر شفافية. وقال ليشم تشوشين ، عالم الأبحاث في مختبر MIT-IBM Watson AI Lab: “إذا كنت ترغب في إنشاء نموذج جديد ، فأنت بحاجة إلى تجربة الأشياء”. “تسمح النماذج الصغيرة للباحثين بتجربة المخاطر المنخفضة.”

    ستبقى النماذج الكبيرة باهظة الثمن ، مع معلماتها المتزايدة باستمرار ، مفيدة للتطبيقات مثل chatbots المعممة ومولدات الصور واكتشاف المخدرات. ولكن بالنسبة للعديد من المستخدمين ، سيعمل نموذج صغير مستهدف أيضًا ، في حين أن الباحثين يسهلون تدريبهم والبناء. وقال تشوشين: “يمكن لهذه النماذج الفعالة توفير المال والوقت والحساب”.


    القصة الأصلية أعيد طبعه بإذن من مجلة Quanta ، منشور مستقل تحريري ل مؤسسة سيمونز تتمثل مهمتها في تعزيز الفهم العام للعلوم من خلال تغطية التطورات البحثية والاتجاهات في الرياضيات والعلوم المادية والحياة.

    شاركها. فيسبوك تويتر بينتيريست تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    أفضل حزم البث المباشر وصفقات البث لشهر ديسمبر 2025

    تقنية الثلاثاء 16 ديسمبر 9:01 م

    Grindr يذهب إلى “الذكاء الاصطناعي أولاً” لأنه يسعى جاهداً ليكون “تطبيق كل شيء للمثليين”

    تقنية الثلاثاء 16 ديسمبر 8:00 م

    الرئيس الجديد للجنة ترامب المعنية بالسرطان يتكهن بشأن الروابط بين اللقاحات والسرطان

    تقنية الثلاثاء 16 ديسمبر 6:59 م

    تقوم OpenAI بإلغاء نظام التوجيه النموذجي الخاص بـ ChatGPT لمعظم المستخدمين

    تقنية الثلاثاء 16 ديسمبر 5:58 م

    أفضل مجموعات وجبات التوصيل خلال العطلات (2025)

    تقنية الثلاثاء 16 ديسمبر 3:56 م

    تعيد شركة American Giant تصميم قلنسوة كلاسيكية مميزة بسحاب كامل

    تقنية الثلاثاء 16 ديسمبر 2:55 م
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    المزيد

    اسم القذافي يعود للواجهة .. اتهامات جديدة تطارد ساركوزي

    الأربعاء 17 ديسمبر 12:49 ص

    أستاذ علوم سياسية: دبلوماسية مصر «نشطة» وسط توترات إقليمية.. وموقف حاسم من الأزمة السودانية

    الأربعاء 17 ديسمبر 12:43 ص

    جريمة قتل غامضة .. اغتيــ.ـال عالم نووي برتغالي بالرصاص في الولايات المتحدة

    الأربعاء 17 ديسمبر 12:37 ص

    سعر صرف الدولار مقابل الجنيه اليوم الأربعاء 17-12-2025

    الأربعاء 17 ديسمبر 12:25 ص

    تفاصيل مُعاقبة ربة منزل بالسجن المُشدّد 5 سنوات بتهمة خطـ.ـف طفــ.ـل بالوايلي

    الأربعاء 17 ديسمبر 12:19 ص

    النشرة البريدية

    اشترك في النشرة البريدية ليصلك كل جديد على بريدك الإلكتروني مباشرة

    رائج هذا الأسبوع

    لماذا يُشفى البعض أسرع من الزكام؟.. أسباب غير مُتوقعة وراء مدة التعافي

    الولايات المتحدة تصنف أكبر عصابة مخدرات في كولومبيا كمنظمة إرهابية | تفاصيل

    هواتف 16 جيجابايت RAM تصبح رفاهية نادرة بسبب نقص الذاكرة

    لاري كودلو: تدريبات ترامب، يا عزيزي، بدأت تؤتي ثمارها

    القبض على 4 أعضاء من منظمة تحرير جزيرة السلاحف في لوس أنجلوس بتهمة التخطيط لتفجيرات منسقة ليلة رأس السنة

    اعلانات
    Demo
    فيسبوك X (Twitter) الانستغرام يوتيوب تيلقرام
    2025 © نجمة الخليج. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟