Close Menu
نجمة الخليجنجمة الخليج

    رائج الآن

    عزيزي آبي: ابني يحصل على 100 ألف دولار سنويًا ولا يزال غير قادر على العثور على زوجة

    الثلاثاء 23 ديسمبر 9:31 ص

    أسعار الذهب في مصر اليوم الثلاثاء 23 ديسمبر 2025

    الثلاثاء 23 ديسمبر 9:30 ص

    ستيفن سبيلبرغ رفض العمل مع بن أفليك بسبب مشاجرة عائلية، بحسب ما يدعي المخرج

    الثلاثاء 23 ديسمبر 9:29 ص
    فيسبوك X (Twitter) الانستغرام
    نجمة الخليجنجمة الخليج
    • الاخبار
    • العالم
    • سياسة
    • اسواق
    • تقنية
    • رياضة
    • صحة
    • منوعات
    • المزيد
      • سياحة وسفر
      • مشاهير
      • مقالات
              
    الثلاثاء 23 ديسمبر 9:33 ص
    رائج الآن
    • #الإنتخابات_التركية
    • حرب اوكرانيا
    • موسم الحج
    • السعودية 2030
    • دونالد ترامب
    نجمة الخليجنجمة الخليج
    الرئيسية»تقنية
    تقنية

    تطلق جامعة هارفارد مجموعة بيانات ضخمة مجانية للتدريب على الذكاء الاصطناعي بتمويل من OpenAI وMicrosoft

    فريق التحريرفريق التحريرالخميس 12 ديسمبر 2:09 ملا توجد تعليقات

    بالإضافة إلى مجموعة الكتب الثمينة، تعمل مبادرة البيانات المؤسسية أيضًا مع مكتبة بوسطن العامة لمسح ملايين المقالات من الصحف المختلفة الموجودة الآن في المجال العام، وتقول إنها مفتوحة لتشكيل تعاونات مماثلة في المستقبل. لم يتم تحديد الطريقة الدقيقة التي سيتم بها إصدار مجموعة بيانات الكتب. طلبت مبادرة البيانات المؤسسية من جوجل العمل معًا على التوزيع العام، وتعهدت الشركة بدعمها.

    مهما تم إصدار مجموعة بيانات IDI، فإنها ستنضم إلى مجموعة من المشاريع المماثلة والشركات الناشئة والمبادرات التي تعد بمنح الشركات إمكانية الوصول إلى مواد تدريبية كبيرة وعالية الجودة في مجال الذكاء الاصطناعي دون التعرض لخطر التعرض لقضايا حقوق الطبع والنشر. ظهرت شركات مثل Calliope Networks وProRata لإصدار التراخيص وتصميم خطط التعويض المصممة للحصول على أموال للمبدعين وأصحاب الحقوق مقابل توفير بيانات التدريب على الذكاء الاصطناعي.

    هناك أيضًا مشاريع جديدة أخرى ذات ملكية عامة. في الربيع الماضي، أطلقت شركة Pleias الفرنسية الناشئة في مجال الذكاء الاصطناعي مجموعة بيانات المجال العام الخاصة بها، Common Corpus، والتي تحتوي على ما يقدر بنحو 3 إلى 4 ملايين كتاب ومجموعة دورية، وفقًا لمنسق المشروع بيير كارل لانجليز. بدعم من وزارة الثقافة الفرنسية، تم تنزيل Common Corpus أكثر من 60 ألف مرة هذا الشهر وحده على منصة الذكاء الاصطناعي مفتوحة المصدر Hugging Face. في الأسبوع الماضي، أعلنت بلياس أنها ستطلق مجموعتها الأولى من النماذج اللغوية الكبيرة المدربة على مجموعة البيانات هذه، والتي قال لانجليز لمجلة WIRED إنها تشكل النماذج الأولى “التي تم تدريبها حصريًا على البيانات المفتوحة والمتوافقة مع قانون الذكاء الاصطناعي (الاتحاد الأوروبي)”.

    الجهود جارية لإنشاء مجموعات بيانات سحرية مماثلة أيضًا. أصدرت شركة Spawning الناشئة العاملة في مجال الذكاء الاصطناعي هذا الصيف نسختها الخاصة التي تحمل اسم Source.Plus، والتي تحتوي على صور ذات ملكية عامة من Wikimedia Commons بالإضافة إلى مجموعة متنوعة من المتاحف والمحفوظات. لقد جعلت العديد من المؤسسات الثقافية المهمة منذ فترة طويلة أرشيفاتها الخاصة في متناول الجمهور كمشاريع مستقلة، مثل متحف متروبوليتان للفنون.

    يقول إد نيوتن ريكس، المدير التنفيذي السابق في Stability AI والذي يدير الآن منظمة غير ربحية تصادق على أدوات الذكاء الاصطناعي المدربة أخلاقيا، إن ظهور مجموعات البيانات هذه يظهر أنه ليست هناك حاجة لسرقة مواد محمية بحقوق الطبع والنشر لبناء نماذج ذكاء اصطناعي عالية الأداء وعالية الجودة. أخبرت OpenAI سابقًا المشرعين في المملكة المتحدة أنه سيكون من “المستحيل” إنشاء منتجات مثل ChatGPT دون استخدام أعمال محمية بحقوق الطبع والنشر. يقول نيوتن-ريكس: “إن مجموعات البيانات العامة الكبيرة مثل هذه تؤدي إلى هدم “دفاع الضرورة” الذي تستخدمه بعض شركات الذكاء الاصطناعي لتبرير إلغاء الأعمال المحمية بحقوق الطبع والنشر لتدريب نماذجها”.

    لكنه لا يزال لديه تحفظات حول ما إذا كانت مبادرة تطوير التطوير (IDI) والمشاريع المشابهة لها ستغير بالفعل الوضع الراهن للتدريب. “لن يكون لمجموعات البيانات هذه تأثير إيجابي إلا إذا تم استخدامها، ربما بالتزامن مع ترخيص بيانات أخرى، لتحل محل الأعمال المحمية بحقوق الطبع والنشر. ويقول: “إذا تمت إضافتها فقط إلى المزيج، وهو جزء من مجموعة البيانات التي تتضمن أيضًا الأعمال الحياتية غير المرخصة لمبدعي العالم، فسوف تعود بالنفع بشكل كبير على شركات الذكاء الاصطناعي”.

    شاركها. فيسبوك تويتر بينتيريست تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    وافقت إدارة الغذاء والدواء الأمريكية على إصدار حبوب منع الحمل من Wegovy

    تقنية الثلاثاء 23 ديسمبر 12:42 ص

    فيديو “انتحار إبستين” في أحدث إصدار لوزارة العدل ليس كما يبدو

    تقنية الإثنين 22 ديسمبر 11:41 م

    كود خصم HelloFresh Meal Kit لشهر ديسمبر 2025 يفتح سكين Zwilling مجانًا

    تقنية الإثنين 22 ديسمبر 10:39 م

    مستقبل المركبات الكهربائية ضبابي، لكن كاليفورنيا لا تزال تريد المزيد منها

    تقنية الإثنين 22 ديسمبر 9:38 م

    أصدرت وزارة العدل المزيد من ملفات إبستاين، لكن ليس تلك التي يريدها الناجون

    تقنية الإثنين 22 ديسمبر 8:35 م

    التكنولوجيا تعطلت الصداقة. حان الوقت لإعادته

    تقنية الإثنين 22 ديسمبر 7:34 م
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    المزيد

    أسعار الذهب في مصر اليوم الثلاثاء 23 ديسمبر 2025

    الثلاثاء 23 ديسمبر 9:30 ص

    ستيفن سبيلبرغ رفض العمل مع بن أفليك بسبب مشاجرة عائلية، بحسب ما يدعي المخرج

    الثلاثاء 23 ديسمبر 9:29 ص

    الدبلوماسية المصرية في 2025.. عام ترسيخ الاستقرار وحماية الأمن القومي العربي

    الثلاثاء 23 ديسمبر 9:23 ص

    رئيس سلامة الغذاء يبحث سبل تعزيز التعاون مع السفير الأسترالي بالقاهرة

    الثلاثاء 23 ديسمبر 9:16 ص

    شوبير يشيد بدور النيابة العامة في كشف حقيقة وفاة يوسف محمد

    الثلاثاء 23 ديسمبر 9:09 ص

    النشرة البريدية

    اشترك في النشرة البريدية ليصلك كل جديد على بريدك الإلكتروني مباشرة

    رائج هذا الأسبوع

    فى عيد ميلاده.. قصة حب وزواج عمرو يوسف وكندة علوش

    الدقهلية: تحرير 15 محضرًا متنوعا في حملة رقابية على 22 مخبزًا بأربعة مراكز

    ارتفاع جنوني.. سعر الذهب عيار 21 يلامس 6000 جنيه

    سوريا .. ارتفاع حصيلة اشتباكات حلب إلى 4 قتلى و9 جرحى

    10 % انخفاضا في سعر اللحوم الحمراء.. جزار يوضح

    اعلانات
    Demo
    فيسبوك X (Twitter) الانستغرام يوتيوب تيلقرام
    2025 © نجمة الخليج. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟