Close Menu
نجمة الخليجنجمة الخليج

    رائج الآن

    وزير الخارجية يؤكد دعم مصر لتعزيز منظومة الصحة والأمن الدوائي في أفريقيا

    الإثنين 29 ديسمبر 9:26 ص

    وزير الاتصالات : إنتاج 10 ملايين جهاز محمول في 2025 مقارنة بـ3.3 مليون سابقًا

    الإثنين 29 ديسمبر 9:17 ص

    لا يكتمل روتين جيسيكا ألبا المسائي بدون أقنعة العين المزيلة للانتفاخ

    الإثنين 29 ديسمبر 9:12 ص
    فيسبوك X (Twitter) الانستغرام
    نجمة الخليجنجمة الخليج
    • الاخبار
    • العالم
    • سياسة
    • اسواق
    • تقنية
    • رياضة
    • صحة
    • منوعات
    • المزيد
      • سياحة وسفر
      • مشاهير
      • مقالات
              
    الإثنين 29 ديسمبر 9:26 ص
    رائج الآن
    • #الإنتخابات_التركية
    • حرب اوكرانيا
    • موسم الحج
    • السعودية 2030
    • دونالد ترامب
    نجمة الخليجنجمة الخليج
    الرئيسية»تقنية
    تقنية

    المعركة ضد الذكاء الاصطناعي تصل إلى مجموعة بيانات أساسية

    فريق التحريرفريق التحريرالخميس 13 يونيو 3:46 ملا توجد تعليقات

    طالبت وسائل الإعلام الدنماركية أرشيف الويب غير الربحي Common Crawl بإزالة نسخ مقالاتها من مجموعات البيانات السابقة والتوقف عن الزحف إلى مواقعها على الويب على الفور. تم إصدار هذا الطلب وسط غضب متزايد بشأن كيفية استخدام شركات الذكاء الاصطناعي مثل OpenAI للمواد المحمية بحقوق الطبع والنشر.

    تخطط Common Crawl للامتثال للطلب، الذي تم إصداره لأول مرة يوم الاثنين. يقول المدير التنفيذي ريتش سكرينتا إن المنظمة “غير مجهزة” لمحاربة شركات الإعلام والناشرين في المحكمة.

    قاد تحالف الحقوق الدنماركي (DRA)، وهو جمعية تمثل أصحاب حقوق الطبع والنشر في الدنمارك، الحملة. وقدمت الطلب نيابة عن أربع وسائل إعلام، بما في ذلك شركة Berlingske Media وصحيفة Jyllands-Posten اليومية. وقد قدمت صحيفة نيويورك تايمز طلبًا مشابهًا لـ Common Crawl العام الماضي، قبل رفع دعوى قضائية ضد OpenAI لاستخدام عملها دون إذن. في شكواها، سلطت صحيفة نيويورك تايمز الضوء على كيف كانت بيانات Common Crawl هي “مجموعة البيانات الأكثر وزنًا” في GPT-3.

    يقول توماس هيلدروب، رئيس حماية المحتوى وتنفيذه في DRA، إن هذا الجهد الجديد مستوحى من صحيفة التايمز. يقول هيلدروب: “إن الزحف المشترك فريد من نوعه، بمعنى أننا نرى الكثير من شركات الذكاء الاصطناعي الكبرى تستخدم بياناتها”. ويرى أن مجموعتها تمثل تهديدًا لشركات الإعلام التي تحاول التفاوض مع عمالقة الذكاء الاصطناعي.

    على الرغم من أن الزحف المشترك كان ضروريًا لتطوير العديد من أدوات الذكاء الاصطناعي التوليدية القائمة على النصوص، إلا أنه لم يتم تصميمه مع وضع الذكاء الاصطناعي في الاعتبار. تأسست هذه المنظمة التي يقع مقرها في سان فرانسيسكو عام 2007، وقد اشتهرت قبل طفرة الذكاء الاصطناعي بقيمتها كأداة بحث. يقول ستيفان باك، محلل البيانات في مؤسسة موزيلا والذي نشر مؤخرًا تقريرًا عن دور Common Crawl في التدريب على الذكاء الاصطناعي: “إن Common Crawl عالقة في هذا الصراع حول حقوق الطبع والنشر والذكاء الاصطناعي التوليدي”. “لسنوات عديدة كان مشروعًا صغيرًا متخصصًا لم يكن أحد يعلم عنه تقريبًا.”

    قبل عام 2023، لم يتلق Common Crawl طلبًا واحدًا لتنقيح البيانات. الآن، بالإضافة إلى الطلبات المقدمة من صحيفة نيويورك تايمز وهذه المجموعة من الناشرين الدنماركيين، فإنها تتلقى أيضًا زيادة طفيفة في الطلبات التي لم يتم الإعلان عنها.

    بالإضافة إلى هذا الارتفاع الحاد في طلبات تنقيح البيانات، فإن زاحف الويب الخاص بـ Common Crawl، CCBot، يتم إحباطه أيضًا بشكل متزايد من تجميع بيانات جديدة من الناشرين. وفقًا لشركة Originality AI الناشئة للكشف عن الذكاء الاصطناعي، والتي غالبًا ما تتعقب استخدام برامج زحف الويب، فإن أكثر من 44 بالمائة من أهم مواقع الأخبار والوسائط العالمية تحجب CCBot. وبصرف النظر عن Buzzfeed، الذي بدأ في حظره في عام 2018، فإن معظم المنافذ الإعلامية البارزة التي حللتها – بما في ذلك رويترز، وواشنطن بوست، وسي بي سي – رفضت الزاحف فقط في العام الماضي. ويقول باك: “لقد تم حظرهم أكثر فأكثر”.

    إن امتثال Common Crawl السريع لهذا النوع من الطلبات مدفوع بواقع الحفاظ على مؤسسة صغيرة غير ربحية واقفة على قدميها. ومع ذلك، فإن الامتثال لا يعني الاتفاق الأيديولوجي. يرى Skrenta أن هذا الضغط لإزالة المواد الأرشيفية من مستودعات البيانات مثل Common Crawl ليس أقل من إهانة للإنترنت كما نعرفه. ويقول: “إنه تهديد وجودي”. “سوف يقتلون شبكة الإنترنت المفتوحة.”

    شاركها. فيسبوك تويتر بينتيريست تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    ما هي كمية الميلاتونين التي يجب أن تتناولها؟ (2026)

    تقنية الأحد 28 ديسمبر 2:11 م

    الأشخاص الذين يشربون المياه المعبأة بشكل يومي يبتلعون 90 ألف جزيئة بلاستيكية دقيقة كل عام

    تقنية الأحد 28 ديسمبر 1:10 م

    أفضل مجموعات الوجبات النباتية وخدمات التوصيل

    تقنية الأحد 28 ديسمبر 12:09 م

    مراكز البيانات التي تبلغ قيمتها مليار دولار تسيطر على العالم

    تقنية الأحد 28 ديسمبر 11:07 ص

    الدولار يواجه نهاية لهيمنته

    تقنية الأحد 28 ديسمبر 10:06 ص

    انظر إلى المشعب، المفهوم الذي غيّر الطريقة التي ينظر بها علماء الرياضيات إلى الفضاء

    تقنية الأحد 28 ديسمبر 8:04 ص
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    المزيد

    وزير الاتصالات : إنتاج 10 ملايين جهاز محمول في 2025 مقارنة بـ3.3 مليون سابقًا

    الإثنين 29 ديسمبر 9:17 ص

    لا يكتمل روتين جيسيكا ألبا المسائي بدون أقنعة العين المزيلة للانتفاخ

    الإثنين 29 ديسمبر 9:12 ص

    الصين تطلق أقوى تحذيراتها لأمريكا وتابعيها بعد حصار تدريبي لتايوان

    الإثنين 29 ديسمبر 9:11 ص

    الحقي خزني.. أسعار الفراخ والبانيه اليوم الإثنين 29 ديسمبر

    الإثنين 29 ديسمبر 9:03 ص

    الصحة: تقديم 14.1 مليون خدمة طبية في أسيوط خلال 2025

    الإثنين 29 ديسمبر 8:57 ص

    النشرة البريدية

    اشترك في النشرة البريدية ليصلك كل جديد على بريدك الإلكتروني مباشرة

    رائج هذا الأسبوع

    تعرض رئيس الوزراء البريطاني لانتقادات بسبب ترحيبه بعودة الناشط المفرج عنه بسبب منشورات مثيرة للجدل

    سقوط ميكروباص في ترعة المريوطية بالجيزة

    4.7% ارتفاعًا في الرقم القياسي للصناعات التحويلية والاستخراجية أكتوبر 2025

    موعد مباراة مالي وجزر القمر والقناة الناقلة وترتيب المجموعة

    من المسرح القومي.. خالد محروس يعيد حكاية صلاح جاهين للأجيال الجديدة

    اعلانات
    Demo
    فيسبوك X (Twitter) الانستغرام يوتيوب تيلقرام
    2025 © نجمة الخليج. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟