تكنولوجيا

صحيفة أمريكية مرموقة تحظر استخدام محتواها لتدريب نماذج الذكاء الاصطناعي

أفاد تقرير جديد، نشرته (أدويك) Adweek اليوم الاثنين، بأن صحيفة نيويورك تايمز اتخذت تدابير وقائية لمنع استخدام محتواها في تدريب نماذج الذكاء الاصطناعي.

ووفقًا للتقرير، حدَّثت الصحيفة شروط الخدمة الخاصة بها في 3 آب/ أغسطس الجاري لحظر استخدام محتواها، ومن ذلك: النصوص، والصور الفوتوغرافية، والصور الحاسوبية، والمقاطع الصوتية والمرئية، و«الشكل والمظهر»، والبيانات الوصفية، والتجميعات، في تطوير «أي برنامج، ومن ذلك، على سبيل المثال لا الحصر، تدريب التعلم الآلي أو نظام الذكاء الاصطناعي».

وتحدد الشروط المُحدَّثة الآن أيضًا أنه لا يمكن استخدام الأدوات الآلية، مثل: برامج زحف مواقع الويب المصممة لاستخدام هذا المحتوى أو الوصول إليه أو جمعه، دون إذن كتابي من الناشر.

وتقول نيويورك تايمز إن رفض الامتثال لهذه القيود الجديدة قد يؤدي إلى غرامات أو عقوبات غير محددة.

وعلى الرغم من تقديم القواعد الجديدة لسياستها، لا يبدو أن الصحيفة قد أجرت أي تغييرات على ملف robots.txt الخاص بها، وهو الملف الذي يُعلم برامج الزحف لمحركات البحث بعناوين URL التي يمكن الوصول إليها.

موضوعات ذات صلة بما تقرأ الآن:

وقد تكون هذه الخطوة ردًا على تحديث أخير لسياسة الخصوصية من جوجل، الذي يكشف عن أن عملاقة البحث قد تجمع بيانات عامة من الويب لتدريب خدمات الذكاء الاصطناعي المختلفة، مثل: (بارد) Bard.

ويُدرَّب العديد من النماذج اللغوية الكبيرة التي تقوم عليها خدمات الذكاء الاصطناعي الشائعة، مثل: (شات جي بي تي) ChatGPT التابع لشركة (أوبن أي آي) OpenAI على مجموعات بيانات ضخمة قد تحتوي على مواد محمية بحقوق الطبع والنشر، أو محمية بطريقة أخرى مأخوذة، من الويب دون إذن المنشئ الأصلي.

ومع ذلك، فقد وقّعت نيويورك تايمز أيضًا صفقة بقيمة 100 مليون دولار مع جوجل في شهر شباط/ فبراير الماضي، تسمح لعملاقة البحث بعرض محتوى الصحيفة عبر بعض منصاتها على مدار السنوات الثلاث المقبلة.

وقالت الصحيفة إن كلا الشركتين سوف تعملان معًا على أدوات لتوزيع المحتوى، والاشتراكات، والتسويق، والإعلانات، و«التجريب»، لذلك من الممكن أن تكون التغييرات على شروط خدمة الخاصة بنيويورك تايمز موجهة إلى شركات أخرى، مثل: (أوبن أي آي) أو (مايكروسوفت).

وأطلقت شركة (أوبن أي آي) حديثًا زاحفًا جديدًا للشبكة اسمه (جي بي تي بوت) GPTBot، ومهمته هي جَوْب شبكة الإنترنت بحثًا عن المحتوى لتدريب نماذج اللغات الكبيرة، مثل: (جي بي تي-4) GPT-4، التي تقوم عليها روبوتات الدردشة، مثل: (شات جي بي تي).

وأضافت مايكروسوفت أيضًا بعض القيود الجديدة إلى الشروط والأحكام الخاصة بها، التي تمنع الأشخاص من استخدام منتجات الذكاء الاصطناعي الخاصة بها «لإنشاء أو تدريب أو تحسين (بشكل مباشر أو غير مباشر) أي خدمة أخرى للذكاء الاصطناعي»، إلى جانب حظر المستخدمين من استخراج البيانات من أدوات الذكاء الاصطناعي الخاصة بها.

وفي وقت سابق من هذا الشهر، وقّعت العديد من المؤسسات الإخبارية، ومن ذلك: (أسوشيتد برس) The Associated Press، ومجلس الناشرين الأوروبيين خطابًا مفتوحًا تدعو المشرعين العالميين إلى إدخال القواعد التي تتطلب الشفافية في مجموعات بيانات التدريب وموافقة أصحاب الحقوق قبل استخدام البيانات للتدريب.

https://www.youtube.com/watch?v=videoseries