
قال سميث: “أعتقد أن الاسترجاع وخلق القصص المعجبة، كلاهما يمكن أن يثير مسائل حقوق الطبع والنشر، حيث أن القصص المعجبة غالباً ما تأخذ من العناصر التعبيرية، شخصية محمية بحقوق الطبع والنشر، شخصية مشهورة بما يكفي لحمايتها بموجب قانون حقوق الطبع والنشر أو قصص الحبكات أو التسلسلات.” وأضاف: “إذا تم نسخ هذه الأشياء وإعادة إنتاجها، فإن هذا الناتج قد يكون مخرقاً محتملاً.”
لكنها أيضاً لا تزال منطقة رمادية. وبعد النظر في المدونة، قال سميث: “سأكون قلقاً”، لكنه أضاف: “لن أقول إن ذلك يشكل انتهاكاً تلقائياً.”
أخبر سميث أرز أن سحب المدونة كان “على الأرجح خطوة ذكية” من مايكروسوفت، حيث قالت المحاكم بشكل عام إن تدريب الذكاء الاصطناعي على الكتب المحمية بحقوق الطبع والنشر هو استخدام عادل. لكن المحاكم تواصل التحقيق في أسئلة حول مواد تدريب الذكاء الاصطناعي المسروقة.
على صفحة مجموعة بيانات كاجل المحذوفة، أوضح مايندولا سابقاً أنه للحصول على البيانات، “قام بتنزيل الكتب الإلكترونية ثم تحويلها إلى ملفات نصية.”
مايكروسوفت قد تكون انتهكت حقوق الطبع والنشر
إذا واجهت مايكروسوفت أسئلة بشأن ما إذا كانت الشركة قد استخدمت كتباً مسروقة لتدريب النماذج الأمينة، فإن الاستخدام العادل “يمكن أن يكون حجة صعبة” ، كما قال سميث.
اقترح المعلقون في هكر نيوز أن المدونة يمكن اعتبارها استخداماً عادلاً، حيث كان دليل التدريب “لأغراض تعليمية”، وقال سميث إنه يمكن لمايكروسوفت أن تقدم بعض “الحجج الجيدة” في دفاعها.
ومع ذلك، اقترحت أيضاً أن مايكروسوفت يمكن أن تعتبر مسؤولة عن المساهمة في الانتهاك على مستوى ما بعد إبقاء المدونة منشورة لمدة عام. قبل إزالتها، تم تنزيل مجموعة بيانات كاجل أكثر من 10,000 مرة.
قالت سميث: “النتيجة النهائية هي خلق شيء مخرق من خلال قول: ‘مرحباً، ها أنت، اذهب واحصل على تلك الأشياء المخرقة واستخدمها في نظامنا.'” وأضافت: “يمكن أن يتحملوا مسؤولية ثانوية من المساهمة في انتهاك حقوق الطبع والنشر، بتنزيلها، وكذلك استخدام ذلك لتشجيع الآخرين على استخدامها لأغراض التدريب.”
