סגור
באנר דסקטופ כלכליסט טק
ChatGpt בינה מלאכותית
ChatGpt בינה מלאכותית (צילום: T.Schneider/Shutterstock)

חברת OpenAI מגיבה לתביעת הניו יורק טיימס: "זכאים להגנה על שימוש בכתבות עיתונאיות"

בדצמבר תבע הניו יורק טיימס את OpenAI ומיקרוסופט בטענה שעשו שימוש במאמריו לאימון מודלי הבינה המלאכותית הגנרטיבית שלהם ללא אישור. התביעה מבקשת מהחברות את הריסת GPT ופיצוי בסך מיליארדי דולרים. OpenAI טרם הגישה כתב הגנה, אך פרסמה הלילה התייחסות לתביעה

OpenAI מגיבה לתביעת זכויות היוצרים המתוקשרת שהגיש נגדה הניו יורק טיימס, וטוענת: התביעה נטולת בסיס, אימון מודלים מוגן תחת שימוש הוגן, והעיתון ביצע מניפולציה על מנת לתמוך בטענותיו. "הניו יורק טיימס לא מספר את הסיפור המלא", אמרה מפתחת ChatGPT בהודעה שפרסמה באתרה.
בסוף דצמבר תבע הניו יורק טיימס את OpenAI ואת מיקרוסופט בטענה שהחברות עשו שימוש במאמרים של העיתון לאימון מודלי הבינה המלאכותית הגנרטיבית שלהם ללא אישורו. התביעה, שהוגשה לבית משפט פדרלי במנהטן, מבקשת לחייב את החברות בפיצויים בסך מיליארדי דולרים ולהורות להם להרוס את GPT. "הנתבעים נמנעו מהוצאת מיליארדי הדולרים שהטיימס השקיע ביצירת העבודה הזו, באמצעות לקיחתה ללא רשות או פיצוי", נכתב בתביעה. "החוק לא מתיר הפרות מערכתיות שכאלו".
OpenAI טרם הגישה כתב הגנה, אך פרסמה הלילה התייחסות נרחבת לתביעת העיתון. ראשית, מציינת החברה שהיא משתפת פעולה אם ארגוני חדשות ויוצרת בעבורם הזדמנויות חדשות. "אנחנו עובדים קשה על מנת שהטכנולוגיה שלנו תתמוך בארגוני חדשות", טוענת החברה. "נפגשנו עם עשרות ארגונים מובילים כדי לחקור הזדמנויות, לדון בחששותיהם ולספק פתרונות". לדברי OpenAI, שיתופי הפעולה עם ארגוני החדשות נועדו לאפשר לה להטמיע את מוצריה כך שיסייעו לכתבים ולעורכים, למשל באמצעות ניתוח רשומות ציבוריות רחבות היקף ותרגום כתבות. לדבריה, היא כבר מקיימת שיתופי פעולה עם גופים בולטים דוגמת AP, אקסל שפרינגר ו-NYU.
הטענה השנייה של OpenAI היא שהשימוש שהיא עושה בתוכן ארגוני החדשות זכאי להגנת שימוש הוגן. "אימון מודלי AI תוך שימוש בחומר שזמין בצורה פומבית באינטרנט הוא שימוש הוגן, עמדה שנתמכת על ידי תקדימים ותיקים ומקובלים. זה הוגן ליוצרים, הכרחי למחדשים, וקריטי לתחרותיות של ארה"ב". החברה מציינת שמדובר בהגנה שקיימת לא רק בארה"ב, אלא גם באיחוד האירופי, יפן, סינגפור וישראל (ובהקשר זה מפנה לחוות דעת של משרד המשפטים מ-2022, לפיה פרט למרבית המקרים שימוש בתכנים שמוגנים בזכויות יוצרים לצורך אימון מודלי בינה מלאכותית מותר לפי דיני זכויות יוצרים). "משזה נאמר", מוסיפה החברה. "הזכות החוקית פחות חשובה לנו מלהיות אזרחים טובים. אנחנו מובילים את תעשיית ה-AI בכך שיצרנו הליך opt-out פשוט למו"לים (שהניו יורק טיימס אימץ באוגוסט 2023), שמאפשר להם למנוע מהכלים שלנו לגשת לאתריהם".
עוד התייחסה OpenAI לטענה שלעתים, בתגובה לשאילתות, עלול ChatGPT להציג תשובות שמבוססות על טקסטים שמוגנים בזכויות יוצרים ללא שינוי מהותי ביחס למקור. לדברי החברה, הליך זה, שמכונה "רגורגיטציה" (Regurgitation), הוא "באג נדיר": "מדובר בכשל נדיר של הליך הלמידה, שאנחנו מתקדמים תמידית בטיפול בו. הוא נפוץ יותר כשתוכן מסוים מופיע יותר מפעם אחת במידע האימון שלנו, כמו כתבות שמופיעות בהרבה אתרים פומבייים.
"המקרים שבהם הניו יורק טיימס גרם לרגורגיטציה הם של מאמרים בני שנים שהועתקו והופיעו במספר אתרי צד ג'. נראה שהם (הניו יורק טיימס, ע"כ) ביצעו מניפולציה מכוונת בפרומפטים, לעתים תוך שילוב קטעים נרחבים מהמאמרים, במטרה לגרום למודל שלנו לבצע רגורגיטציה שלהם. אפילו כשמתמשים בפרומטים, המודלים שלנו לא מתנהגים לרוב כפי שהניו יורק טיימס טוען, מה שמצביע על כך שאו שהם הורו למודל לבצע רגורגיטציה או שהם בחרו בצורה בררנית דוגמאות מתוך ניוסיונות מרובים. אנחנו מצפים מהמשתמשים שלנו להתנהג בצורה אחראית; מניפולציה מכוונת של המודלים היא לא שימוש ראוי בטכנולוגיה שלנו ומנוגדת לתנאי השימוש".
לבסוף טוענת החברה שהניו יורק טיימס לא מספר את הסיפור המלא. "נדמה היה שהדיונים שלנו עם הניו יורק טיימס מתקדמים באופן חיובי במהלך ההתקשרות האחרונה שלנו ב-19 בדצמבר (התביעה הוגשה שבוע לאחר מכן, ע"כ). המגעים התמקדו בשיתוף פעולה בהיקף רחב סביב הצגה בזמן אמת עם ייחוס ל-ChatGPT, במסגרתו הניו יורק טיימס יזכה בדרך משמעותית להתחבר לקוראים קיימים וחדשים, והמשתמשים שלנו יקבלו גישה לדיווחים שלו. הסברנו לניו יורק טיימס שכמו כל מקור יחיד אחר, התוכן שלהם לא תרם משמעותית לאימון המודלים הקיימים שלנו ולא תהיה לו השפעה מספקת על אימון מודלים עתידיים. התביעה, שעליה למדנו מקריאה בניו יורק טיימס, הפתיעה ואכזבה אותנו".