סגור
באנר דסקטופ כלכליסט טק
אפליקציית דיפסיק DeepSeek בינה מלאכותית AI חברה סינית 2
אפליקציית דיפסיק. זיקקה מודלים של OpenAI? (צילום: בלומברג)

ממשל טראמפ מאשים: ההצלחה של דיפסיק - תוצאה של גניבת קניין רוחני מ-OpenAI

בחברת הבינה המלאכותית ובבית הלבן חושדים שדיפסיק "זיקקה" את המודלים שלה כדי לבנות את R1 היריב, תוך הפרת תנאי השימוש של OpenAI. אם יתבררו הטענות כנכונות, ימשוך הדבר את השטיח מתחת לפריצת הדרך שהשיגה החברה הסינית

האם ההצלחה המפתיעה של דיפסיק (DeepSeek) הסינית, שטוענת שהצליחה לאמן מודל בינה מלאכותית (AI) מתקדם בשבריר מהעלות והמשאבים שנדרשו לפתח מודלים של חברות מערביות, היא בכלל תוצאה של גניבת קניין רוחני באמצעות ניצול מידע שייצרו המודלים של OpenAI? זה מה שטוענים עכשיו בחברת הבינה המלאכותית ובבית הלבן. אם יתבררו הטענות כנכונות, ימשוך הדבר את השטיח מתחת לפריצת הדרך שלכאורה השיגה החברה הסינית.
השבוע, זעזעה דיפסיק את עולם ה-AI והשבבים אחרי ששחררה את R1, מודל בינה מלאכותית גנרטיבית (GenAI) מתקדם, שדומה ביכולותיו למודל o1 של OpenAI, אך אומן בעלות מזערים ועם השקעה של 6 מיליון דולר בלבד בכוח מחשוב. זאת, לעומת עלויות שמגיעות לעשרות מיליוני ואף מיליארדי דולרים במודלים אחרים. החשיפה של המודל ערערה את הפרדיגמה שהנחתה את תעשיית ה-AI בשלוש השנים האחרונות, והביאה להתרסקות במניות אנבידיה, שאיבדה ביום אחד שווי שוק של יותר מחצי טריליון דולר (מאז, רשמה המניה התאוששות מסוימת).

רק מה שמעניין - הצטרפו לערוץ כלכליסט בטלגרם

ואולם, עתה טוענים ב-OpenAI שההצלחה של דיפסיק נובעת במידה רבה מהסתמכות על ההשקעה העצומה שכבר ביצעה החברה במודלי הבינה המלאכותית שלה. לדברי החברה, היא מצאה ראיות שדיפסיק השתמשה במודלים של OpenAI על מנת לאמן את R1, במה שיכולה להחשב כפגיעה בזכויות הקניין הרוחני שלה.
בחברה אמרו לפייננשל טיימס שמצאו ראיות שלפיהן דיפסיק עשתה שימוש בשיטת אימון שמכונה "זיקוק" (distillation). בשיטה זו, מפתחי AI משפרים ביצועים של מודלים קטנים יותר באמצעות פלט ממודלים גדולים יותר ובעלי יכולות רבות יותר, וכך יכולים להגיע לתוצאות דומות במשימות ממוקדות ובעלות נמוכה יותר.
מדובר בפרקטיקה מקובלת בתעשייה, כאשר חברה עושה שימוש במודלים שלה לצורך כך. ואולם, ב-OpenAI חושדים שדיפסיק "זיקקה" את המודלים שלה כדי לבנות את R1 היריב, תוך הפרת תנאי השימוש של OpenAI. תנאי השימוש של החברה אוסרים על משתמשים להעציק את שירותיה או להשתמש בפלטים המודלים כדי "לפתח מודלים מתחרים". "הבעיה נוצרת כשאתה משתמש בפלטפורמה אחרת כדי ליצור מודל משלך למטרותיך", אמר לפייננשל טיימס גורם שקרוב ל-OpenAI.
מהחברה עצמה נמסר לעיתון: "אנחנו יודעים שחברות סיניות ואחרות תמיד מנסות לזקק את המודלים של חברות AI אמריקניות מובילות. אנחנו מפעילים כלים כדי להגן על הקניין הרוחני שלנו, ומאמינים שכדי להתקדם יש חשיבות קריטית לעבודה קרובה עם ממשלת ארה"ב על מנת להגן בצורה הטובה ביותר עלה המודלים המתקדמים ביותר ממאמצי יריבים ומתחרים לקחת טכנולוגיה אמריקאית".
במקביל, בלומברג דיווחה שמיקרוסופט ו-OpenAI חוקרות האם פלטי מידע מהמודלים של האחרונה הושגו באופן לא מאושר על ידי קבוצה שקשורה לדיפסיק. מקורות עם ידע בנושא אמרו לסוכנות הידיעות שכבר בסתיו זיהו חוקרים במיקרוסופט שפרטים שכנראה קשורים לדיפסיק שואבים כמויות מידע גדולות באמצעות כלי המפתחים של OpenAI. פעילות זו יכולה להוות הפרה של תנאי השימוש של OpenAI או להוות עדות לכך שהקבוצה פעלה כדי להסיר את המגבלות שהטילה החברה על היקף המידע שאפשר לקבל.
החשדות של שתי החברות זכו לחיזוק מצד הבית הלבן. צאר הבינה המלאכותית של ממשל טראמפ, דייוויד סאקס, אמר אתמול שיש "ראיות משמעותיות", שלפיהן דיפסיק נעזרה במודלים של OpenAI לפיתוח R1. "יש טכניקה ב-AI שקוראים לה זיקוק... כשמודל אחד לומד ממודל אחר ושואב את הידע מהמודל ההורה", הוא אמר בראיון לפוקס ניוז. "יש ראיות משמעותיות שמה שדיפסיק עשתה זה לזקק את הידע של המודלים של OpenAI, ואני לא חושב שהם מאוד שמחים לגבי זה".
עד עתה, סאקס, OpenAI או מיקרוסופט טרם סיפקו ראיות לטענות אלו. עם זאת, לדברי גורמים בתעשייה מעבדות AI בסין ואף בארה"ב נוהגות לעשות שימוש בפלטי מודלים של חברות כמו OpenAI. חברות אלו השקיעו משאבים וכוח אדם משמעותיים באימון מודלים אלו, וחברות קטנות יותר נוהגות לא פעם לתפוס טרמפ על ההשקעה הזו כדי לשפר את המודלים שלהן.
"מדובר בנוהג מקובל מאוד מצד סטארט-אפים וחוקרים באקדמיה לעשות שימוש בפלטים של מודלי שפה גדולים מסחריים, כמו ChatGPT, כדי לאמן מודל אחר", אמר לפייננשל טיימס ריטוויק גופטה, דוקטורנט AI באוניברסיטת קליפורניה בברקלי. "כך אפשר לקבל בחינם את שלב המשוב האנושי. לא מפתיע אותי אם דיפסיק עושה את אותו הדבר. אם הם אכן עושים זאת, יהיה קשה למנוע את זה".
אם אכן נכונות הטענות, יעמיד הדבר בסימן שאלה גדול את ההישג של דיפסיק. קשה בשלב זה להעריך כמה הוצאות חסכה החברה בכך שתפסה טרמפ על המודלים של OpenAI, אך לא מן הנמנע שהשיטה שבה השתמשה היתה חלק מהותי בצמצום הוצאות האימון שלה. אם זה המצב, הרי שהמהפכה שבישרה החברה עלולה להתברר כמשמעותית הרבה פחות, אולי אפילו זניחה. אם לא ניתן לאמן בזול מודלים מתקדמים חדשים ללא שימוש במודלים דומים קיימים, הרי שעל מנת להשיג את פריצת הדרך הבעיה עדיין יידרשו חברות כמו OpenAI להשקיע מיליארדים רבים בכוח מחשוב לאימון מודלים.
במקרה כזה יצטרכו חברות ה-AI המובילות להתמודד עם בעיה אחרת: איך למנוע ממתחרות, ובפרט מתחרות סיניות שמסורתית מגלות נכונות מועטה לציית לחוקי קניין רוחני של חברות מערביות, לגנוב את ההישגים היקרים שלהן על מנת לפתח מודלים בשבריר מהעלות שהן נדרשו להשקיע.