בית המשפט הוא המקום הכי מעניין בעמק הסיליקון ב-2026
יש ויכוחים שמתנהלים בפוסטים, בכנסים, ובפאנלים על עתיד הבינה המלאכותית. ואז יש ויכוחים שמתנהלים תחת שבועה, כשהסיכון הוא מיליארדים ומוניטין.
השבוע, אלון מאסק מסר עדות. בתשובה לשאלות על גרוק, המודל של חברת xAI שלו, הוא אישר: כן, השתמשנו ב"דיסטילציה". מהמודלים של OpenAI.
"דיסטילציה" זו מילה נחמדה לתהליך שכולם בתעשייה מכירים ולא ממהרים לדון בו פומבית.
מה זה "דיסטילציה" ולמה כולם עצבניים ממנה
הרעיון הטכני פשוט. לוקחים מודל גדול ויקר, שולחים לו עשרות מיליוני שאלות, שומרים את התשובות שלו, ומאמנים מודל חדש על הדאטה הזאת. בסוף, המודל החדש לא "למד" מנתונים גולמיים. הוא למד לחקות את הגדול, בשבריר מהעלות.
בפועל, זה אומר שאפשר לבנות מודל שמתנהג כמו GPT-5, מבלי לשלם את רוב עלויות הפיתוח. לכן OpenAI אסרה את זה מפורשות בתנאי השימוש שלה מאז 2024: "לא תשתמשו בפלטים של המודלים שלנו כדי לאמן מודלים מתחרים."
לפי העדות, xAI עשתה את זה בכל זאת.
האירוניה ההיסטורית
קשה להתעלם מהסיפור שמאחורי הסיפור. מאסק היה בין מייסדי OpenAI בשנת 2015. הוא תרם מיליונים, גייס חוקרים, וניסח יחד עם המייסדים האחרים את החזון של "בינה מלאכותית לטובת האנושות".
הוא עזב ב-2018. ב-2023 הגיש תביעה נגדה. ב-2024 הקים את xAI כמתחרה ישיר. ועכשיו מתברר שחלק מהבסיס לתחרות הזאת בא ישירות מהמודלים של OpenAI עצמה.
זה לא מוכיח כלום משפטית. אבל כסיפור, זה מושלם.
למה זה חשוב לכל שחקן בתעשייה, לא רק למאסק
לפי טק קראנץ', "דיסטילציה" הפכה לנושא לוהט כשחברות מובילות מנסות למנוע ממתחרים קטנים להעתיק את המודלים שלהן. המאמצים של OpenAI לחסום את זה בחוזים ובטכנולוגיה לא תמיד עבדו.
העדות של מאסק פותחת שאלה שנמצאת כבר זמן רב על השולחן: מי מחזיק בזכויות על הידע שמודל שפה "רכש"?
אם אימנת מודל על מיליארדי ספרים, כתבות, ואתרים, האם הידע הזה שלך? ואם מישהו אחר אימן את המודל שלו על הפלטים שלך, הוא גונב ממך? לא ברור שיש כאן גבול מוסרי ומשפטי שנחצה. אבל ברור שהוויכוח הזה הולך להגיע לבתי משפט נוספים, ולהשפיע על כל חברת AI שבנתה את עצמה על "קיצורי דרך".
ו-DeepSeek לא שכח
מאסק לא היחיד שחשוד בדיסטילציה. כשדיפסיק R1 הסיני הדהים את כולם בינואר 2025 בביצועים שנראו בלתי אפשריים לעלות שלהם, השאלה עלתה מיד: איך? ניסויים שנעשו אז הראו שדיפסיק מסרבת לשאלות שהמודלים של OpenAI מסרבות להן, בדיוק אותן שאלות, בדיוק אותו פורמט. הסינים הכחישו.
מאסק, יאמר לזכותו, לא הכחיש. הוא אמר את זה בשבועה.
זה פותח דלת. אם בית המשפט יחליט שדיסטילציה ממודלי OpenAI מהווה הפרת תנאי שימוש ברת-תביעה, אזי כל חברת AI שהסתמכה על השיטה הזאת כדי לקצר פיתוח תימצא בעמדה בעייתית.
ורגע, זה לא רק חברות קטנות.
לאן מכאן?
הלב של הדיון הזה הוא שאלה שהתעשייה לא ממהרת לבחון: האם ניתן לקחת בעלות על "הידע" שמודל שפה רכש? האם OpenAI יכולה לתבוע על שימוש בפלטים שלה, כמו שחברת תרופות תובעת על שימוש בנוסחה?
אם התשובה כן, זה ישנה מהיסוד את הכלכלה של פיתוח AI. הגדולים יישארו גדולים, ולקטנים יהיה קשה יותר להדביק.
אם התשובה לא, OpenAI ו-Google ו-Anthropic ישנו את האסטרטגיה שלהן, יהדקו את הגישה למודלים, וירוצו מהר יותר.
בשני המקרים, העדות של מאסק היתה רק יריית הפתיחה. הסכסוך האמיתי עוד לא התחיל.