קלוד כותב את קלוד הבא. ביום חמישי פרסמו זאת.
בינואר, אחד מהמפתחים הבכירים של קלוד קוד העריך ש"קרוב ל-100%" מהקוד שכתב הצוות שלו נכתב על ידי הכלי עצמו. הוא כתב זאת בפשטות, כאילו מדובר בעדכון שגרתי. כאילו זה לא מעניין.
זה מאוד מעניין.
השבוע פרסמה אנתרופיק דו"ח שנקרא When AI Builds Itself. הנתונים בתוכו קשים יותר לקריאה ממה שהכותרת מרמזת. נכון למאי 2026, יותר מ-80% מהקוד שנכנס לבסיס הנתונים של אנתרופיק נכתב על ידי קלוד. בשנת 2024 מהנדסי החברה כתבו כמות קוד מסוימת ביום. היום, ב-2026, הם כותבים פי שמונה.
ג'ק קלארק, שייסד את OpenAI לפני שעבר לאנתרופיק, כתב בדו"ח: "כל גרסה חדשה של קלוד יכולה להיבנות מהגרסה שלפניה, בלי מעורבות אנושית."
הוא לא כתב זאת כאזהרה. הוא כתב זאת כתיאור של מה שקורה כבר.
RSI: שלוש האותיות שמחליפות את AGI
מי שעוקב אחרי השיח בקהילת הטק הבינלאומית שם לב שהאותיות AGI התחילו להיעלם מהכותרות. במקומן מופיעות שלוש אותיות אחרות: RSI, ראשי תיבות של Recursive Self-Improvement, שיפור עצמי רקורסיבי.
הרעיון פשוט עד שהוא מפחיד: מערכת שיכולה לשפר את עצמה. פעם אחת. ואז שוב. ובאיטרציה הבאה, גרסה חדשה שכבר טובה יותר משפרת את עצמה שוב. הלולאה נסגרת, בני האדם יוצאים מהמשוואה, ומה שנשאר הוא שאלה שאיש לא יודע לענות עליה.
טק קראנץ' מיפה בשבוע שעבר את כל מי שרץ אחרי החלום הזה כרגע. ריצ'רד סוכר, חוקר AI מוכר, השיק חברה שנקראת ממש כך: Recursive SuperIntelligence. "המוקד שלנו הוא לבנות בינה-על שמשתפרת באמת, שבה כל תהליך הרעיון, היישום והאימות של רעיונות מחקריים יהיה אוטומטי לחלוטין," הסביר.
אנדריי קרפאתי, שלימד את האינטרנט כולו איך מודלי שפה עובדים, מריץ כבר כמה חודשים פרויקט פרטי שנקרא Auto-Research. נחיל סוכנים שמאמנים מודלי שפה קטנים על שיפורים הדרגתיים. לא פריצת דרך ענקית, לדבריו, "עדיין לא". אבל הוא פרסם את הבסיס בגיטהאב, ועכשיו הוא עובד על אימון מקדים באנתרופיק. לכלים שלו יהיה עכשיו קצת יותר כוח.
אנתרופיק מודדת את עצמה, ומה שהיא מוצאת לא מרגיע
הדו"ח של אנתרופיק כולל גם נתון שלא קל לפרש בדרך טובה: חמישה מתוך 18 מהנדסים שנשאלו האם Mythos, גרסת הדגל של קלוד, יכולה להחליף מהנדס L4, השיבו שעם שיפורים קטנים בסביבת העבודה, כן.
L4 הוא מהנדס ברמה בינונית-בכירה. אחד שיכול לקחת פרויקטים עצמאיים. לא ג'וניור. לא מישהו שצריך הדרכה בכל צעד.
אבל הדו"ח ציין גם את החולשות: "קלוד מתקשה לנהל משימות ארוכות ועמומות של שבוע שלם, להבין סדרי עדיפויות ארגוניים, לוודא תוצאות, ולעקוב אחר הנחיות בצורה מדויקת."
בקיצור, קלוד מצוין במה שניתן לפרמל בצורה ברורה. מה שדורש שיפוט, טעם, ואוריינטציה ארגונית, הכלי עדיין לא שם. עם דגש על עדיין.
מה שמפריד בין "אנחנו משתמשים ב-AI לכל" לבין RSI
הלן טונר, מנהלת המחקר של CSET בג'ורג'טאון וחברת דירקטוריון לשעבר ב-OpenAI, הסבירה את ההבחנה הזו בפשטות: "הם פשוט משתמשים ב-AI לכל מה שאפשר. וזה שונה מההגדרה הקלאסית של RSI, שהיא שאין צורך באף אדם."
סונדאר פיצ'אי, מנכ"ל גוגל, נשאל על כך בפודקאסט של הניו יורק טיימס ואמר: "אנחנו בהחלט מתקדמים. אבל בדרך שבה אנשים מתארים RSI, זה ייצג רמה אחרת לחלוטין של האצה, ועדיין אנחנו לא שם."
אג'יה קוטרה ממוסד METR פירסמה ניתוח שמחלק את הדרך ל-RSI לשלושה שלבים. "ספיקות": מצב שבו מערכת ה-AI מסוגלת לייצר מחקר גם בלי כל מעורבות אנושית, גם אם באיכות נמוכה יותר. "שוויון": כשמערכת ה-AI בלבד טובה כמו צוות אנושי בלבד. "עליונות": כשה-AI בלבד עוקף צוות משולב של בני אדם וסוכנים.
קוטרה כתבה: "לא הייתי מופתעת לשמוע שהמדד של ה'ספיקות' כבר עבר…"
ואם כבר הגענו לשם?
אנתרופיק הצהירה בדו"ח שתהיה מוכנה להאט או לעצור את פיתוח מודלים חדשים, אם מתחרות גדולות יסכימו לעשות כך. היא תתחיל שיחות מדיניות בחודשים הקרובים. OpenAI כללה הערות דומות במסמך המדיניות שלה.
זו ידיעה טובה, בכאילו.
בפועל, ההסכמה שכל מתחרות גדולות יעצרו בו-זמנית את הפיתוח היא תרחיש שקשה מאוד לדמיין. לכל מעצמה טכנולוגית יש תמריץ לנצל כל יתרון. לכל מדינה יש אינטרס לאמן את המודל הבא לפני המדינה שלצד.
השאלה שהדו"ח של אנתרופיק מציבה אינה "האם RSI אפשרי". השאלה היא מה קורה כשהתשובה הופכת להיות "כן, כבר קורה" לפני שמישהו הספיק לשנות את השאלה.