חידה שישבה כמעט שמונים שנה. ואז בינה מלאכותית הפילה אותה
פאול ארדש היה מתמטיקאי הונגרי שאהב לנדוד. הוא ישן בספות של חברים, היה מגיע למוסד אקדמי כלשהו עם מזוודה קטנה, ופותר חידות תוך כדי שיחה. ב-1946 הוא ניסח חידה שנשמעה תמימה: אם יש לכם הרבה נקודות על דף נייר, כמה מהזוגות יכולים להיות במרחק של בדיוק יחידה אחת זה מזה?
הנושא נראה פשוט עד שמתחילים לחשוב עליו. ארדש עצמו השאיר את ההוכחה התחתונה הטובה ביותר. עד עכשיו כל מי שניסה להתקדם בה השתמש בגרסאות של אותה רשת רבועה שארדש הציע. כולם האמינו שזה כנראה הכי טוב שאפשר להגיע אליו.
ביום שלישי שעבר OpenAI פרסמה שמודל הסקה פנימי שלה הפריך את ההשערה הזו לבדו. הוא בנה משפחה אינסופית של תצורות נקודות שמייצרת הרבה יותר זוגות במרחק יחידה ממה שהרשת הרבועה מצליחה.
זו הפעם הראשונה שבינה מלאכותית פותרת באופן עצמאי בעיה פתוחה מרכזית בתחום מתמטי. ולפי פוסט של נואם בראון מ-OpenAI, "לפני פחות משנה מודלים בקדמת השדה היו ברמת זהב באולימפיאדה הבינלאומית. אני מצפה שהקצב הזה ימשיך."
למה דווקא ההפרכה הזו חשובה?
אם תקראו רק את הכותרת, תחשבו שמדובר בעוד תחרות בנצ'מארק שעברה. זה לא המקרה הזה. ההוכחה החדשה לא משתמשת באף טריק גיאומטרי קלאסי. במקום זאת היא קופצת לגמרי מהשדה הגיאומטרי ומתחברת לתורת מספרים אלגברית. שדה אחר לחלוטין במתמטיקה, שמתעסק במערכות מספרים שמרחיבות את המספרים הרגילים.
הכלים שהמודל גייס נשמעים כמו רשימת מצרכים של מבחן דוקטורט: מגדלי שדה מחלקה אינסופיים, תאוריית גולוד-שפרביץ', שדות מספרים אלגבריים. דברים שכמעט אף אחד בקהילת הגיאומטריה הדיסקרטית לא חיפש בכיוון שלהם.
לדבריו של תומאס בלום, אחד המתמטיקאים שעבר על ההוכחה, התוצאה רומזת שתורת המספרים העמוקה אולי מחזיקה תשובות לבעיות אחרות בגיאומטריה דיסקרטית שאיש לא חשד שיש להן קשר אליה. ארול שאנקאר, חוקר במספרים, ניסח את זה בצורה חדה: זו ההוכחה שמערכות בינה מלאכותית יכולות לעבור משלב של עוזרים למתמטיקאים, לשלב של ייצור רעיונות מקוריים משלהן.
הזוכה במדליית פילדס, טים גוורס, אחד המתמטיקאים החיים החשובים בעולם, פרסם הערות מלוות וקרא לתוצאה "אבן דרך במתמטיקת בינה מלאכותית". לשם ההקשר: גוורס לא נמצא בכיס של אף חברת בינה מלאכותית, והוא בילה את הקריירה שלו בהסבר למה הוכחות מתמטיות אמיתיות הן עניין עדין.
זוכרים את הבושה של אוקטובר?
הסיפור הזה היה נשמע פשוט אילולא התקרית הקטנה מלפני שבעה חודשים. באוקטובר 2025 קווין ויל, אז סגן נשיא ב-OpenAI, הכריז בטוויטר שג'יפיטי-5 פתר עשר בעיות פתוחות של ארדש.
זו הייתה כותרת מצוינת. למשך כמה שעות.
אז תומאס בלום, אותו תומאס בלום, שמתחזק את אתר ארדש פרובלמס, בדק והבחין שהמודל לא הוכיח שום דבר חדש. הוא מצא פתרונות שכבר פורסמו בספרות. ויל פרסם, וקיבל מענה מבזה. בלום קרא לזה "הצגה שגויה דרמטית". יאן לקון מ-מטא ודמיס חסאביס מדיפמיינד נכנסו לדיון עם תגובות לעגניות. ויל מחק את הפוסט. באפריל האחרון הוא עזב את OpenAI.
במילים אחרות: OpenAI הגיעה להכרזה הזו עם חוב אמינות כבד בתחום המתמטיקה. מה שעושה את התגובה החיובית מהקהילה השבוע מעניינת שבעתיים.
איך נראית עכשיו אסטרטגיית האימות?
OpenAI למדה את הלקח, וזה ניכר באופן ההכרזה. החברה לא הוציאה את הפוסט לבד. היא ליוותה אותו במסמך נפרד עם חתימות של מתמטיקאים מובילים שאישרו את ההוכחה באופן עצמאי. נוגה אלון מפרינסטון, מהקומבינטוריקאים החשובים בעולם, מתאר את בעיית מרחק היחידה כ"אחת החביבות על ארדש". מלאני ווד, ויל סוואין, ובלום עצמו. אותו בלום שהפיל את ההכרזה הקודמת, היה מהראשונים שעמדו מאחורי החדשה.
כשהאיש שחשף את השגיאה שלך חותם מתחת לתוצאה הבאה שלך, זה מקבל משקל אחר.
פרט חשוב נוסף: זה היה מודל הסקה כללי, לא מערכת ייעודית למתמטיקה. לא היו לו כלי חיפוש מיוחדים לבעיה הזו. הוא לא עבר אימון על מאגר מותאם. הוא קיבל את ניסוח הבעיה ופעל ממנו.
זה ההבדל בין אלפא-פרוף של דיפמיינד, שתוכננה במיוחד למתמטיקה, לבין מה שקרה כאן. אם מערכת ייעודית מנצחת באולימפיאדה, זו הצלחה הנדסית מצוינת. כשמודל כללי פותר בעיה פתוחה שמומחים נכשלו בה במשך שמונים שנה, השאלה כבר לא "מה זה אומר על המתמטיקה". השאלה היא מה זה אומר על שאר הדברים שאנחנו מבקשים ממודלים שכאלה לעשות.
אז למה זה משנה לכל מי שלא מתמטיקאי?
בלום ניסח את זה יפה: "הבינה המלאכותית עוזרת לנו לחקור באופן מלא יותר את קתדרלת המתמטיקה שבנינו במשך מאות שנים. אילו עוד פלאים בלתי-נראים מחכים בכנפיים?"
אני אומר זאת אחרת. במשך שנתיים חברות הבינה המלאכותית ניסו לשכנע את העולם שמודלי השפה שלהן יכולים לעשות עבודה אינטלקטואלית אמיתית. הן הראו לנו שהם יודעים לסכם מאמרים, לכתוב קוד, לנהל פגישות, לענות על שאלות לקוח. אלה דברים שימושיים, אבל הם לא חידשו. הם עיבדו מידע קיים בצורה נוחה יותר.
הוכחה מתמטית מקורית לבעיה פתוחה היא הדבר ההפוך. היא דורשת לייצר משהו חדש שלא היה קודם. במשך עשרות אלפי שנות מחשבה אנושית, רק יחידים הצליחו לייצר את זה בקנה מידה מהותי. ועכשיו יש מודל כללי שעשה את זה בלי שאיש ביקש ממנו לחפש את הקשר לתורת מספרים אלגברית. יש כאלו שקוראים לזה אלפא גו מומנט, על שם אותו מהלך שאלפא גו ביצע במשחק הגו נגד שבע פעמים אלוף העולם, לי סדול. מהלך 37 במשחק השני. מהלך שסטטיסטית בן אנוש לא אמור לבצע, מהלך שהביא למחשב את הניצחון באותו המשחק.
זה אומר משהו על עוד המקצועות. ביוטכנולוגיה, פיזיקה, הנדסה, רפואה. כל תחום שבו פתרון בעיות דורש קפיצה ממקצוע אחד למקצוע אחר, מתחיל לעמוד בפני האפשרות שמודל יכול לעשות את הקפיצה הזו טוב מאדם. וזה גם די הגיוני: אדם מומחה בתחום אחד, ויודע באופן מעורפל על תחומים סמוכים. מודל כללי מאומן על כל המקורות הציבוריים בו-זמנית.
לאן מכאן?
ספקנות בריאה עדיין צריכה להישמר. זו תוצאה אחת ממודל ש-OpenAI לא חשפה לציבור. הפרשה הקודמת לימדה אותנו מה קורה כשמשלבים אופוריה עם בדיקה לא מספקת. סקירת עמיתים רחבה עוד לפנינו.
אבל כשהאיש שהביך אתכם בפומבי לפני שבעה חודשים חותם השבוע על העבודה החדשה שלכם, זה שיח אחר לגמרי.
ב-1946 ארדש שאל שאלה, ולא חי לראות את התשובה. שמונים שנה אחר כך מודל כללי, שאף אחד לא בנה במיוחד בשבילו, סגר את הפינה. אם אתם עדיין חושבים שמודל שפה זה כלי לסיכום מסמכים, אולי הגיע הזמן להתעורר.