גוגל הראתה לעולם לאן הולכים כשמשקיעים 190 מיליארד דולר בשנה
סונדאר פיצ'אי עלה ב-19 במאי לבמת Google I/O 2026 בשורליין אמפיתאטרון. הוא דיבר על מה שגוגל ייצרה בשנה האחרונה. אבל לפני שהוא הגיע למודלים והמוצרים, הוא נתן לקהל מספר אחד: 190 מיליארד דולר. זה התקציב שגוגל תוציא השנה על תשתית AI. פי שש מ-2022.
זה לא היה הקיץ של ג'מיני 3. זה היה הקיץ של ג'מיני 3.5. ובאמצע ההצגה הוא הוציא נשק שאף אחד לא חיכה לו: תמחור שיכול לבעוט ל-OpenAI בבטן.
המודל שעובד פי ארבעה מהר יותר, ועולה פחות ממחצית
ג'מיני 3.5 Flash, המודל הראשון בסדרה החדשה, הושק היום. לפי בלוג גוגל, הוא טוב יותר כמעט בכל המדדים מג'מיני 3.1 Pro. שיפור משמעותי במיוחד הוא בקוד, איפה שכל המהנדסים בעולם מסתכלים עכשיו.
אבל המספר שעלה לכותרת הוא אחר: פי 4 יותר מהר מכל מודל חזית אחר במהירות הפלט. ופחות ממחצית המחיר של מודלים מתחרים בקטגוריה דומה.
פיצ'אי ניסה לעשות חשבון בשידור חי. הוא אמר שלקוחות גדולים שצורכים טריליון טוקנים ביום, יכולים לחסוך מעל מיליארד דולר בשנה אם יעבירו 80 אחוז מהעבודה לג'מיני 3.5 Flash במקום למודלים יקרים יותר. הוא אמר את זה בקול שקט. כאילו זה לא משהו מיוחד.
זה משהו מיוחד.
3.2 קוודריליון טוקנים. פי שבעה משנה שעברה.
השנה גוגל מעבדת מעל 3.2 קוודריליון טוקנים בחודש על פני כל המוצרים שלה. שנה שעברה זה היה 480 טריליון. שנתיים אחורה זה היה 9.7 טריליון. מי שלא רגיל למספרים כאלה, זה גידול של פי 7 בשנה.
הסיבה: 13 מוצרים עם יותר ממיליארד משתמשים כל אחד. אפליקציית ג'מיני לבדה הגיעה ל-900 מיליון משתמשים חודשיים. AI Overviews בחיפוש הגיע ל-2.5 מיליארד. ו-AI Mode, החיפוש הקונבציונלי החדש, חצה מיליארד משתמשים תוך שנה. כל אחד מהם מייצר עומס ש-OpenAI לא יכולה לדמיין.
זו לא רק חוויה. זה תזרים מזומנים. גוגל מעבדת בערך 19 מיליארד טוקנים בדקה דרך ה-API שלה. וזה בלי לדבר על השימוש הפנימי, ש"מאיץ דרמטית" איך שמהנדסי גוגל בונים את המודלים הבאים.
ג'מיני אומני: המודל שעושה וידאו מכל קלט
במקביל למודל החדש של טקסט וקוד, גוגל הציגה את ג'מיני אומני, משפחת מודלים חדשה לחלוטין שמייצרת פלט בכל מודאליות מכל קלט. הראשון בסדרה, אומני Flash, מתחיל בייצור וידאו. בהמשך יבואו תמונה וטקסט.
זה דגם של "מודל עולם", כלומר מודל שמדמה את הפיזיקה והרציפות של המציאות במקום רק לחזות את המילה הבאה. ההבדל בין מודל טקסט למודל עולם הוא ההבדל בין סופר לבמאי. אומני Flash זמין עכשיו באפליקציית ג'מיני, ב-Google Flow וב-YouTube Shorts.
במשפחת המודלים החדשה גוגל מסמנת בבירור איפה היא לוקחת את העתיד. לא במילים. בעולמות שלמים שנוצרים בלחיצה.
הסוכן שלא ישן: ג'מיני ספארק 24/7
אבל אולי הבולטת שבכל ההכרזות היא ההכרזה על ג'מיני ספארק. סוכן AI אישי שרץ במכונות וירטואליות בענן של גוגל, ועובד עבורך 24 שעות ביממה. בלי שתפעיל מחשב. בלי שתפתח אפליקציה. הוא פשוט קיים, וממתין למשימות שלך.
ספארק מבוסס על ג'מיני 3.5 ועל Antigravity 2.0, פלטפורמת הסוכנים החדשה של גוגל. בעוד מספר שבועות הוא יתחבר לכלים של צד שלישי דרך MCP, פרוטוקול שמטא, אנתרופיק וגוגל אימצו זו אחרי זו. בקיץ הוא יפעל גם בתוך כרום כסוכן דפדפן. בעוד חודשים הוא יעדכן אותך באנדרואיד דרך ממשק חדש בשם Android Halo.
במילים אחרות, גוגל נכנסת לבית של המשתמש. לא רק לטלפון. לא רק לדפדפן. למרחב שבין כל המכשירים. וזה דבר ש-OpenAI הציגה כחזון אבל לא הצליחה לבנות עדיין באותה רמת אינטגרציה.
שני שבבים, שתי תחנות, מיליון יחידות
איך גוגל מצליחה להריץ הכל בעלות נמוכה כל כך? בגלל TPU. השבבים שגוגל בונה בעצמה כבר עשור. החודש היא חשפה את הדור השמיני, ובפעם הראשונה היא פיצלה את הארכיטקטורה לשניים.
TPU 8t מותאם לאימון. הוא חזק פי שלושה מהדור הקודם. ובעזרת JAX ו-Pathways, גוגל מאמנת מודלים על פני יותר ממיליון TPUs במקביל, פרושים על פני יותר ממרכז נתונים אחד. זה אומר שהיא יוצרת את המודל הגדול ביותר בעולם בשבועות במקום בחודשים.
TPU 8i מותאם להסקה. כלומר, להריץ את המודלים אחרי שהם מאומנים. הוא חוסך זמן בכל שלב. וזה מה שמאפשר את המהירות של 3.5 Flash, ואת התמחור הנמוך.
זה השוט הסודי של גוגל. בעוד ש-OpenAI משלמת לאנבידיה ולמיקרוסופט מיליארדים, גוגל מאמנת ומריצה על שבבים שהיא בעצמה מייצרת. הפרש המרווח הזה הוא ההבדל בין מי ששולט לבין מי שתלוי.
אז מה זה אומר לכל השאר?
גוגל הציגה את הכרזות I/O כסיפור אחד מעוצב: עידן ה-Gemini הסוכן הגיע. אבל מתחת לזה יש סיפור אחר, פחות גלוי. גוגל לא מנסה להיות הטובה ביותר. היא מנסה להיות הכי זולה. כי כשאתה הכי זול, אתה מנצח גם בלי להיות הכי טוב.
ג'מיני 3.5 Flash הוא חלון הזדמנות לחברות ענק שכבר שורפות תקציבי AI שיא. אם אחת מהן תעשה את המעבר, השאר יבואו בעקבותיה. וברגע שזה יקרה, אופן-אייאיי תצטרך לבחור: או להוריד מחירים ולפגוע בהכנסות, או להישאר בחזית הביצועים ולאבד נתח שוק לג'מיני.
ובינתיים, ב-Anthropic, כריס רולף וקרפאתי כבר התחילו לעבוד על הדור הבא של קלוד. וב-Tesla, מאסק בונה את Grok 5. ובמיקרוסופט, ננסי בוטה מהנדסת היכן OpenAI תרוץ עכשיו אחרי הפרידה.
וכל זה רק בשבוע אחד. שבוע אחרי שגוגל חתמה על השבב, על המודל, על האפליקציה, על הסוכן ועל המחיר. אם השנים הקרובות אכן יהיו מעצבות במיוחד, כפי שקרפאתי אמר השבוע, אז גוגל כרגע במוצב טוב יותר ממה שמישהו חשב לפני שבוע.
וזה אולי הסיפור האמיתי של I/O 2026: גוגל חזרה למשחק. וכולנו עומדים לשלם פחות על זה.