OpenAI לימדה את המצלמה לחשוב. DALL-E הלך הביתה.
OpenAI לימדה את המצלמה לחשוב. DALL-E הלך הביתה.

OpenAI לימדה את הצייר לחשוב. DALL-E הלך הביתה.

גרסה חדשה של מודל יצירת התמונות של OpenAI יצאה השבוע, ויש בה משהו שלא ראינו עד עכשיו: היא חושבת לפני שהיא מציירת. DALL-E 3 יפרוש ב-12 במאי.

תוכן עניינים

אם DALL-E היה מסוגל לקרוא כתבה, הוא היה עצוב מאוד היום

21 באפריל 2026. OpenAI השיקה את ChatGPT Images 2.0, מודל יצירת תמונות חדש שמבוסס על gpt-image-2. ובאותה הנשימה הודיעה: DALL-E 2 ו-DALL-E 3 יפרשו ב-12 במאי. בלי טקסים. בלי הספד.

DALL-E היה המותג שהכניס מיליונים לעולם יצירת התמונות. עכשיו הוא מוחלף.

מה שונה: המודל חושב לפני שהוא מצייר

זו לא עדכון. זו ארכיטקטורה אחרת.

gpt-image-2 הוא המודל הראשון של OpenAI שמשלב את יכולות ה-O-series, אותן יכולות הסקה שהפכו את GPT-4o לטוב בפתרון בעיות. לפני שהמודל מייצר תמונה, הוא מחקר, מתכנן ומסיק. לא קופץ ישר לציור.

ניוזלטר Ai של קהילת הבינה המלאכותית
הישארו בחזית הידע עם ניוזלטר Ai

במצב Thinking, הוא אפילו מחפש ברשת במהלך יצירת התמונה, ומאמת לעצמו שהפלט תואם את הפרומפט. זה קצת כמו לבקש ממעצב שיכין בריף לפני שהוא נוגע בעט.

התוצאה? יכולות שמודלי תמונות בדרך כלל נכשלים בהן. טקסט בתוך תמונות, בכמה שפות, בלי שגיאות כתיב. אינפוגרפיקות, מצגות, מפות, מנגה. TechCrunch ו-VentureBeat דיווחו שהביצועים באופן לא רשמי "מרעישים".

מי מקבל מה

OpenAI פיצלה את המודל לשני מצבים.

Instant: זמין לכולם, כולל חשבון חינמי. מהיר, ללא חיפוש רשת, עד תמונה אחת בכל פעם.

Thinking: רק ל-Plus (20 דולר לחודש) ומעלה. כאן נכנסות כל היכולות המעניינות: חיפוש רשת במהלך יצירה, עד 8 תמונות בבת אחת עם רציפות של דמויות ואובייקטים בין התמונות, ואימות עצמי של הפלט.

8 תמונות מפרומפט אחד, כשהדמויות נראות עקביות בכולן. זה פותר בעיה שגרמה להרבה כאבי ראש לכל מי שניסה לייצר סדרת תמונות עם אותה דמות.

ומה עם ה-API

למפתחים, gpt-image-2 זמין היום. התמחור הוא טוקן-בייסד: 30 דולר למיליון טוקני פלט, 8 דולר למיליון טוקני קלט. טוקני קלט שמורים ב-cache עולים 2 דולר למיליון.

זה שינוי מגישת המחיר הקבוע של DALL-E. מורכב יותר לחשב, אבל מאפשר גמישות למי שמייצר תמונות רבות עם reference images חוזרים.

ולאן זה הולך

כשמודל שפה לומד לחשוב לפני שהוא מדבר, הוא הופך לטוב יותר. אותו עיקרון, לכאורה, עובד גם על תמונות.

מה שמעניין זה לא רק הפלט. זה שOpenAI בחרה לייבא ארכיטקטורת reasoning לתחום שנחשב עד עכשיו כ"יצירתי" ולא ניתן לכימות. ציור הוא לא בעיה לוגית. אבל כנראה ש"חשיבה" לפני ציור, אפילו ברמת תכנון קומפוזיציה ובדיקת פרטים, משפרת אותו.

DALL-E הלך. gpt-image-2 הגיע. וההבדל בין השניים הוא לא רק שם.

וכן, גם התמונה לכתבה הזו נעשתה בעזרת הצ׳ט החדש – פשוט הזנתי לו את הכתבה וביקשתי תמונה שתלווה אותה.

חדשות בינה מלאכותית

המוח העולמי של גוגל התריע בוונצואלה שתי דקות לפני שהאדמה רעדה
לפני יום 1

המוח העולמי של גוגל התריע בוונצואלה שתי דקות לפני שהאדמה רעדה

חדשות Ai
החברה הישראלית שבונה עולמות מזויפים כדי ללמד מכוניות לנהוג
לפני 2 שבועות

החברה הישראלית שבונה עולמות מזויפים כדי ללמד מכוניות לנהוג

חדשות Ai

אודות המחבר/ת ארז רובינשטיין

ארז רובינשטיין כיהן כמנהל הקריאייטיב בקמפיין הבחירות של בנט, מרצה מבוקש בתחום ה-Gen Ai ומפעיל עמוד טיקטוק מצליח. ממייסדי A.I SAMURAI – קהילת בינה מלאכותית.

כתבות חדשות

רובוט אנושי כל רבע שעה: סין רצה לבורסה
לפני 2 שבועות
חדשות Ai

רובוט אנושי כל רבע שעה: סין רצה לבורסה

אמזון הפכה כל אחד למעצב חולצות. צריך רק לדבר
לפני 2 שבועות
חדשות Ai

אמזון הפכה כל אחד למעצב חולצות. צריך רק לדבר

תבעו את ה-AI שגנב מוזיקה, גבו את הכסף, ושכחו את הנגנים
לפני 3 שבועות
חדשות Ai

תבעו את ה-AI שגנב מוזיקה, גבו את הכסף, ושכחו את הנגנים