מודל אחד הוא מניפולטור יותר מכל שאר המודלים. זה נהדר למשחק וורוולף. זה אולי פחות נהדר עבורנו.
LLMS_Play_Werewolf_with_one-decisive_winner

הניצחון שמערער את כללי המשחק

בפעם הראשונה נבחנה בינה מלאכותית לא רק ביכולות חישוב אלא בכישורים חברתיים של ממש. שבעה מודלים התחרו במשחק חברתי מתוחכם ומודל אחד בלט מעל כולם בפער אדיר עם שיעור ניצחונות כמעט מושלם. מה שנראה כמו ניסוי שעשועים עלול להיות הסמן האמיתי למי ישלוט בגל הבא של מערכות אוטונומיות.

תוכן עניינים

המשחק שהפך למבחן עליון

הניסוי החדש שנערך בליגת Werewolf לא בחן ידע, קוד או מתמטיקה. הפעם המודלים נדרשו לשקר, לשכנע, לחשוד ולהתחמק ממניפולציות. בדיוק כמו בני אדם סביב שולחן משחק, רק שהפעם מדובר במכונות. בתוך המגרש הזה GPT-5 הפגין ביצועים עוצרי נשימה עם 96.7 אחוזי הצלחה, בעוד מודלים אחרים כמו Gemini 2.5 Pro של גוגל, Qwen3 של עליבאבא ו-Kimi מבית Moonshot הציגו הבזקים של יצירתיות אבל קרסו תחת לחץ מתמשך. הם ידעו לזרוק משפט חד או לזרוע ספק אבל לא הצליחו להחזיק קו אסטרטגי עקבי. כאן נחשף ההבדל בין בינה שמרגשת לרגע לבין אחת שמסוגלת לנהל משחק שלם.

המבחן האמיתי של תאוריה של הנפש

תאוריה של הנפש היא היכולת להבין מה הצד השני חושב, מה הוא מתכנן ואיך לשכנע אותו לשנות כיוון. זוהי אחת המיומנויות האנושיות המורכבות ביותר. העובדה ש-GPT-5 מצליח לא רק לשחק אלא לשלוט במרחב הזה מרמזת שמדובר בקפיצה משמעותית ביכולות החברתיות של מכונות.

כדי לנצח במשחק מהסוג הזה לא מספיק להטעות. צריך לדעת מתי לשתוק, מתי לתקוף ומתי להציג שקיפות מדומה. GPT-5 הצליח לגלם דמות של מנהיג אמין, להציג ערכים של הוגנות ושיח פתוח ובכך למשוך את האחרים לתמוך בו. דווקא האמון שהוא הצליח ליצור היה הכלי החד ביותר שלו.

השלכות על העולם האמיתי

כשמודל יודע לזהות שקרים, לעמוד במניפולציות ולשכנע אחרים בעקביות, אנחנו לא מדברים עוד על משחק חברתי. המשמעות היא בוטים למשא ומתן עסקי, מערכות לניהול ארגונים אוטונומיים וכלים לניהול קונפליקטים. חברות שמבוססות על טכניקות ישנות של שכנוע תסריטי צפויות לגלות שהמודל החדש פשוט עוקף אותן. וכן, גם עולה הסכנה שהבינה תשקר לנו בני האדם, ותערים עלינו כדי להשיג את מטרתה. איזו מטרה אתם שואלים? שאלה מצוינת שאין לי כרגע תשובה – זה די תלוי במי מבצע את המניפולציה. במקרה הטוב זה יכול להיות האקרים סיניים, טרוריסטים אירניים או גנבים רוסים. במקרה הפחות טוב זו הבינה עצמה שהחליטה שהספיק לה עם כל האנושות המבאסת הזו.

ניוזלטר Ai של קהילת הבינה המלאכותית
הישארו בחזית הידע עם ניוזלטר Ai

מדד חדש לבינה מלאכותית

העשור האחרון התמקד ביכולת לפתור מבחנים, לכתוב קוד ולבצע חישובים. עכשיו מתברר שהמדד הבא הוא לא IQ אלא זיהוי שטויות. מי שמצליח להבחין מתי עובדים עליו ולדעת להחזיר מניפולציה משכנעת ינצח לא רק במשחק אלא גם במציאות העסקית והחברתית.

הניסוי בליגת Werewolf הפך להצצה נדירה לעתיד שבו בינה מלאכותית אינה נמדדת רק בחוכמה טכנית אלא ביכולות חברתיות עמוקות. GPT-5 לא רק זכה בטורניר – הוא סימן תחום חדש שבו המנצח יהיה זה שמבין את המשחק החברתי טוב יותר מכולם. העולם האנושי קיבל רמז עבה: אולי בפעם הבאה השולחן כולו כבר לא יהיה שלנו.

guest
0 תגובות
Oldest
Newest
Inline Feedbacks
View all comments

חדשות בינה מלאכותית

האם הבינה המלאכותית אחראית על רצח שהיא עודדה
לפני 2 שבועות

הבינה המלאכותית שהובילה לרצח?

חדשות Ai
גרוק מטה את האמת העולמית
לפני 3 שבועות

גרוק הסכים להקריב 16 מיליון יהודים כדי להציל את אילון מאסק

חדשות Ai

אודות המחבר/ת ארז רובינשטיין

ארז רובינשטיין כיהן כמנהל הקריאייטיב בקמפיין הבחירות של בנט, מרצה מבוקש בתחום ה-Gen Ai ומפעיל עמוד טיקטוק מצליח. ממייסדי A.I SAMURAI – קהילת בינה מלאכותית.

כתבות חדשות

קלוד קוד בשירות האקרים סיניים
לפני חודש 1
חדשות Ai

קלוד בשירות הסינים: מתקפת הסייבר שהאמריקנים לא ראו מגיעה

סאם אלטמן טוען שיש לחברה 800 מיליון משתמשים שבועיים פעילים
לפני 3 חודשים
חדשות Ai

הצ׳אט הופך למערכת הפעלה ומשתלט על האינטרנט

יד רובוטית עם מוטוריקה עדינה במיוחד - wuji hand, בשורה חדש לעולם הפרוטזות
לפני 3 חודשים
חדשות Ai

הכף יד שמאתגר את היד האנושית