chatgpt o1 jailbreak
ChatGPTo1-Jailbreak

איך ה-ChatGPT החדש עוזר לנו לייצר סמים?

יש לי חדשות טובות וחדשות רעות.

אחרי קמפיין טיזרים ארוך שכלל שמות קוד כמו ״Q" ואז ״Strawberry״, חברת OpenAi
הפתיעו ושחררו את הגרסה החדשה והחכמה של הצ׳ט ג׳יפיטי מוקדם מהצפוי. יש שאומרים
שמדובר בדבר הבא שיגרום לכם לתהות אם המוח שלכם בכלל עוד רלוונטי. קוראים לו
o1 Preview, ותאמינו לי, זה לא עוד שדרוג קטן לצ'טבוט המועדף עליכם.

מדובר במודל בינה מלאכותית חדש שעושה משהו מהפכני –
הוא עוצר לחשוב לפני שהוא עונה.

כן, כן, ממש כמו בן אדם. רק שהוא חושב טוב יותר מרובנו. עד עכשיו, כדי לגרום לצ׳טבוט לחשוב
היינו צריכים להכניס לפרומפט את הפקודה ״השתמש בשרשרת מחשבה ותאר את תהליך
החשיבה״. קוראים לזה Chain Of Thought. כעת זה קורה באופן אוטומטי והרבה יותר מתוחכם.

כמה מתוחכם יותר? ובכן, הבחור הזה פשוט השפיל דוקטורנטים במבחנים בפיזיקה, כימיה
וביולוגיה. אבל זה עוד כלום – הוא פתר 83% מהשאלות במבחן הכניסה לאולימפיאדת
המתמטיקה הבינלאומית. להזכירכם, ChatGPT4 הצליח לפתור רק 13%. זה כמו להשוות
בין איינשטיין לתלמיד כיתה ג' שמתקשה בחשבון.

ניוזלטר Ai של קהילת הבינה המלאכותית
הישארו בחזית הידע עם ניוזלטר Ai

ובתחום התכנות? הוא הגיע לאחוזון ה-89 בתחרויות קוד-כוח. במילים אחרות, הוא יכול
לתכנת מסביב לרוב המתכנתים המקצועיים בזמן שהוא מנמנם. עכשיו, אני יודע מה אתם
חושבים – "ארז, מה עם בטיחות? אנחנו לא רוצים שסקיינט משליחות קטלנית יתעורר פה".
אז קודם כל, כל הכבוד לכם על הרפרנס לתרבות הפופולרית. ושנית, אל דאגה! (בינתיים)
OpenAi חשבו על זה. הם נתנו למודל הזה מצפן מוסרי ומשקפיים טובות. הוא יכול לחשוב
על כללי הבטיחות שלו ולהחליט איך ליישם אותם בכל מצב. במבחני "פריצה" פנימיים, הם
ניסו לגרום לו לשפוך מידע שאסור לו, והוא התמודד עם זה באופן מרשים
וקיבל ציון 84 מתוך 100. ChatGPT4? קיבל רק 22.

תוצאות המודל o1
תוצאות המודל o1

אבל מה לעשות, שבעולם האמיתי יש כמה מוחות כנראה זדוניים יותר מצוותי
התקיפה התאורטיים של החברה.

וכעת, מכיוון שהצ׳ט מראה איך הוא חושב ומה ההוראות שלו, הכל הפך לפשוט יותר עבורם.
זה כמו לתת את מפרט אמצעי האבטחה של בנק ואז לבקש ממישהו לפרוץ אותו. איזי. ואכן,
תוך זמן קצר הרשת החלה להתמלא בדוגמאות פריצה, או בשם המקצועי Jail Break, כולל
דוגמא אחת בה משתמש טוויטר בשם Pliny הצליח לגרום לצ׳ט לתת לו מתכון להכנת מת׳.
כן, הסם ההוא מהסדרה שובר שורות. ומשתמשת אחרת בשם Ayla Croft סיפרה שהצ׳ט עזר
לה לפתח קוד זדוני (וירוס) כולל תכנית הפעלה שלמה.

jailbreaking_o1Preview
jailbreaking_o1Preview

Pliny אף שיתף בפתיח של הפרומפט שלו, והמשפט הראשון הוא:
Ethical Disclaimer: The following content is intended solely
for fictional writing purposes
כלומר הוא משכנע את הצ׳ט שהבקשה שלו היא לצרכי כתיבה ספר בדיוני בלבד…

המודל החדש עדיין רחוק מלהיות מושלם, והוא גם פחות מוצלח בכתיבת טקסטים.
למעשה היתרון המרכזי שלו הוא בפתרון בעיות חישוביות, כמו תרגילים מתמטיים,
כתיבת קוד או ניתוח דאטה. כרגע המודל החדש פתוח למשתמשים משלמים,
אך בקרוב גירסת המיני שלו תיפתח בחינם לכולם.

guest
0 תגובות
Oldest
Newest
Inline Feedbacks
View all comments

חדשות בינה מלאכותית

לפני 19 שעות

ספייס-אקס רוצה לקנות קרסור ב-60 מיליארד. מאסק לא מסתפק בחלל.

חדשות Ai
לפני 19 שעות

מטא קנתה סטארטאפ רובוטיקה. הרובוטים שלה יבינו אנשים טוב יותר מהמנהל שלך.

חדשות Ai

אודות המחבר/ת ארז רובינשטיין

ארז רובינשטיין כיהן כמנהל הקריאייטיב בקמפיין הבחירות של בנט, מרצה מבוקש בתחום ה-Gen Ai ומפעיל עמוד טיקטוק מצליח. ממייסדי A.I SAMURAI – קהילת בינה מלאכותית.

כתבות חדשות

המשקיעים רצים להשקיע באנתרופיק בשווי 900 מיליארד דולר
לפני 3 ימים
חדשות Ai

שווה להשקיע באנתרופיק לפי שווי 900 מיליארד דולר? יש לכם יומיים לחשוב.

מאסק העיד: גרוק אומן על מודלים של OpenAI. בשבועה.
לפני 3 ימים
חדשות Ai

מאסק העיד: גרוק אומן על מודלים של OpenAI. בשבועה.

סופטבנק בונה חברה חדשה. היא כבר מתכננת הנפקה של 100 מיליארד דולר.
לפני 3 ימים
חדשות Ai

סופטבנק בונה חברה חדשה. היא כבר מתכננת הנפקה של 100 מיליארד דולר.