מצב הקול המתקדם של ChatGPT: בידור או איום?
נראה שסאם אלטמן, המנכ״ל של חברת OpenAi, באופן קבוע דואג להשיק את הכלים החדשים שלו בדיוק יום אחרי השקות של המתחרים. אז אתמול גוגל השיקו גירסה מתקדמת יותר לצ׳ט ג׳מיני שלהם, וכעת אף אחד כבר לא זוכר את זה, כי ChatGPT השיקו לכל העולם את מצב הקול המתקדם שהם הציגו לפני 3 חודשים. שימו לב שזה הושק לרוב העולם, ואם אתם משלמים על מנוי פרו תעשו אפדייט לאפליקציה, ואם זה לא עובד נסו להסיר ולהתקין מחדש.
הצ׳ט הקולי החדש מאפשר שיחות קוליות בשפה טבעית יותר מאי פעם. כתבים שקיבלו גישה מוקדמת לפיצ'ר מדווחים על חוויות מהנות, משעשעות ומדי פעם גם קצת קריפיות. המצב החדש נבדק עוד באלפא עם הגבלות מסוימות, אך מה שהשתחרר היום לכל המנויים בשירות Plus ו-Teams אמור להיות הרבה יותר בשל. וכן, גם אני ניסיתי אותו והנה קטע קצר מאחת השיחות הראשונות שלנו, במהלכה הצ׳ט סיפר לי על שירה הידוע של נעמי שמר ״ירושלים של זבל״…
חוויה קולית עם טוויסט
כתבים מציינים שהחידוש המשמעותי ביותר במצב הקול המתקדם היה היכולת לקטוע את ChatGPT באמצע המשפט ולבקש ניסוח אחר. למרות שהפיצ'ר הזה לא טבעי לשיחה אנושית רגילה, הוא מדגיש גמישות חדשה בתקשורת עם הבינה המלאכותית. עם זאת, למרות הציפייה להופעות שירה, כיוון שהדבר הודגם במצגת הראשונית, היכולת לשיר לא נכללת בגירסת הנוכחית. הדבר נובע בחלקו מהחשש להפרת זכויות יוצרים, לפי OpenAI.
ההבדל העיקרי נמצא בטכנולוגיה. אם הצ׳ט הקודם תמלל את הדיבור שלנו, ואז ענה בטקסט שהומר לשפה (מה שלקח די הרבה זמן) הרי שכעת הצ׳ט ממש שומע ומאזין ומבין את הקול שלנו מבלי שיצטרך לתמלל דבר, מה שמוביל לאינטראקציה הרבה יותר מהירה ואמיתית.
ההפתעות שבקול המלאכותי
חלק מהכתבים גילו שמצב הקול המתקדם אינו חף מתחושות אי נוחות. רעשי רקע כמו רחש סטטי לבן נשמעו במהלך שיחות ארוכות, ולפעמים צלילים פתאומיים ומעוררי תחושה לא נעימה התגנבו. באחת מהשיחות, כשהתבקש הבוט להפיק קול בלון מתפוצץ, נשמע רעש פיצוץ חזק ואחריו קול נשיפה אנושית, מה שגרם לתחושת אי נוחות. עם זאת, החוויה הכללית שתיארו הכתבים לא הייתה של חשש או איום, אלא יותר תחושה של בידור קליל. תוכלו לבקש מהצ׳ט לספר לכם סיפור ילדים באינטונציה מפחידה, או לחילופין, בטון שכאילו היא עצמה מפחדת.
הבינה המלאכותית מגיבה גם לשיחות בשפות שונות, כולל צרפתית, יפנית וגרמנית, מה שהפך את החוויה לרב-שפתית ומעשירה. באופן מוזר ראיתי הדגמות בהן הצ׳ט צחקה אך אני לא הצלחתי להביא אותה לצחוק, גם כשביקשתי במפורש. לא יודע אם זה גליץ׳ אצלי או שהאפשרות הזו ירדה, ואולי זה תלוי שפה. עוד אבדוק את זה. בנוסף, אני ביקשתי ממנה לחקות דמויות מפורסמות, אך היא סירבה בטענה שאסור לה. לעומת זאת מבטאים מרחבי העולם היא עשתה, וזה די משעשע:
מבט לעתיד: הרחבת הפיצ'רים ושיפור יכולות
עם ההשקה לקהל הרחב שמנוי בתשלום על האפליקציה, OpenAI השיקה מגוון קולות חדשים וגם שיפרה את העיצוב הגרפי של הממשק. נוסף על כך, מתוכננות פונקציות שיתוף מסך ווידאו, שהודגמו כבר באביב, אך טרם שוחררו לשימוש. כמו כן, OpenAI שיפרה את היכולת של ChatGPT להבין מבטאים שונים, והתגובות אמורות להיות מהירות ומדויקות יותר.

מצב הקול המתקדם עדיין לא זמין בכמה אזורים כמו האיחוד האירופי, בריטניה ונורווגיה, אך OpenAI ממשיכה להרחיב את יכולות ההתאמה האישית של ChatGPT. משתמשים יוכלו להגדיר את התגובות לפי העדפותיהם, ואף לשמור זיכרון משיחות קודמות לשימוש עתידי.
העתיד הקרוב מבטיח שינויים נוספים, ואם הפיצ'ר ימשיך להתפתח בכיוונים שמספקים בידור לצד שיחות קוליות טבעיות, הוא עשוי לשנות את האופן שבו אנשים מתקשרים עם בינה מלאכותית בצורה יומיומית ולהערכתי גם יתפוס נתח נכבד מזמן ההאזנה לרדיו ולפודקאסטים – ברוכים הבאים לעידן חדש שבו יש לכם פרטנר קולי שאתם עלולים להתאהב בו. או בה.