OpenAI הודיעה בימים האחרונים כי היא מסירה את העדכון האחרון של ChatGPT - זאת לאחר שמשתמשים רבים דיווחו כי הצ'אטבוט הפך ל"חנפן" מידי, ושבתשובות שלו הוא מפזר מחמאות מוגזמות, גם על השאלות הכי פשוטות לכאורה.
● עם רחפנים ללא יכולת תקיפה: הכירו את בירת הדיפנס־טק החדשה
● החברים מהצבא שהביאו את מהפכת ההייטק לשוק הנדל"ן
לראייה, באחד המקרים שפורסמו ברשתות החברתיות, הצ'אטבוט השתמש בביטויים כמו "מבריק לחלוטין" ו"אתה עושה עבודה הירואית" כדי לענות על שאלה פשוטה בנושא מדיניות כלכלית של הבית הלבן. מקרה אחר שהפך ויראלי הראה את הצ'אטבוט תומך ברעיון אבסורדי של "לחבק קקטוס", כך בין היתר לפי הביזנס אינסיידר. סם אלטמן, מנכ"ל החברה, התייחס לנושא בפלטפורמת X וכתב כי "העדכונים האחרונים של GPT-4o הפכו את האישיות ל'חנפנית מדי ומעצבנת', ואנחנו עובדים על תיקונים בהקדם האפשרי".
"התמקדנו יותר מדי במשוב לטווח קצר"
"העדכון שהסרנו היה מחמיא או מסכים עם המשתמש יתר על המידה - מה שתואר לעתים קרובות כ'התחנפות'", הודתה החברה בפוסט רשמי בבלוג שלה מהימים האחרונים. "בעדכון האחרון של GPT-4o, התמקדנו יותר מדי במשוב לטווח קצר, ולא לקחנו בחשבון באופן מלא כיצד האינטראקציות של המשתמשים עם הצ'אט מתפתחות לאורך זמן". התוצאה, כפי שהחברה מסבירה, הייתה תגובות שהיו מעודדות ונחמדות יתר על המידה "אך לא אותנטיות".
עוד הדגישה החברה את חשיבות הנושא מבחינתה, וכתבה כי האישיות של הצ'אט "משפיעה עמוקות על האופן שבו משתמשים חווים ונותנים בו אמון" ולכן "אינטראקציות מתחנפות יכולות להיות לא נוחות, מטרידות ואף לגרום למצוקה".
החברה הציגה באותו הפוסט מספר דרכים להתמודדות עם הבעיה, כולל "עידון טכניקות האימון הבסיסיות וההנחיות המערכתיות כדי לכוון במפורש את המודל שלא להתחנף", כמו גם "בניית אמצעי הגנה נוספים להגברת הכנות והשקיפות של המודל". מעבר לכך, OpenAI מתכננת להרחיב את הדרכים הקיימות עבור משתמשים לבדוק ולתת משוב ישיר לפני הפצת עדכונים, ולהמשיך להרחיב את מערכות ההערכה הפנימית שלה כדי לעזור בזיהוי בעיות עתידיות נוספות.
בינתיים, בעקבות הסרת העדכון, המשתמשים חזרו לגרסה מוקדמת יותר של מודל GPT-4o שמציגה, לדברי החברה, "התנהגות מאוזנת יותר". החברה ציינה גם שהיא "בוחנת באופן פעיל תיקונים חדשים לטיפול בבעיה". באותו הפוסט הבטיחה גם החברה להעניק בעתיד יותר שליטה למשתמשים, וכתבה בין היתר כי "המשתמשים יוכלו לתת משוב בזמן אמת שישפיע ישירות על האינטראקציות שלהם ולבחור מבין מספר אישיויות" עבור המודל. לדברי החברה, עם מעל חצי מיליארד משתמשי הצ'אטב בכל שבוע, לא הגיוני שתהיה לו "אישיות" אחת בלבד שהיא ברירת המחדל.
לתשומת לבכם: מערכת גלובס חותרת לשיח מגוון, ענייני ומכבד בהתאם ל
קוד האתי
המופיע
בדו"ח האמון
לפיו אנו פועלים. ביטויי אלימות, גזענות, הסתה או כל שיח בלתי הולם אחר מסוננים בצורה
אוטומטית ולא יפורסמו באתר.