גלובס - עיתון העסקים של ישראלאתר נגיש

מודל GPT-5 יצא לשוק. עד כמה הצ'אט השתפר?

OpenAI השיקה את מודל הבינה המלאכותית החדש שלה, והבטיחה ביצועים מהירים יותר, לצד זכירת המשתמש ופיצ'רים כמו מצב אוטומטי, למידה ויכולת כתיבת קוד ● בפועל, השינויים מינוריים למדי

תמונה שיצר GPT–5 כשהתבקש לתאר ויזואלית את גרסתו החדשה / צילום: צילום מסך מתוך הצ'אט
תמונה שיצר GPT–5 כשהתבקש לתאר ויזואלית את גרסתו החדשה / צילום: צילום מסך מתוך הצ'אט

התחרות על הבינה המלאכותית מתעצמת, ובסוף השבוע שעבר הכריזה חברת ה-AI שמובילה את התחום, OpenAI, על המודל החדש ביותר שלה - GPT-5. החברה הבטיחה שמדובר במודל חכם, מהיר ושימושי יותר, בוודאי אם מדברים על כתיבה, קידוד ונושאי בריאות. בנוסף, היא השיקה את המודל לכולם, כולל למשתמשים החינמיים.

בדיקה טכנולוגית | היצרנית טוענת שזה מכשיר הדגל הראשון שלה. אז בדקנו
בדיקה טכנולוגית | האם המתקפל החדש של סמסונג שווה 7,500 שקל?

בדקנו את הכלי החדש בשפה העברית, וחזרנו עם תשובות - האם הוא מציע שיפור משמעותי שמצדיק את העדכון?

החידוש העיקרי: הביצועים, לצד הביקורת

שנתיים חלפו מאז שחרור הדור הקודם, אבל קשה לדבר על ה-GPT-5 ככזה שמביא בשורה אדירה. בדומה להשקות של סמארטפונים מדי שנה, שבהן החברות מבטיחות שהמכשיר כעת הרבה יותר טוב - גם כאן, OpenAI סיפקה מודל שמבחינת הבנצ'מרק ביחס לשוק מציע ביצועים משופרים ומהירים יותר, אבל עבור רבים, באופן לא מאוד מורגש.

בזמן שהמנכ"ל סם אלטמן סיפר כי "ניסיתי לחזור ל-GPT-4, וזה היה די אומלל", ולעומת זאת לדבר עם המודל החדש זה כמו לדבר עם דוקטור, בשוק פחות מסכימים איתו. יתרה מכך, ברשת היו מי שהתחננו לקבל בחזרה את הדור הקודם - מה שהוביל לכך שאלטמן החליט לאפשר למי שרוצה לחזור ל-4o לפחות לתקופה הקרובה.

מי שהשתמש ב־GPT-4o, זוכר את הסגנון החמים והחברי שלו - בין היתר, הצ'אט נהג להחמיא יתר על המידה, וטען כי השאלה ששאלתם היא השאלה המבריקה ביותר שהייתה יכולה להישאל. כעת סגנון השיחה השתנה, ההוא תכליתי ומדויק יותר, ובמידה מסוימת אפילו מרוחק. גם רמת השימוש באימוג'י התמתנה משמעותית, כאילו המודל התבגר. ולא כולם אוהבים את זה.

כאשר שאלנו אותו על כך, הוא הסביר שזה אחד השיפורים שנעשו, ואפשר "לחזור אחורה", רק צריך לבקש. מכיוון שהצ'אט זוכר את השיחות, ההעדפה הזו יכולה להשתמר.

אחד החידושים הוא שהמודל יכול כעת לכתוב קוד, משמע היכולת הזו היא כבר לא רק בידי מתכנתים. כך, לדוגמה, בנינו תוך מספר דקות עמוד נחיתה לאחד מכתבי גלובס - המערכת ביקשה לדעת מהיכן רוצים למשוך את הנתונים, ובנתה את העמוד.

בהשקה הדגימו כיצד המודל בנה אפליקציה ללימוד שפה בקלות, אך כשאנחנו ביקשנו ממנו אפליקציה למעקב אחר קלוריות, הוא הציג תוצאה ראשונה לא מספקת, ונדרשו תיקונים. גם לאחר התיקונים התוצאה עדיין לא הייתה מושלמת, אך זה הגיוני. עם זאת, לא תמיד שמר על ההתקדמות - משמע, אחרי שביקשנו ממנו לתקן משהו אחד, דבר אחר באפליקציה נעלם.

היתרון הבולט: ההתאמה האישית

אחד היתרונות המרכזיים של OpenAI הוא שהמודל זוכר את המשתמש, יכולת שגם גוגל הכריזה עליה השבוע. המשמעות היא שלא בכל שיחה "מתחילים מההתחלה", ושהמודל זוכר את ההעדפות ואת השאלות הקדומות, וכך מספק מענה הרבה יותר טוב.

היכולת הזו מצטרפת לשיפורים הנוספים בצ'אט: קודם כל, אפשר לעצב את הצבעים שלו, וגם לכוונן את ה"אישיות" שלו - משמע, לבקש ממנו להיות מתחשב ותומך, סרקסטי, ציניקן, רובוטי, חנון ועוד. יש גם שיפורים בקול של הצ'אט.

שיפור נוסף שעתיד לחזק את ההתאמה האישית למשתמשים הוא חיבור יומן הגוגל וחשבון ה־Gmail שלכם, כך שהצ'אט יוכל לענות על שאלות בלוח הזמנים שלכם, ולהציע לכם דברים. כמובן של־Gemini של גוגל כבר יש את החיבור המדובר, ואפילו בקלוד של אנתרופיק יש חיבור למוצרי גוגל.

אחד הפיצ'רים החדשים ש-OpenAI הכניסה הוא מצב Auto. בדרך כלל יש שתי אפשרויות: מצב מהיר, שבו מתקבל מענה מהיר מהמודל, ומצב חושב, שמתרחש במשימות שלוקחות זמן רב יותר, דורשות מחקר או קידוד. עד כה הייתם צריכים לבחור בין האפשרויות השונות, כדי שהמודל יבין מה אתם רוצים. במצב Auto המודל מבין לבד מתוך השאלה באיזה מודל עליו להשתמש - תגובה מהירה או חשיבה עמוקה.

מצב למידה: תסביר שלב-שלב

פיצ'ר חדש נוסף הוא מצב למידה. הרעיון הוא שאפשר לבקש מהמודל לענות על שאלה תוך שהוא עובר שלב־שלב בפתרון הבעיה, ומציג את הרציונל מאחורי התשובה שלו.

כך, לדוגמה, נתנו למודל שאלה ברמת 5 יחידות במתמטיקה, וביקשנו שיפתור את התרגיל במצב למידה. המודל קבע שבכל מענה ייפתר סעיף בודד, כדי לאפשר הבנה עמוקה יותר. בפועל, המודל ענה על הסעיף הראשון הפשוט באיטיות רבה יותר מאשר בתשובה מהירה, אבל סיפק מענה נכון. עם זאת, כשהגיע לסעיף השני, אף הוא פשוט ולא דורש המון חשיבה, לקח לו הרבה יותר זמן.

בסך הכול, הוא ענה על כמעט כל הסעיפים בפעימה אחת, ואף דילג על חלק משלבי הפתרון. המשמעות היא שהוא לא המשיך במצב למידה כפי שהתבקש. לצד זאת, וכנראה בגלל התאימות לשפה העברית, המודל הציג חלק מהתשובות בצורה הפוכה.

בחנו את GPT-5 גם בתרגיל מילולי שקשור בהבנת הטקסט מתוך מבחן אוניברסיטאי. המודל ערבב בין הפרטים, מה שהוביל לכך שהוא פתר את השאלה בצורה לא מדויקת. הדוגמאות האלו נקודתיות, אבל הן עדיין מראות את הפער שיש בהבנת המודל. הוא עדיין לא שולט היטב בשפה העברית, ובמקרה אחר הוא אף היפנה לעמודים לא נכונים. בקצרה, הרעיון מעולה, אבל הביצועים עדיין לא.

המחיר והמגבלות: מה תוכלו לקבל?

ב-OpenAI מאפשרים לצרכנים לעשות שימוש חינמי מוגבל, כך שבשלב מסוים הם יעברו למודל מיני חלש יותר. מי שמשלם למסלול
ה-Plus 02 דולר בחודש יקבל מגבלת שימוש גבוהה יותר, ומי שמשלם 200 דולר בחודש עבור מודל הפרו יקבל גישה בלתי מוגבלת, ואף גישה למודל חזק יותר.

בחברה מדברים על כך שהמודל השתפר מאוד בכל הנוגע להטיות או לתשובות לא נכונות. עם זאת, בשימוש הקצר שעשינו עד כה, לא הרגשנו דרמטית את השינויים האלו. המודל עדיין עשה טעויות ועדיין הציג "הזיות", לפחות בשפה העברית.

באופן כללי, בלא מעט מקרים שהמודל נדרש לתקן טעות שלו, הוא הפעיל באופן עצמאי את החשיבה העמוקה כדי למצוא פתרון הגיוני וטוב יותר. כמובן שזה לקח יותר זמן, אבל לפחות זה תיקן את הטעות.

עוד כתבות

עלי חמינאי / צילום: ap, Office of the Iranian Supreme Leader

בישראל גוברת ההערכה שחמינאי חוסל. איך ייבחר המחליף?

בישראל מעריכים שהמנהיג העליון של איראן חוסל • מה קורה כשצריך למנות לו מחליף, ואיך זה ישפיע על המבנה המסועף של משטר האייתוללות? • המשרוקית מסבירה

ג'ק דורסי, מייסד טוויטר וסקוור / צילום: Shutterstock, Frederic Legrand - COMEO

היזם שמפטר 4,000 עובדים ביום אחד. מה הוא יודע שאנחנו לא

גל פיטורים נוסף; ג'ק דורסי, ממייסדי טוויטר ומנכ"ל חברת התשלומים האמריקאית בלוק, הודיע בדואר אלקטרוני לבעלי המניות שלו כי החברה תקצץ קרוב למחצית מעובדיה ● בלוק, שנסחרת בבורסת ניו יורק לפי שווי שוק של 33 מיליארד דולר, ייצרה רווח נקי של כחצי מיליארד דולר ברבעון השלישי של השנה שעברה ● המנייה זינקה במסחר המאוחר בכ- 24%

צחי נחמיאס / צילום: ורד פיצ'רסקי

צחי נחמיאס מכה בברזל החם: הנפקת ענק לאחר דוח חזק

מגה אור מגייסת 615 מיליון שקל בהנפקה פרטית למנורה ומגדל ● ההנפקה מתבצעת בפרמיה של 5% על מחיר הנעילה בבורסה

עלי חמניאי, מנהיג איראן / צילום: ap

כמעט ארבעים שנה של דיכוי וטרור: מי הוא עלי חמינאי?

לפי הערכות, המנהיג העליון של איראן, עלי חמינאי, חוסל הבוקר במכת הפתיחה של מבצע "שאגת הארי" ● מדובר במהלך דרמטי שעלול לטלטל את מוקדי הכוח בטהרן ולשנות את מאזן ההרתעה האזורי לאחר יותר משלושה עשורים בהם חלש על השלטון

דירה להשכרה / צילום: איל יצהר

קפיצה של 40%: למה יותר מ-1,500 משקיעים קנו דירה בדצמבר?

מחירי הדירות תקועים, ושוק השכירות רותח ומזניק את האינפלציה - כמו שקרה גם בעשור שהחל ב-1998 ● אבל בזמן שהשוכרים יושבים על הגדר וסופגים עליות במחירי החוזים, המשקיעים שמזהים את הפרצה וחוזרים לשוק עם מבצעי מימון אגרסיביים וקוצרים תשואות גבוהות יותר

בלי נופים, טיולים ואטרקציות: ברוכים הבאים לחופשות השינה / צילום: Shutterstock

עם 16 שעות שינה ובלי אטרקציות: הכירו את טרנד החופשות החדש

סוכריות גומי עם שמן קנאביס, כריות שזוכרות את מבנה הראש וגם מיטות שמנתחות את איכות השינה ● קבוצה הולכת וגדלה של נופשים חיפשה פתרון לעייפות - ופיתחה טרנד שהיא מכנה sleepcation ● תעשיית האירוח מציעה ועוד ועוד שדרוגים, אבל מומחים מזהירים: "זה אינו פתרון משמעותי לחוסר"

נתב''ג / צילום: Shutterstock

המרחב האווירי נסגר: מה לעשות אם יש לכם טיסה בקרוב?

בעקבות מתקפת המנע באיראן המרחב האווירי של ישראל נסגר ל-48 שעות ● נעצרו המראות ונחיתות ● נוסעים ישראלים שנתקעו בחו"ל מתבקשים ליצור קשר עם חברות התעופה שלהם

עומאן / צילום: Shutterstock

המדינה היחידה במפרץ שנותרה חסינה מאיראן

בעוד שערב הסעודית, בחריין ואיחוד האמירויות הותקפו בשעות האחרונות על ידי משטר האייתולות, עומאן – המתווכת המרכזית בשיחות בין טהרן לוושינגטון – נותרה חסינה ● האם המלחמה הנוכחית מסייעת לה?

דונלד טראמפ, בנימין נתניהו, עלי חמינאי / עיבוד: ap, Mark Schiefelbein

יירוטים במרכז, הערכה: רצף השיגורים יימשך בשעות הקרובות

התרעות הופעלו ברחבי הארץ אחרי שיגורים מאיראן • פיצוצים בבסיס האמריקאי בבחריין, וגם באבו דאבי • דיווח: התקיפות הישראליות מתמקדות במערך הטילים, האמריקאיות - בגרעין ובמשטר האיראני • גורם ביטחוני ל-N12: "'מבצע עם כלביא היה הפרומו" • הנשיא טראמפ בקריאה היסטורית לעם האיראני: "יש לכם הזדמנות שאסור לפספס" • עדכונים שוטפים

אנשים במקלט בשל מתקפת טילים מאיראן / צילום: ap, Ohad Zwigenberg

מצב חירום במשק: מי רשאי להיעדר מהעבודה והאם מקבלים שכר

בעקבות המתקפה באיראן הוכרז מצב מיוחד בעורף. באילו נסיבות מותר להישאר בבית, האם המעסיק רשאי לפטר עובד שלא הגיע, והאם ממשיכים לקבל שכר – כולל במפעלים המוגדרים "חיוניים"? ● גלובס עושה סדר

יהלי רוטנברג, החשב הכללי באוצר / צילום: יוסי זמיר

הבכיר לשעבר שבטוח: "אנחנו הכי קרובים להשבתת פעילות הממשלה מאי פעם"

כחשב הכללי באוצר יהלי רוטנברג גייס חוב חסר תקדים, התמודד עם הורדת הדירוג הראשונה של ישראל ונדרש לצנן את הוצאות הביטחון: "אמרתי - אל תאלצו אותי לבחור בין צה"ל לעמידה בתקציב" ● עכשיו הוא חושף את הפינות האפלות שדורשות פיקוח - ומתכנן את הטרק בנפאל

מייקל ברי

מייקל ברי מזהיר: זוהי "מלכודת המיליארדים" של אנבידיה

למרות תחזית חזקה להמשך, מניית אנבידיה נופלת במסחר בוול סטריט ● מייקל ברי: הסיכון שלה גדל, אנבידיה עלולה להיתקע עם התחייבויות ענק ל-TSMC ועם מלאי שאין לו קונה - מצב שעלול לרסק את שולי הרווח שלה

דונלד טראמפ, נשיא ארה''ב / צילום: Reuters, Anadolu

למה טראמפ העדיף לתקוף דווקא בתזמון הזה?

בחינת התנהלותו של נשיא ארה״ב מצביעה על נטייה ברורה להכריז על צעדים נפיצים כשהבורסה סגורה ● מה עומד מאחורי ״אפקט סוף השבוע״ וכך תהנה ממנו הפעם גם ישראל

פיטר פלצ'יק / צילום: פאקו לוזאנו

"התמסחרתי? אין לי בעיה עם זה": פיטר פלצ'יק לא מתנצל על זה שהוא עושה כסף

לצד קריירת הספורט המרשימה, פיטר פלצ'יק דאג לפתח קריירה מסחרית, לשמש כפרזנטור של מותגים חזקים ואפילו להשתתף ברוקדים עם כוכבים ● בראיון לפודקאסט "מגרש עסקי" הוא מספר איך נראים החיים הכלכליים של ספורטאי אולימפי בישראל, ומשחזר את הרגע המיוחד עם המאמן שלו אורן סמדג'ה ● והיעד הבא? "אני בשלבים של הבאת מותג בלוקצ'יין לארץ. בעוד עשור אהיה עמוק בעולם העסקי"

מה עשה החיסכון בפברואר? / צילום: Shutterstock

הירידות במניות העיבו, אבל החודש חיובי: מה עשה החיסכון שלכם בפברואר?

למרות הירידות בבורסה בימים האחרונים, חודש פברואר צפוי להסתיים עם תשואה חיובית בקופות הגמל וקרנות ההשתלמות ● לפי תחזית מיטב, התשואה הממוצעת ברוטו של קופות הגמל וקרנות ההשתלמות תהיה בפברואר 0.5% ובחודשיים הראשונים של השנה 2.6%

בורסת אחד העם, בימים עברו / צילום: הבורסה

בדקנו: איך השתנתה הבורסה על פני 3 עשורים ומה הטיפ המנצח של גילעד אלטשולר

מחברות החזקה שהתרסקו, דרך ענקיות הפארמה שאיכזבו ועד הזינוק במניות הביטחון והטכנולוגיה: גלובס בדק כיצד השתנתה הבורסה על פני יותר משלושה עשורים ● אלטשולר ממליץ להיצמד למדדים, ש"שמזהים ראשונים את ה'ווינרים' החדשים", וסטפק מחזק: "לא חשוב כמה אתה אוהב את המניה ומעריך את סיכוייה בעתיד - תפזר" ● וגם: איזו חברה פספסה הבורסה, שהייתה יכולה להכפיל את שווייה

סם אלטמן, מייסד ומנכ''ל OpenAI / צילום: Shutterstock

OpenAI שוברת שיאים: גייסה 110 מיליארד דולר לפי שווי של 730 מיליארד

אמזון, אנבידיה וסופטבנק הובילו את הסבב הפרטי הגדול בהיסטוריה ● המהלך ממצב אותה כחברת הטכנולוגיה הפרטית בעלת השווי הגבוה בעולם ● במקביל נחתמה שותפות ענן אסטרטגית בהיקף עתק והחברה מציבה יעד של מאות מיליארדי דולרים בהוצאות מחשוב עד סוף העשור

''אחרי המסיבה''. הצעקה שמטלטלת הכול / צילום: באדיבות סלקום טי.וי

הדרמה שנחשבת לאחת הטובות של השנה ומגיעה מניו זילנד

"אחרי המסיבה" היא מיני־סדרה ניו זילנדית שהגיעה למסך הישראלי ומציעה דרמה מטלטלת על אמת שנאמרת בקול רם מדי עבור קהילה שמעדיפה שקט ● מורה לביולוגיה מאשימה את בעלה בהטרדת נער, חייה מתפרקים והעיירה כולה נאלצת לבחור צד

ד''ר אנג'לה עירוני / צילום: דוברות אסותא / עופר חג'יוב

המיילדת שהפכה למנהלת בית חולים והפרשה שהסעירה את המדינה

"לאחר שאח שלי עבר תאונת פגע וברח, שאילצה אותו לעבור ניתוח ראש מסובך, נולד החלום שלי להיות אחות בטיפול נמרץ נוירוכירורגי. לא היה מקום בתל השומר, אז התחלתי בגינקולוגיה" ● שיחה קצרה עם ד"ר אנג'לה עירוני, מנהלת בית החולים אסותא ראשון לציון והמרכז הרפואי אסותא רעננה

תור לקוםות בסניף של טיב טעם, הבוקר / צילום: באדיבות עובדי טיב טעם

הבהלה לנייר טואלט: התנפלות על רשתות השיווק. אלה המוצרים המבוקשים

בעקבות התקיפה באיראן והאזעקות הבוקר, נרשמה עלייה של מאות אחוזים בתנועת הלקוחות ברשתות הפתוחות בשבת עם זינוק בביקושים למים, שימורים ונייר טואלט ● ברשתות מדגישים כי אין מחסור וכי המלאים מלאים, בעוד שירותי המשלוחים המהירים הושבתו בהתאם להנחיות פיקוד העורף