top of page
תמונת הסופר/תDror Gill

סיכום עדכוני דצמבר של OpenAI


ביום שישי האחרון חברת OpenAI השלימה את "12 הימים של OpenAI", סדרת ההכרזות שלה שכונתה גם "Shipmas". כדי לעזור לכם למצוא את הידיים והרגליים במבול ההכרזות הזה, סיכמתי כאן את העידכונים המשמעותייים ביותר, ואת התובנות שלי לגבי כל אחת מהם.


סופרמודלס

מודל o1: חכם יותר, חזק יותר, גבוה יותר

חברת OpenAI שיחררה את הגרסה הסופית של מודל השפה o1, המודל ש-״חושב״ לפני שהוא עונה. זו לא רק גרסה יציבה יותר מהקודמת - יש לה גם 34% פחות שגיאות, ותוצאות גבוהות יותר במבחני מתמטיקה ותכנות בהשוואה לגרסת o1 preview. המודל הזה זמין עכשיו לכל המשתמשים המשלמים ChatGPT, עם מגבלות שימוש כמובן בגלל דרישות החישוב הגבוהות.


מהתנסות קצרה עם o1 זה באמת מודל מרשים מאד - הוא כתב לי תוכנה שבמכה ראשונה עשתה בדיוק את מה שהתכוונתי. כשנתתי את אותה משימה ל-GPT-4o ול-Claude Sonnet 3.5, שניהם לא הצליחו לספק לי את הקוד הנכון אפילו אחרי כמה ניסיונות.


Source: OpenAI

חברת OpenAI הציגה גם סוג חדש של מנוי בשם "ChatGPT Pro", שעולה 200$ לחודש (לעומת 20$ ל-ChatGPT Plus). המנוי הזה כולל גישה בלתי מוגבלת ל-o1, ל-GPT-4o ולמצב השיחה הקולית המתקדם (Advanced Voice Mode), וגם מאפשר גישה למוד חדש של o1 שנקרא "o1 pro mode", שמשתמש ביותר כוח חישוב מה-o1 הרגיל כדי "לחשוב עמוק יותר" ולספק תשובות טובות יותר. אבל כמו שאפשר לראות בגרף, פער הביצועים בין o1 ל-o1 pro הוא מינימלי, ולכן לא הייתי ממליץ על מנוי ChatGPT Pro רק בשביל המוד החדש הזה, אלא בעיקר עבור משתמשים כבדים שצריכים גישה בלתי מוגבלת ל-GPT-4o ולמודל o1 הרגיל. אין דבר מעצבן יותר מלשלם על שירות פרימיום (ChatGPT Plus), ואז להיחסם למשך 3 שעות אחרי שהגעת למגבלות השימוש שלך...


מודל o3: קפיצת מדרגה בדרך ל-AGI

גולת הכותרת של Shipmas הגיעה ביום שישי האחרון, כש-OpenAI הכריזה על o3, מודל השפה החדש שלהם. o3 מצטיין בטיפול בבעיות מורכבות ביותר בתחומים כמו מתמטיקה מתקדמת ומחקר מדעי, בייחוד בעיות הדורשות חשיבה בשלבים.


מודל ה-o3 השיג שיעור הצלחה מדהים של 25.2% במדד FrontierMath החדש, הכולל בעיות מתמטיות מאתגרות במיוחד שדורשות חשיבה לוגית עמוקה. לשם השוואה, כל המודלים הקודמים (כולל o1) קיבלו ציון נמוך מ-2% במבחן הזה. o3 גם השיג ציונים מדהימים במבחני קידוד, עם שיפור של 22.8% לעומת o1 במדד SWE-Bench Verified, ודירוג של 2727 במבחן "Codeforces". זה בעצם שם את o3 במקום ה-175 מבין כל המתכנתים התחרותיים בעולם.

source: @deedydas on X

המודל o3 עמד בהצטיינות גם במבחן "ARC-AGI", עם ציון של 75.7% במצב "מחשוב נמוך" ו-87.5% במצב "מחשוב גבוה". רק שימו לב שבמצב "מחשוב גבוה", o3 צורך אלפי דולרים של כוח מחשוב לכל משימה... הציון הגבוה במדד ARC-AGI לא אומר ש-o3 הגיע ל- AGI (Artificial General Intelligence), כי הוא עדיין נכשל בכמה מהשאלות הקלות, אבל זה גבוה משמעותית מכל מודל אחר - לצורך השוואה, המודל o1 preview קיבל ציון של 13%, ומודל o1 הסופי הגיע ל-31%.


ווידאו בכל מקום

סוף סוף סורה

סורה, מודל הטקסט לווידאו המיוחל של OpenAI שהוכרז עוד בפברואר, יצא לאור סוף סוף החודש. אחרי כמה תקלות קטנות שבגללם משתמשים לא יכלו להירשם לשירות, הוא זמין כעת לכל משתמשי ChatGPT בתשלום. באתר האינטרנט של המודל Sora.com יש עורך ווידאו מובנה עם כמה תכונות נחמדות - חיתוך והרחבה של סרטון, רימיקס של הסרטון על ידי תיאור השינויים, מיזוג שלו עם סרטון אחר ויצירת לופים חלקים של ווידאו.


בינתיים, כמה מתחרים כבר השיקו פתרונות יצירת ווידאו משלהם - Runway, Luma Labs, Pika, Kling, Minimax ואחרים. איכות הווידאו של סורה עולה על חלק מהם, אבל יום אחרי ההכרזה על סורה גוגל שיחררה את מודל הווידאו החדש שלה Veo 2, שמנצח בבירור את סורה במבחנים השוואתיים. אני בטוח ש-OpenAI כבר עובדת על Sora 2, ושנת 2025 בהחלט תהיה השנה שבה המודלים של טקסט לווידאו יבשילו ויגיעו לאיכות של המודלים הנוכחיים של טקסט לתמונה.


ווידאו בלייב

לפני 6 חודשים OpenAI ו-Google הציגו שניהם דמואים מדהימים שבהם משתמשים משוחחים עם הצ'אטבוטים שלהם תוך כדי זה שהם מציגים להם ווידאו חי מהמצלמה של הטלפון. עכשיו שתי החברות השיקו את היכולת הזו במוצרים שזמינים לכולם. הגרסה של גוגל זמינה כרגע רק ב-Google AI Studio, והיא עוד לא חלק מהצ'אטבוט Gemini, אבל OpenAI שילבה אותה ישירות ב-ChatGPT, כחלק מ-״מצב השיחה המתקדם״ (Advanced Voice Mode), והיא זמינה גם במחשב וגם בטלפון. אפשר לשתף ווידאו בלייב לא רק מהמצלמה, אלא גם מהמסך - כלומר אפשר לדבר עם ChatGPT על אתרים או אפליקציות שבהם אתם משתמשים במחשב או בטלפון. שימו לב שיכולת הווידאו לפעמים נעלמת ממצב השיחה המתקדם - כנראה בגלל העומס על השרתים של OpenAI, כי ניתוח ווידאו בזמן אמת דורש המון משאבי GPU.


אבל האמת היא שאני לא יכול לחשוב על שימוש יומיומי בתכונה הזאת. ברור שזה יכול לעזור לאנשים עם לקויות ראייה. אבל מה אפשר לעשות מעבר לזה? מה הערך המוסף של שימוש במצב ווידאו בלייב לעומת לצלם תמונה או לצלם את המסך ולהעלות אותם ל-ChatGPT? אם תמצאו שימוש כזה, ספרו לי בתגובות.


בינה מלאכותית ותפוחית

כבר לפני כמה חודשים הודיעה חברת אפל הודיעה ש-ChatGPT ישולב ב-״Apple Intelligence" שלה במערכות הפעלה iOS ו-macOS. אז ההכרזה הזאת לא הפתיעה אף אחד, אבל OpenAI בכל זאת צירפו אותה באלגנטיות לרצף ההכרזות שלהם. השילוב הזה מאפשר להשתמש ב-ChatGPT בתוך האפליקציות של אפל כדי ליצור טקסט או תמונות, ולדבר עם ChatGPT על ווידאו בלייב מהמצלמה של הטלפון (בדומה לתכונת הווידאו בלייב של OpenAI שהזכרתי קודם).


צ׳אט קורא מאפליקציות מק

התכונה של ChatGPT שנקראית "עבודה עם אפליקציות" (work with apps) הושקה כבר לפני מספר שבועות, והיא מאפשרת לאפליקציית ChatGPT במק לגשת לטקסט מאפליקציות אחרות. עכשיו OpenAI מרחיבה את התמיכה לאפליקציות רבות נוספות, כמו Apple Notes, Notion, Quip, Xcode, VS Code, PyCharm, TextEdit, Terminal ועוד. עדכון נוסף הוא שהתכונה הזאת תומכת עכשיו גם במצב שיחה מתקדם, וזה אומר שתוכלו לדבר עם ChatGPT ולבקש עריכות ושינויים תוך כדי צפייה בטקסט באפליקציות הנתמכות.


באופן אישי אני לא חושב שהפיצ'ר הזה שימושי במיוחד, מכיוון ש-ChatGPT מעתיק את הטקסט מהאפליקציה, אבל לא מכניס את הטקסט המעודכן בחזרה לאפליקציה - צריך להעתיק ולהדביק אותו חזרה באופן ידני.


כלי עבודה

קנבס: עבודה משותפת עם AI

הכלי "קנבס" ב-ChatGPT, שהיא מעין עורך טקסט מובנה, זמין עכשיו לכל משתמשי ChatGPT. הכלי שופר משמעותית מאז הבטא, וכעת הוא מופעל אוטומטית כש-ChatGPT יוצר או עורך טקסט ארוך. התמיכה בקנבס הורחבה גם ל-CustomGPTs, אז גם הצ'אטבוטים המותאמים אישית שלך ישתמשו בכלי הזה בעת הצורך.


לדעתי הכלי הזה שימושי מאוד, כי הוא מאפשר לכם לשלוט על החלקים של של הטקסט ש-ChatGPT ישנה או ישפר, והחלקים שבהם הוא לא יתערב. יש כמה באגים בעורך (למשל, גזירה והדבקה של פסקאות לא עובדת כמו שצריך), אבל סה״כ זה עדיין כלי מצוין, והיכולת לבטל פעולות בשילוב עם היסטוריה של גרסאות מאפשרת עריכה נוחה וקלה.


עדכון מעניין נוסף לקנבס הוא היכולת להריץ קוד. מכיוון שעריכה ושיפור של קוד ואיתור באגים הם אחד השימושים העיקריים בקנבס, OpenAI הוסיפה לכלי סביבת Python שלמה שמאפשרת להריץ תוכנת פייתון ישירות בתוך הקנבס. זה מוגבל כרגע רק לטקסט, ולא כל הספריות נתמכות, אבל זה עוד צעד לקראת הפיכת ChatGPT לסביבה שלמה לפיתוח קוד.


עושים סדר בשיחות

היסטוריית השיחות של ChatGPT תמיד הייתה בלאגן אחד גדול - רשימה אינסופית של כל סשן שהיה לך אי פעם עם הצ׳אט, ורק לאחרונה נוספה אפשרות לחיפוש בשיחות. עכשיו OpenAI הוסיפו אפשרות לקבץ שיחות יחד תחת Projects, ולהגדיר הנחיות מערכת (system prompts) וקבצים שמשותפים לכל הצ'אטים בפרויקט. זה דומה מאוד לתכונת הפרויקטים של קלוד, ושימושי במיוחד לצוותים שעובדים על משימות שחוזרות על עצמן.


לסיכום הסיכום


קבלו 6 המלצות לשימוש בכלים החדשים שהוכרזו ע״י OpenAI בחודש דצמבר:


  1. תעשו מנוי ל-ChatGPT Plus. באמת - זה כדאי. עבור 20$ לחודש אתם מקבלים שימוש פי 5 מגרסת החינם, וגישה מלאה לכל הכלים: חיפוש באינטרנט, Code Interpreter לניתוח נתונים, בניית GPTs מותאמים אישית, מצב שיחה מתקדם עם וידאו, מודל o1 ועוד. אם אתם משתמשים ממש כבדים, אתם יכולים לשקול לעשות מנוי ChatGPT Pro שנותן לכם שימוש בלי הגבלה של ב-200$ לחודש, אבל אל תעשו את המנוי רק בשביל מצב o1 pro - הערך המוסף על o1 לא מצדיק את המחיר.


  2. בכל משימה תנסו קודם כל את המודל o1, בייחוד במשימות שכוללות פתרון בעיות מורכבות, תיכנות, פיתוחי אלגוריתמים ומחקר טכני. תשמשו ב-GPT-4o רק ליצירת תוכן, וכשאתם צריכים לגשת לכלים של ChatGPT כמו חיפוש, קנבס ויצירת תמונות. תעקבו אחרי ההכרזת על o3 (או אחיו הצעיר o3 mini) - בקרוב יגיע אליכם מודל שהרבה יותר טוב בתיכנות, מתמטיקה וחידות הגיון.


  3. סורה זה כלי מעולה ליצירת ווידאו, והמנוי שלו כלול במנוי של ChatGPT בתשלום. אבל אם אתם צריכים עבודה מקצועית יותר ביצירת ווידאו, אני ממליץ לכם לבדוק את Pika Labs Ingredients שמאפשר לכם לשלב תמונות, אובייקטים ורקע משלכם בתוך הסרטונים שנוצרים.


  4. ווידאו בלייב: מדהים לדמואים, אבל אני עדיין מחפש שימושי יומיומי לפיצ׳ר הזה. אולי זה יקרה כשישלבו אותו במכשיר לביש כמו משקפיים (וגוגל כבר עובדת על מוצר כזה).


  5. השילוב של ChatGPT בתוך Apple Intelligence מאפשר בעיקר נוחות של שימוש, אבל אפשר לעשות את אותם דברים עם אפליקציות של צ׳אטבוטים (ChaptGPT, Gemini, Claude, Copilot). מצב ה-"עבודה עם אפליקציות" של ChatGPT ב-macOS יהיה שימושי רק אחרי שיוסיפו יכולת להכניס טקסט מ-ChatGPT בחזרה לאפליקציה.


  6. קנבס הוא כלי נהדר לעבודה משותפת עם AI - אפילו השתמשתי בו כדי לשפר את הפוסט הזה!


זהו, הגענו לסוף הסיכום של הסיכום של ההכרזות של OpenAI בדצמבר. מעניין מה מחכה לנו ב-2025!

131 צפיות0 תגובות

פוסטים אחרונים

הצג הכול

Comments


bottom of page