חברת Anthropic הכריזה אמש (חמישי, 22.05) על הדור הבא של מודלי הבינה המלאכותית שלה, Claude Opus 4 ו־Claude Sonnet 4, תוך שהיא מציגה שיפורים משמעותיים ביכולות תכנות, ניתוח והפעלה של סוכני AI. לצד הדגמים החדשים, החברה השיקה כלים חדשים למפתחים, כולל הרחבות לסביבות פיתוח IDE ותמיכה מורחבת ב־Claude Code.
המוביל בין שני המודלים החדשים הוא Opus 4, שהוגדר על ידי החברה כמודל החזק ביותר שלה עד כה. הוא מצטיין בביצועים במבחני קוד כמו SWE-bench עם ציון של 72.5 אחוז ו־Terminal-bench עם ציון של 43.2 אחוז. המודל פותח כדי להתמודד עם משימות מורכבות ורציפות, כולל תהליכים שדורשים הפעלה מתמשכת לאורך זמן.
Sonnet 4, הגרסה המתקדמת של Sonnet 3.7, מציע שילוב בין ביצועים גבוהים ויעילות משופרת. גם הוא רשם הישג במבחן SWE-bench עם ציון של 72.7 אחוז. GitHub מתכננת להטמיע אותו כמודל בסיסי בסוכן הקוד החדש שלה, וחברות נוספות בתחום כמו Sourcegraph ו־Augment Code מדווחות על שיפור ביכולת ההתמודדות עם קוד מורכב.

שני המודלים מציעים תגובות מהירות במיוחד עם מצב חשיבה מורחבת המאפשר ניתוח מעמיק. מצב זה כולל אפשרות לשימוש בכלים כמו חיפוש ברשת ותמיכה בזיכרון ארוך טווח, כאשר מפתחים מאפשרים גישה לקבצים מקומיים. לפי Anthropic, המודלים החדשים משתמשים פחות בקיצורי דרך בעת ביצוע משימות מורכבות, בהשוואה לגרסאות קודמות.

Claude Code, סביבת הפיתוח של החברה, זמינה כעת לכלל המשתמשים וכוללת הרחבות חדשות ל־VS Code ו־JetBrains. ההרחבות מאפשרות צפייה בהצעות תיקון של המודל בתוך שורות הקוד עצמן. בנוסף, הושק Claude Code SDK שמאפשר הרחבות מותאמות אישית.
עבור משתמשי API, החברה השיקה ארבעה כלים חדשים כולל כלי הרצת קוד, מחבר למערכות ניהול, API לניהול קבצים, וזיכרון שמור למשך שעה. כמו כן, Anthropic שילבה תקצירי חשיבה כדי לפשט תהליכי מחשבה ארוכים, עם אפשרות להצגת רצף המחשבה המלא למפתחים במצב מפתחים ייעודי.
מבחינת עלויות, Anthropic שמרה על המחירים הקיימים. Opus 4 מוצע במחיר של 15 דולר למיליון טוקנים בקלט או 75 דולר ביציאה, בעוד Sonnet 4 מוצע במחיר של 3 ו־15 דולר בהתאמה.
המודלים החדשים עשויים לשמש בסיס לעוזר הפיתוח החדש של אפל באפליקציית Xcode. לפי דיווחים, אפל בוחנת את שיתוף הפעולה עם Anthropic כחלק ממאמציה לחזק את יכולות הבינה המלאכותית שלה.