נושא01
הנתון שאנת'רופיק לא הדגישה בכותרת
כשאנת'רופיק שחררה את קלוד סונט 4.6 ב-17 בפברואר 2026, ההודעה הרשמית ציינה שיפורים בקידוד ובשימוש במחשב. מה שלא קיבל כותרת: בבדיקות עם משתמשים אמיתיים, המודל האמצעי הזה נבחר כעדיף על אופוס 4.5 — הפלאגשיפ הקודם של אנת'רופיק — ב-59% מהמקרים. ובמשימות פיננסיות ספציפיות, הוא מנצח אפילו את אופוס 4.6 הנוכחי: 63.3% מול 60.1% ב-Finance Agent v1.1.
אופוס 4 עולה 15 דולר לכל מיליון טוקן קלט ו-75 דולר לפלט. סונט 4.6 עולה 3 דולר ו-15 דולר — חמישית המחיר. ארגונים שהחליטו להשתמש בדגם הפרמיום כי 'צריך את הטוב ביותר' צריכים לחשב מחדש: עבור מרבית העומסים העסקיים, הנחה הזו כבר לא עומדת בלחץ הנתונים.
בישראל, שבה עלויות AI מחושבות לרוב מול תקציב שיווק או מחלקת IT שנלחמת על הצדקת ההוצאה, ההפרש הזה שווה לפעמים את ההבדל בין להשיק סוכן חדש ולבין לדחות את ההחלטה לרבעון הבא.
נושא02
מה בדיוק השתנה מתחת למכסה
סונט 4.6 מגיע עם חלון הקשר של מיליון טוקן בגרסת בטא. בפועל זה אומר שאפשר לתת לו את כל הסכם ההעסקה, הנוהל הפנים-ארגוני ועשרה דוחות ניתוח בפגישה אחת, מבלי שיתחיל לשכוח פרטים מוקדמים. לחברות עורכי דין, יחידות ציות ורואי חשבון שמנסים להוציא תובנות מכמויות מסמכים גדולות — זה שינוי תפעולי, לא שינוי שיווקי.
בשימוש במחשב — היכולת של הסוכן לנהל ממשקים גרפיים כמו שאדם היה עושה — המודל הגיע ל-72.5 נקודות ב-OSWorld-Verified, צמוד לאופוס 4.6 שעומד על 72.7. בתרחישים ביטוחיים ספציפיים — קבלת פנייה, חילוץ נתונים ממסמכים, ניתוב לאנשים הנכונים — הדיוק עמד על 94%. לא סביבת מעבדה; בנצ'מרק שחברות ביטוח מגדירות כמייצג עומס עבודה אמיתי.
אבל השיפור עם ההשפעה הכי גדולה על יום עבודה רגיל אינו מספר בנצ'מרק. מפתחים שקיבלו גישה מוקדמת מתארים אותו בפשטות: המודל מסיים מה שהוא מתחיל. פחות קיצורי דרך, פחות 'עצלנות', יותר עקביות בתהליכים מרובי שלבים — זה הדבר שגורם ל-70% מהמשתמשים להעדיף אותו על סונט 4.5.
המודל הזה לא רק חכם יותר — הוא מסיים מה שהוא מתחיל.
נושא03
שלושה תרחישים עסקיים שכבר עובדים
חברת ביטוח שהשתתפה בבדיקות המוקדמות בחנה תהליך קבלת פנייה חדשה: פתיחת מיילים, חילוץ נתונים ממסמכים, מילוי טפסים ומסלול לצוות הנכון. התוצאה היתה 94% דיוק — ההישג הגבוה ביותר שנמדד על הבנצ'מרק הזה עד כה. מי שניהל תהליכי underwriting ידני יודע כמה שגיאות טיפוסיות קיימות בתהליך הזה כשאדם עושה אותו שמונה שעות ביום.
Box, ספקית ניהול תוכן לארגונים, בדקה את המודל על ניתוח מסמכים ארגוניים כבדים — חוזים, דוחות פנימיים, טבלאות נתונים. סונט 4.6 השיג 15 נקודות אחוז יותר מסונט 4.5 בשאלות הסקה מורכבות. עבור צוות משפטי או פיננסי בישראל שמנסה לעבד עשרות מסמכים בשבוע, ההפרש הזה מסתכם בשעות עבודה שמוחזרות לעובדים.
דוגמה שלישית מבהירה מה 'לסיים מה שמתחילים' אומר בפועל: לקוח שתיאר תהליך ב-Salesforce — עדכון רמות חשבון ושליחת הודעות השקה לאנשי קשר ארגוניים — שנהג לתקוע באמצע. סונט 4.6 השלים אותו מקצה לקצה. ב-2026, 'לתקוע באמצע' הוא עלות עסקית מדידה: זמן מפתח לאבחון, ריצה חוזרת, בדיקות ידניות.
נושא04
מה עושים עם זה עכשיו
אנת'רופיק לא העלתה מחירים. סונט 4.6 עולה 3 דולר לכל מיליון טוקן קלט ו-15 דולר לפלט — זהה לסונט 4.5. בתוכניות Free ו-Pro ב-claude.ai הוא מודל ברירת המחדל מאז פברואר. ב-API, המזהה הוא claude-sonnet-4-6 ואין שינוי בממשק — החלפה של שורת תצורה אחת.
מי שמריץ סוכנים אוטומטיים בנפחים גבוהים ועדיין משלם על אופוס מסיבות שנכונות היו לפני שנה — כדאי שיחזור ולבדוק. לא כל משימה מצדיקה פרמיה של פי חמש, ובחלק מהמשימות הפרמיום כבר לא קונה כלום.
הדרך הנכונה לגשת לזה: להגדיר שלוש עד חמש משימות ייצוגיות של הארגון, להריץ אותן על שני המודלים ולמדוד תוצאות — לא לשלם על פרמיום לפי אינרציה. אנת'רופיק עצמה בנתה מנגנוני ניתוב שמאפשרים לבחור מודל לפי סוג משימה בתוך אותו זרימת עבודה, כך שזה לא חייב להיות בחירה של כל-או-כלום.
