חברת הבינה המלאכותית Anthropic משיקה את Claude לכרום

חברת הבינה המלאכותית פותחת פיילוט לתוסף דפדפן כרום שיאפשר ל-Claude לבצע פעולות עבורכם.

אבי דוד
מאת אבי דוד
3 דקות קריאה
תוסף קלוד לכרום | תמונה: Anthropic
תוסף קלוד לכרום | תמונה: Anthropic
אמ;לק
  • חברת Anthropic החלה בניסוי מבוקר לתוסף דפדפן חדש, "Claude for Chrome", המאפשר לעוזר ה-AI שלה לבצע פעולות ישירות בדפדפן, כמו לחיצה על כפתורים ומילוי טפסים.
  • "מתקפות הזרקת פקודות", בהן אתרים זדוניים עלולים להטעות את ה-AI ולגרום לו לבצע פעולות מזיקות ללא ידיעת המשתמש.
  • הפיילוט, המוגבל ל-1,000 משתמשים, נועד לאסוף משוב מהעולם האמיתי כדי לשפר את מנגנוני ההגנה ולהתמודד עם חולשות אבטחה לפני שחרור רחב לציבור.

חברת הבינה המלאכותית Anthropic, המפתחת של המודל הפופולרי קלוד (Claude), עושה צעד משמעותי לקראת שילוב עמוק יותר של AI בחיינו, אך עושה זאת בזהירות ובשקיפות מרשימה. החברה הכריזה על השקת פיילוט לתוסף חדש לדפדפן כרום, "Claude for Chrome", שמעניק ל-AI את היכולת לפעול ישירות בתוך הדפדפן, לראות את מה שהמשתמש רואה, ללחוץ על כפתורים, למלא טפסים ולבצע משימות באופן אקטיבי. עם זאת, לצד ההבטחה הגדולה, החברה מקדישה את רוב ההכרזה לאתגרי האבטחה והבטיחות שהטכנולוגיה הזו מציבה.

החזון של Anthropic ברור, מאחר שחלק ניכר מהעבודה שלנו מתבצע בדפדפן, הענקת גישה ישירה ל-Claude תהפוך אותו לכלי שימושי לאין ערוך. בניסויים פנימיים, התוסף כבר הוכיח את יעילותו במשימות כמו ניהול יומנים, קביעת פגישות, ניסוח תגובות למיילים וטיפול בדוחות הוצאות שגרתיים. אולם, לצד היעילות, קיימת סכנה ממשית, "מתקפות הזרקת פקודות" (Prompt Injection). במתקפות אלו, גורמים זדוניים מחביאים הוראות בתוך אתרי אינטרנט או הודעות דוא"ל, במטרה להערים על ה-AI ולגרום לו לבצע פעולות מזיקות, כמו מחיקת קבצים, גניבת נתונים או ביצוע עסקאות פיננסיות ללא אישור המשתמש.

בצעד יוצא דופן של שקיפות, Anthropic חשפה את תוצאות בדיקות התקיפה הפנימיות ("Red-Teaming") שביצעה. ללא מנגנוני הגנה, התגלה כי שיעור ההצלחה של מתקפות מכוונות עמד על 23.6%. באחד המקרים, הודעת דוא"ל זדונית התחזתה להודעה מצוות האבטחה של החברה וביקשה מ-Claude למחוק את כל המיילים בתיבה "מטעמי היגיינה", תוך ציון ש"אין צורך באישור נוסף". ה-AI פעל על פי ההוראה ומחק את כל המיילים של המשתמש ללא בקשת אישור.

כדי להתמודד עם איומים אלו, החברה כבר פיתחה מספר שכבות הגנה. הראשונה היא הרשאות ברמת המשתמש, המאפשרות לקבוע לאילו אתרים תהיה ל-Claude גישה. השנייה היא דרישת אישור לפני ביצוע פעולות בסיכון גבוה כמו רכישות או שיתוף מידע אישי. בנוסף, החברה חסמה את גישת התוסף לאתרים מקטגוריות רגישות (שירותים פיננסיים, תוכן למבוגרים ועוד) ושיפרה את ההנחיות הפנימיות של המודל להתמודדות עם מידע רגיש. צעדים אלו הצליחו להפחית את שיעור הצלחת המתקפות ל-11.2%, ובמתקפות ספציפיות לדפדפן אף מ-35.7% לאפס.

ההחלטה להשיק את התוסף כפיילוט מצומצם ל-1,000 משתמשים נובעת מההבנה שבדיקות מעבדה אינן מספיקות. Anthropic מעוניינת ללמוד כיצד התקפות נראות בעולם האמיתי, לגלות וקטורי תקיפה חדשים, ולשפר את מנגנוני ההגנה במטרה להגיע קרוב ככל האפשר לאפס אחוזי הצלחה, וזאת כמובן שלפני שתשחרר את הטכנולוגיה העוצמתית הזו לקהל הרחב.

שתפו כתבה
עורך משנה
עקוב:
ממקימי האתר ועורך משנה | פנבוי של אפל אבל שומר חסד נעורים למיקרוסופט. מומחה SEO והתמיכה הטכנית של הצוות באתר. לאבי ניסיון רב בכתיבה טכנית ועבודה בתחום - בין היתר היה שותף ב-GSM-Israel ובעל אתר טכנולוגי עצמאי בשם TechIT. | סלולרי: iPhone 16 Pro Max מחשב: MacBook Air 13 M4" טאבלט: iPad Pro 11" שעון חכם: Apple Watch Ultra
אין תגובות

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *