מודל ה-AI הסיני DeepSeek מאיים על ההובלה האמריקאית: "יעיל יותר, זול יותר"

אבי דוד
פורסם על ידי אבי דוד

מעבדה סינית אלמונית מזעזעת את עמק הסיליקון עם מודל בינה מלאכותית שעולה על המתחרים האמריקאים - למרות מגבלות הייצוא ותקציב מצומצם

מעבדת DeepSeek הסינית מטלטלת את תעשיית הטכנולוגיה העולמית עם פיתוח מודל בינה מלאכותית שמאתגר את ההגמוניה האמריקאית. המודל, שפותח בתקציב של פחות מ-6 מיליון דולר ובמשך חודשיים בלבד, מציג ביצועים עדיפים על פני המודלים המובילים של מטא, OpenAI ו-Anthropic.

במבחני ביצועים עצמאיים, המודל החדש הוכיח עליונות בתחומי פתרון בעיות מורכבות, מתמטיקה ותכנות. השבוע, החברה שחררה גם את r1, מודל היסק שעולה על o1 של OpenAI במספר מבחנים מרכזיים.

"ההתפתחויות מסין צריכות להילקח ברצינות רבה מאוד", אמר סאטיה נאדלה, מנכ"ל מיקרוסופט, בפורום הכלכלי העולמי בדאבוס. "המודל החדש של DeepSeek מרשים במיוחד ביעילות החישובית שלו".

Ad image

ההישג מרשים במיוחד לאור המגבלות הקשות שהטילה ארה"ב על ייצוא שבבים מתקדמים לסין. DeepSeek הצליחה לעקוף את המגבלות באמצעות שימוש בשבבי H800 של Nvidia, פחות עוצמתיים מה-H100 האסורים ליצוא, ובטכניקת "זיקוק" ייחודית.

"הם משתמשים במודל גדול כדי 'ללמד' מודל קטן יותר להיות חכם בתחומים ספציפיים", מסביר צ'טאן פוטאגונטה, שותף כללי ב-Benchmark. "זו גישה יעילה מאוד מבחינת עלויות".

DeepSeek אינה לבד במרוץ: חברת 01.ai הסינית טוענת שאימנה את המודל שלה בעלות של 3 מיליון דולר בלבד, ו-ByteDance, חברת האם של TikTok, שחררה השבוע עדכון למודל שלה שעולה על OpenAI במבחני ביצועים מרכזיים.

"הצורך הוא אבי ההמצאה", אומר ארווינד סריניוואס, מנכ"ל Perplexity. "בגלל שהם נאלצו למצוא פתרונות יצירתיים, הם בנו משהו הרבה יותר יעיל".

ההתפתחויות החדשות מעלות שאלות קשות לגבי ההובלה האמריקאית בתחום הבינה המלאכותית ומאתגרות את ההשקעות העצומות של חברות הטכנולוגיה הגדולות בפיתוח מודלים ומרכזי נתונים, שאלה כמובן משקיעות מיליארדי דולרים בשנה על פיתוח של מודלים.

שתפו כתבה

פורסמו לאחרונה

הסקר השבועי

Polls

הסקר השבועי: דגם האייפון 16 הבא שלי הוא

View Results

Loading ... Loading ...

תישארו מחוברים