מעבדת DeepSeek הסינית מטלטלת את תעשיית הטכנולוגיה העולמית עם פיתוח מודל בינה מלאכותית שמאתגר את ההגמוניה האמריקאית. המודל, שפותח בתקציב של פחות מ-6 מיליון דולר ובמשך חודשיים בלבד, מציג ביצועים עדיפים על פני המודלים המובילים של מטא, OpenAI ו-Anthropic.
במבחני ביצועים עצמאיים, המודל החדש הוכיח עליונות בתחומי פתרון בעיות מורכבות, מתמטיקה ותכנות. השבוע, החברה שחררה גם את r1, מודל היסק שעולה על o1 של OpenAI במספר מבחנים מרכזיים.
"ההתפתחויות מסין צריכות להילקח ברצינות רבה מאוד", אמר סאטיה נאדלה, מנכ"ל מיקרוסופט, בפורום הכלכלי העולמי בדאבוס. "המודל החדש של DeepSeek מרשים במיוחד ביעילות החישובית שלו".
ההישג מרשים במיוחד לאור המגבלות הקשות שהטילה ארה"ב על ייצוא שבבים מתקדמים לסין. DeepSeek הצליחה לעקוף את המגבלות באמצעות שימוש בשבבי H800 של Nvidia, פחות עוצמתיים מה-H100 האסורים ליצוא, ובטכניקת "זיקוק" ייחודית.
"הם משתמשים במודל גדול כדי 'ללמד' מודל קטן יותר להיות חכם בתחומים ספציפיים", מסביר צ'טאן פוטאגונטה, שותף כללי ב-Benchmark. "זו גישה יעילה מאוד מבחינת עלויות".
DeepSeek אינה לבד במרוץ: חברת 01.ai הסינית טוענת שאימנה את המודל שלה בעלות של 3 מיליון דולר בלבד, ו-ByteDance, חברת האם של TikTok, שחררה השבוע עדכון למודל שלה שעולה על OpenAI במבחני ביצועים מרכזיים.
"הצורך הוא אבי ההמצאה", אומר ארווינד סריניוואס, מנכ"ל Perplexity. "בגלל שהם נאלצו למצוא פתרונות יצירתיים, הם בנו משהו הרבה יותר יעיל".
ההתפתחויות החדשות מעלות שאלות קשות לגבי ההובלה האמריקאית בתחום הבינה המלאכותית ומאתגרות את ההשקעות העצומות של חברות הטכנולוגיה הגדולות בפיתוח מודלים ומרכזי נתונים, שאלה כמובן משקיעות מיליארדי דולרים בשנה על פיתוח של מודלים.