מחקר חדש טוען: זו העלות האמיתית של מודל ה-AI הסיני

דוח חדש שפרסמה חברת SemiAnalysis, העוסקת בייעוץ ובמחקר בתחום השבבים, העלה כי עלות הפיתוח הכוללת של מודל ה-AI הסיני דיפסיק אינה 6 מיליון דולר, כפי שדווח - אלא עשויה להגיע עד מעל 2.5 מיליארד דולר • בדוח העריכו כי עד סוף השנה, תחול ירידה של כ-80% בעלויות התפעול של מודלים דומים

אפליקציית DeepSeek / צילום: ap, Andy Wong
אפליקציית DeepSeek / צילום: ap, Andy Wong

חברת המחקר והניתוח העצמאית SemiAnalysis, המתמחה בתעשיות השבבים והבינה המלאכותית, פרסמה בשבוע שעבר מחקר חדש, המציג את העלויות האמיתיות של פיתוח מודל הבינה המלאכותית של חברת דיפסיק (DeepSeek). על־פי המחקר, בעוד בתעשייה דווח כי עלות פיתוח המודל עמדה על סכום של 6 מיליון דולר, בפועל החברה השקיעה 1.6 מיליארד דולר בתשתיות שרתים, ועוד 944 מיליון דולר בעלויות תפעול. כלומר, הסכום שטלטל את השוק, לא מייצג את עלות הפיתוח כולה. 

המהלכים שמרמזים: אמריקה לא הולכת לוותר בקלות לסטארט-אפ הסיני
WSJ | פרטים חדשים על "סם אלטמן הסיני" שגרם לטלטלה בשווקים
מה הלקח למשקיעים מהמפולת של ענקיות הטק

לראיה, ההערכה המקורית של 6 מיליון דולר התייחסה רק לעלות האימון הבסיסי של המודל - כך לפי ממצאי הדוח. היא לא כללה השקעות במחקר ופיתוח, תשתיות, ניסויים, צוותי פיתוח ותפעול שוטף של המערכות.

בתקשורת עלו דיווחים נוספים באשר לעלויות הפיתוח של החברה, הגבוהות ממה שהיא טענה והציגה, אך עם זאת, הציגו תמונה חלקית מנתוני המחקר. כך למשל, ב-CNBC דיווחו על הערכה לפיה "ההוצאות של דיפסיק על חומרה גבוהות בהרבה מ-500 מיליון דולר". אולם, המחקר המלא חושף תמונה רחבה בהרבה: כאמור, השקעה כוללת של 1.6 מיליארד דולר בתשתיות שרתים, ועוד 944 מיליון דולר בעלויות תפעול. כלומר, בעוד התקשורת התמקדה בהוצאות החומרה בלבד, הדוח המלא מציג את העלות הכוללת של פיתוח והפעלת המודל - סכום הגבוה פי שלושה מזה שדווח בתקשורת. הדוח מציין כי התמקדות בעלות האימון בלבד (5.6 מיליון דולר), היא כמו "להצביע על חלק ספציפי מהחשבונית של מוצר ולייחס אותו לעלות הכוללת".

מחברי הדוח: ירידה בעלויות הפיתוח - תופעה מוכרת בתעשייה

דיפסיק עוררה סערה בשווקים, כשהציגה מודל בינה מלאכותית, שלכאורה, פותח בעלות נמוכה במיוחד. החברה, שהוקמה במאי 2023, היא למעשה חטיבה של קרן הגידור הסינית High-Flyer, המנהלת נכסים בהיקף של 8 מיליארד דולר. הפרסומים על המודל ה"זול" הובילו, בין היתר, לירידה חדה של כ-17% במניית אנבידיה  ומחקו ממנה כ-600 מיליארד דולר. אך לפי ממצאי המחקר, מאחורי הקלעים התמונה מורכבת יותר: עוד ב-2021, שנתיים לפני הקמת דיפסיק, נטען כי High-Flyer רכשה כ-10 אלף מעבדי מחשוב של אנבידיה. כמו כן, כיום החברה מעסיקה 150 עובדים ומציעה משכורות של עד 1.3 מיליון דולר לעובדים מהאוניברסיטאות המובילות בסין.

עוד טוען המחקר כי דיפסיק וקרן האם שלה מחזיקות יחד בכ-50 אלף מעבדי מחשוב מתקדמים של אנבידיה מסוגים שונים, ביניהם מעבדים מדגם H20 - גרסה שפותחה במיוחד עבור השוק הסיני. דיפסיק עצמה פיתחה טכנולוגיה חדשה בשם Multi-Head Latent Attention (MLA), המפחיתה ב-93% את השימוש בזיכרון המחשב ומוזילה את עלויות ההפעלה של המודלים.

עם זאת, מציין המחקר כי המודל החדש של דיפסיק (R1) אמנם מציג ביצועים דומים למודל GPT-4o של OpenAI - הגרסה המיוחדת לפתרון בעיות ומשימות מורכבות שהושקה במאי 2024. אולם, החוקרים מדגישים כי בתחום הבינה המלאכותית, המתפתח במהירות רבה, שמונה חודשים הם פרק זמן משמעותי. בזמן הזה, OpenAI כבר פיתחה גרסאות מתקדמות יותר. יתרה מזאת, החוקרים מסבירים כי שיפורים טכנולוגיים מאפשרים מדי שנה להשיג את אותן יכולות בעלות נמוכה יותר של כוח מחשוב - בין פי 4 לפי 10. מבחינה זו, העובדה שמודל חדש משיג ביצועים דומים למודל ישן יותר, בעלות נמוכה יותר, היא תופעה מוכרת בתעשייה. SemiAnalysis מעריכה כי מגמה זו תימשך, וכי עד סוף השנה, עלויות התפעול של מודלים דומים עשויות לרדת בעוד 80%.