המהפכה של המודל הסיני: "בישראל כבר הוכחנו שאפשר לעשות את זה בזול"

הסטארט־אפ הסיני דיפסיק טרף את הקלפים כשהציג מודל AI חדשני שרץ על חומרה פשוטה וזולה • מנהלי החברות הישראליות לעומת זאת טוענים שאין כאן בשורה אמיתית: "כבר שנים שאנחנו מפתחים מודלים יעילים בעלות נמוכה"

אנבידיה מול DeepSeek / אילוסטרציה: Reuters, Dado Ruvic
אנבידיה מול DeepSeek / אילוסטרציה: Reuters, Dado Ruvic

ההייטק הישראלי התעורר ביום שלישי לחוסר ודאות, לאחר שהסטארט־אפ הסיני דיפסיק הרעיד את העולם עם מודל בינה מלאכותית זול שמתבסס על חומרה פשוטה. כעת, רבים מהמנכ"לים הישראלים שואלים את עצמם כיצד יוכלו להפחית את עלויות הבינה המלאכותית שלהם, האם כדאי לאמץ את המודל הסיני, האם מעתה יוכלו להסתדר עם פחות מעבדים, ובעיקר: האם השוק אליו הם פונים התהפך על ראשו.

בגיל 40 ועם כישלון מאחוריו: הכירו את היזם הסיני שטלטל את השווקים 
לא זזים בלי AI: הדוח שמנתח את הרגלי האינטרנט בישראל 
בעיצומה של הטלטלה: ענקיות הטכנולוגיה מתכוננות לפרסום הדוחות 

לכאורה, החברות הישראליות שעשויות להיפגע מההשקה הסינית הן מפתחות מודלי הבינה המלאכותית הגדולות, ובהן AI21 של הפרופסורים אמנון שעשוע ויואב שוהם, ולייטריקס שמפתחת מודל המתחרה בסורה של OpenAI. ויחד עם זאת, על אף שדיפסיק כביכול הוכיחה שניתן לפתח מודל AI גם מבלי להסתמך על המילה האחרונה של מעבדי אנבידיה ובעלויות פיתוח של מיליוני דולרים בודדים - נראה שהחברות הישראליות מסרבות להתרגש. זאת בניגוד למטא, שהיתה על סף השקת מודל מתחרה ונאלצה לחשב מסלול מחדש באמצעות למידת הקוד הסיני.

יחד עם זאת, התחרות החריפה בין החברות, עלויות החומרה וכח האדם הכרוכות בשימור היתרון הפכו את השוק לתנודתי ביותר. שמות גדולים כמו מיסטראל ואפילו אנתרופיק מתקשות להתחרות בהצלחה במודלים הגדולים של OpenAI וגוגל ובמודלים הפתוחים מסין.

בישראל לא מתרגשים

אז מדוע חברות ה־AI הישראליות אינן מתרגשות מההשקה הסינית? "דיפסיק לא המציאו משהו חדש, אלא מינפו טכנולוגיה ידועה, כמו חיזוק 'מחשבות צלולות' באמצעים מוכרים, וביצעו אותו על גבי חומרה חלשה וזולה יותר", אומר פרופ' יואב שוהם, מנכ"ל משותף ב־AI21. "קיימת טענה שהם הוציאו על זה פחות כסף, אבל לא ניתן לאמת את זה. הם ניסו להוכיח לשוק שמה שעושים ביוקר ניתן לעשות בזול, ומה שחברות מציעות באמצעות קוד סגור, הם מציעים בקוד פתוח".

פרופ' יואב שוהם / צילום: איל יצהר
 פרופ' יואב שוהם / צילום: איל יצהר

ד"ר זאב פרבמן, מנכ"ל וממייסדי לייטריקס, מציין כי השקת המודל של דיפסיק היא "ההוכחה שבפועל מעולם לא היה ל־OpenAI יתרון יחסי אמיתי. אנחנו כבר מכירים את ההנחה הזו זמן רב וניסינו לשכנע את השוק באמיתות שלה, ורק עכשיו זה מתחוור להם".

פרבמן ממשיך ואומר כי חברות ה־AI האמריקאיות מתנהלות באופן לא יעיל. "מדיפסיק עצמה לא הופתענו: הם לקחו ארכיטקטורות קיימות של בינה מלאכותית ושיפרו אותן, והוכיחו שכדי לבנות דברים בצורה יעילה צריך לשים לב ליסודות. הם עשו את זה בתקציב נמוך כי הם לא נזקקו לניסוי וטעיה - השוק כבר קיים וידוע לכל באילו טכנולוגיות ניתן להשתמש. אבל זה לא משהו חדש: כבר שנים שאנחנו מפתחים בירושלים מודלים בעלויות שנמוכות פי 20 מהחברות האמריקאיות. בעוד שהחברות הללו מפתחות מודלים במאות מיליוני דולרים, אנחנו עושים את זה בעשרות".

ד''ר זאב פרבמן, מנכ''ל לייטריקס / צילום: אייל מרילוס
 ד''ר זאב פרבמן, מנכ''ל לייטריקס / צילום: אייל מרילוס

כעת נשאלת השאלה, האם כדאי לחברות הישראליות להשתמש בדיפסיק במקום במודל אמריקאי כדי להוריד עלויות. "חברות ישראליות טרם אימצו את המודל הסיני, ורובן עדיין לא שוקלות להשתמש בו, אבל אין מניעה מלעשות זאת", אומר אורי אלייבייב, יועץ בתחום הבינה המלאכותית. "מאחר שהוא מגיע בקוד פתוח עם עלויות נמוכות, אפשר להתנסות בו אבל אסור בשום אופן לעשות זאת ישירות דרך השרת של דיפסיק שממוקם בסין. יש להוריד את הקוד לשרתי הענן הגדולים, כמו AWS, ולהתנסות בעבודה משם".

אלייבייב אומר כי ישנו שיח על צנזורה עצמית שדיפסיק כופה על משתמשיה כשזה מגיע לנושאים שרגישים לסדר היום הסיני. "זה כמובן מעציב מאוד, אבל לא משהו שפוגם באיכות של המודל עבור רוב חברות הטכנולוגיה", הוא מוסיף.

פרופ' שוהם מאמין שהדרך של דיפסיק לארגונים הגדולים עדיין רחוקה. "יש לדיפסיק טכניקה טובה של חיפוש לא־מורכב אבל גם מגבלות. הסיבה שבחברות אין אימוץ מסיבי של מודלים מסוג זה היא חוסר הדיוק והמהימנות של המודלים, שאפשר לחיות איתם אולי כמשתמשים בודדים, אבל לא כארגון. אי אפשר להיות צודק רק 95% מהזמן. דיפסיק הוא מודל הסתברותי ובכך הוא משאיר מקום לטעויות עמוקות ומגוכחות. הוא ו־o1 של OpenAI מוכיחים ביצועים טובים בפתרון בעיות מתמטיות ובכתיבת קוד, אבל יש עוד שורה שלמה של משימות ארגוניות ששניהם לא פותרים".

תחרות מחירים בדרך?

יש החוששים שההשקה הסינית תביא חברות לרכוש פחות מעבדים גרפיים ממה שהתכוונו ותקטין את הביקוש לחומרה בשוק כולו. על כך אומר פרבמן כי "התגובה של שוק ההון למתרחש בענף מלכתחילה לא היתה מתוחכמת. גם אם צריך הרבה שבבים, זה לא הצדיק את מחיר המניה והמכפיל הגבוהים של אנבידיה שהיו קודם לכן, וייתכן שרבים ניצלו את העיתוי כדי להפטר מהמניה. אבל לאחר שהוכח שאימון מודלי בינה מלאכותית והפעלתם היא עניין זול, זה יגביר משמעותית את השימוש בהם - מה שעשוי להגדיל בתורו שוב את הדרישה לשבבים".

שוהם מ־AI21 מוסיף כי "אין בעיה לאמן מודלים גם על שבבים מתקדמים פחות, זה רק לוקח יותר זמן. אנחנו מאז ומעולם התנהגנו ביעילות באימון המודלים שלנו, וזה לא שלא ידענו שלא ניתן לאמן על מעבדים מתחת ל־H100".

"אני לא מכיר תקדים בהיסטוריה לכך שהגענו לפריצת דרך ואמרנו: נסתפק במה שיש", אומר אלייבייב. "זה יכול להגיע בטווח הקצר לתחרות מחירים על המעבדים, מה שיוריד את מניות חברות השבבים, אבל בטווח הארוך, אנחנו רק בתחילתה של מהפכת המחשוב וה־AI. חברות ימשיכו להתחרות ביניהן על מודלים משוכללים יותר, בעלי יותר פרמטרים ומידע רב יותר. למשל, למרות ההשערה שכמות המידע בעולם שניתן לאמן הגיעה לידי סיום, דיפסיק הוכיחה כיצד אפשר לסנתז מידע ולאמן מודלים טובים יותר באמצעותו, וחברות עדיין לא שיתפו עם המודלים הגדולים את המידע יקר הערך שיש להן, מה שיכול להוביל ליצירת 'בינת העל' שכולם מחכים לה".

שאלה נוספת העולה היא האם תם עידן הקוד הסגור לאור ההשקה של דיפסיק. "לקוד הסגור תמיד יש יתרון על פני הקוד הפתוח", אומר אלייבייב. "זה נכון שהמודל הסיני משתווה באיכויות למודל הסגור o1 של OpenAI, אבל היא תשיק בקרוב מודל הרבה יותר חזק, o3, וגם ג'מיני של גוגל עדיין טובה יותר מדיפסיק".

גם AI21 ולייטריקס הוציאו לשוק את המודלים האחרונים שלהן כקוד פתוח, אבל פרופ' שוהם מסביר כי התעשייה הולכת לכיוון אחר לגמרי: "חברות דורשות מודלים שיש להם מומחיות ודיוק ולכן אימוץ של מודל כבר לא מספיק. שנת 2025 תהיה שנה שבה ייעשה המעבר ממודלי שפה למערכות AI, כלומר מערכות שמערבות מודלי שפה, כלים וקוד שיחזיקו יחד כמה מערכות בו זמנית ויציגו מהימנות גבוהה. ברגע שזה יקרה, זה כבר יהיה פחות חשוב באילו מודלים משתמשים".

"ההשקה של המודל החדש אינה רק צעד טכנולוגי, אלא גם פוליטי", טען שחר ברכה, ראש תחום ענן, דאטה ו-AI בדלויט ישראל שעובד עם מחלקות פיתוח AI רבות בחברות ישראליות. "היא ממקמת את סין כגורם שמנגיש את הטכנולוגיה המתקדמת ביותר לכלל השוק. בעצם העובדה שהמודל הושק קוד פתוח, השוק כולו זוכה להזדמנות להתקדם ולהדביק את הפער. בכך, סין מאותתת לארה"ב: השגנו את הרמה שלכם, עכשיו תראו מה יש לכם להציע כדי להוכיח שאתם טובים יותר. הדינמיקה בין שתי המדינות משקפת את העלייה בחשיבות הפוליטית והלאומית של הבינה המלאכותית, במיוחד בשאלה מי שולט במקורות המידע והאינטליגנציה המתקדמים ביותר".

שחר ברכה / צילום: יח''צ דלויט
 שחר ברכה / צילום: יח''צ דלויט

למרות הנאמר, ברכה סייג מעט את דבריו והסביר: "למרות הפרסומים אודות הסכום הצנוע מאוד שהושקע באימון המודל, וכוח המחשוב הדל, צריך לוודא שמה שהסינים טוענים אכן נכון, ולא בטוח בכלל מה שנטען, הוא אכן אמת. עם זאת, במידה ואכן מדובר בנתונים נכונים, מדובר בקפיצת מדרגה שחשבנו שתתרחש רק בעוד מספר שנים. המשמעות היא, שנראה טכנולוגיות נוספות, ופיתוחים נוספים שבשאפה יוכלו להקדים את הזמן שהוערך עד שיגיעו לשוק, ולהפתיע את הציפיות".