ענקיות הטק כבר לא לבד: למידת המכונה מגיעה לשוק הרחב

למידת מכונה מאפשרת למחשבים להפיק תחזיות ותובנות מדוגמאות עבר מבלי שתוכנתו לכך ישירות • שורה של כלים חדשים, שמפתחים בין השאר סטארט-אפים ישראלים, הופכים את השימוש בלמידת מכונה מסובכת לנגיש, גם לארגונים ותיקים וקטנים יותר

באוסטרליה משתמשים בלמידת מכונה כדי לקבוע היכן להציב מצלמות מהירות / צילום: Shutterstock
באוסטרליה משתמשים בלמידת מכונה כדי לקבוע היכן להציב מצלמות מהירות / צילום: Shutterstock

הוועדה לבטיחות בדרכים של מערב אוסטרליה היא אולי לא מה שקופץ לראש כשחושבים על גוף טכנולוגי מתקדם. למרות זאת, בשנים האחרונות החלה הוועדה לאמץ מודלים של למידת מכונה (Machine learning: ML) כדי לקבוע באילו צמתים להציב מצלמות לבדיקת חצייה באור אדום ומהירות מופרזת. מצלמות כאלה נחשבות לשיטה בטוחה לצמצום התנגשויות בצמתים אך באזור ענק כמו מערב אוסטרליה, שגדול יותר מפי מאה מישראל, לא ניתן להציבן בכל הצמתים.

בעבר הוועדה השתמשה בקובץ אקסל כדי לדרג ידנית את הצמתים בהם היו בעבר יותר תאונות חמורות ולהציב בהם מצלמות. אלא שמודל למידת מכונה הלך צעד קדימה וחזה את הסיכון לתאונות עתידיות בצמתים השונים. פיילוט ראשוני הוביל להורדה של 25% במספר ההתנגשויות.

גם תאגיד המזון והמשקאות הענק פפסיקו מיישם למידת מכונה בצורה יצירתית בקו הייצור של חטיפי הצ’יפס. לתוך מודל למידת המכונה הוזנו תוצאות השקילה של תפוחי אדמה לפני ואחרי הקילוף שלהם במפעל כדי לזהות את מידת הקילוף האופטימלית הנדרשת. התוצאה חסכה לחברה מיליון דולר בשנה, בארה"ב לבדה.

"מה שנחשב היום לחדשני יהפוך לסנדרט"

למידת מכונה היא תת-תחום בתוך עולם הבינה המלאכותית (Artificial Intelligence: AI), אף שהמושגים AI ו-ML לעיתים קרובות משמשים לסירוגין כדי לייצג את אותו הדבר. למידת מכונה מתייחסת למצבים בהם המחשב לומד עצמאית מדוגמאות עבר ויוצר תחזיות וניתוחים לפי חוקים ותנאים שאף אחד לא הגדיר לו מפורשות.

בעוד שבעבר למידת מכונה הייתה כלי שהשתמשו בו רק ארגונים טכנולוגיים מתקדמים, כמו הגוגלים והאמזונים של העולם, כיום מדובר בצורך עסקי ותחרותי גם עבור חברות מסורתיות בעולמות כמו קמעונאות, פיננסים ולוגיסטיקה. החברות משתמשות בלמידת מכונה כדי לחזות ביקושים, לייעל תהליכים ולהאיץ מכירות.

אלא שבמציאות לא כל הסיפורים מוצלחים כמו הדוגמאות שפורטו למעלה. למעשה לפי סטטיסטיקה שפרסמה חברת המחקר גרטנר, כ-85% מהפרויקטים מבוססי למידת מכונה נכשלים ולא מגיעים ליישום אמיתי. הסיבה המרכזית היא מחסור בסטנדרטים לעבודה ובכלים לניהול תהליך למידת המכונה, כמו שקיימים למשל בעולמות פיתוח הקוד.

"למידת מכונה זה תהליך אחר מפיתוח תוכנה", אומר שי גרינפלד, מייסד שותף בקרן גרינפילד פרטנרס, שחקרה את התחום. "צריך להבין את הדאטה שיש לארגונים, לנקות אותו ואז לבנות מודלים. אחר כך צריך להמשיך לתמוך ביישומים שיצרת. לכל זה לא מספיקים אנשי מקצוע כמו מהנדסי למידת מכונה או מדעני נתונים אלא נדרש גם סט של כלים. כלים כאלו דרושים במיוחד כשמדובר על ארגון קטן או בינוני שלא יכול לשכור את המומחים הכי טובים בשוק. גם לחברות קטנות ובינוניות יש המון דאטה ולפי הסקרים רובן רוצות להשתמש בלמידת מכונה, אך רק 6% עושות זאת בפועל. זה פער שצריך להיסגר".

שי גרינפלד, מייסד שותף בקרן הצמיחה  Greenfield Partners / צילום: Greenfield Partner
 שי גרינפלד, מייסד שותף בקרן הצמיחה Greenfield Partners / צילום: Greenfield Partner

אורן רזון, מנכ"ל ומייסד שותף בסטארט-אפ סופרווייז (Superwise), שעוסק בניטור למידת מכונה וגייס עד היום 7 מיליון דולר, אומר כי "פעם ארגונים השתמשו בלמידת מכונה בפרויקטי צד לטווח הארוך, אבל היום מדובר כבר על משהו שמניע את ההחלטות העסקיות היומיומיות ועומד במרכז הפעילות של החברה. אבל כדי שגם ארגון כמו רמי לוי יוכל לאמץ למידת מכונה, צריך יותר אנשי מקצוע וכלים פשוטים יותר לשימוש. בסוף זה יקרה ומה שנחשב היום לחדשני יהפוך לסנדרט".

לשפר את הדאטה או את המודל?

בעולם התוכנה הקלאסי התפתח תחום שנקרא DevOps, הלחם של פיתוח (Development) ואופרציה (Operations) כלים ומתודולוגיית כדי לתמוך בתהליך הפיתוח השמים דגש על הקשר של המפתחים עם יתר הארגון, ובעולם למידת מכונה הכלים והמתודולוגיה המקבילים המלווים את התהליך זוכים לשם MLOps (הלחם של למידת מכונה ואופרציה). לפי תחזית שפרסמה חברת המחקר Cognilytica, שוק כלי ה-MLOps יגלגל ב-2025 כ-4 מיליארד דולר, בהשוואה ל-525 מיליון בלבד ב-2020. עד 2030 צפוי השוק לגדול ל-5.7 מיליארד דולר.

עבודה שכתבו בגרינפילד פרטרנס מחלקת את שוק כלי MLOps לתתי-תחומים וסוקרת את החברות הפועלות בכל אחד מאלו. תת-התחום הראשון עוסק בהכנת הדאטה של ארגונים לשימוש בלמידת מכונה וכולל כלים המחלקים אותו לקטגוריות, מוסיפים תוויות אוטומטיות וגם מעשירים את הנתונים. יש מי שיטענו שתחום זה הוא הקריטי ביותר כיוון שבעוד בעולם התוכנה הדגש המרכזי הוא על איכות הקוד, המפתח ליצירת למידת מכונה מוצלחת הוא מידע טוב.

בפתיחת ההרצאה המקוונת שלו על MLOps פרופ’ אנדרו אנג, ממומחי הבינה המלאכותית המובילים בעולם, חד לצופים חידה על מקרה אמיתי. מפעל שמייצר יריעות פלדה מנסה לזהות בהן נוכחות של 39 פגמים אפשריים. אימון ראשוני של מערכת ראייה ממוחשבת מבוססת למידת מכונה מספק זיהוי של 76% מהפגמים, אבל המפעל רוצה להגיע ל-90%. האם כדאי לנסות לשפר את המודל או את הדאטה כדי להגיע לתוצאה טובה יותר? התשובה: שיפור המודל הביא ל-0% שיפור לעומת 17% שהושגו משיפור הדאטה שעליו מאמנים את המודל.

"כשארגון מתחיל לעבוד עם למידת מכונה, הדבר הראשון שהוא צריך זה להגדיר את הבעיה העסקית שהוא רוצה לפתור ולקבוע KPI’s (מדדי ביצוע מרכזיים, א"ד), שעל פיהם אפשר יהיה להעריך את השיפור", מסביר ד"ר אורי כהן, דירקטור בכיר לדאטה ומדע הנתונים בחברת הפינטק ג'אסט. "אחר כך אתה הולך לאסוף או לייצר דאטה. לפעמים יהיה לך דאטה חלקי ותוכל להשלים אותו ממקורות מידע חיצוניים כיוון שיותר דאטה משפר את המודל. אפשר להגיד שכל עוד יש לך דאטה טוב, תוכל לפתור כל בעיה עם למידת מכונה".

 

התפקיד של הסטארט-אפ הישראלי דטומייז, שהכריז בחודש שעבר על גיוס ראשוני של 6 מיליון דולר, הוא במידה מסוימת להמציא יש מאין דאטה. בלשון מקצועית יותר קוראים לזה מחולל דאטה סינטטי.

"לקוח אחד שלנו רצה לזהות את התנאים בהם מוצרים הופכים לפגי תוקף, אבל היו לו רק מאות בודדות של רשומות מתאימות לניתוח", מסבירים אבי וייס וד"ר סיגל שקד, שניים ממייסדי דטומייז, בשיחה משותפת. "אנחנו יצרנו על בסיס מודל מתמטי עוד גרסאות של הנתונים בתנאים חדשים של טמפרטורה שונה ועם תאריך ייצור משתנה. התוצאה הייתה שיפור החיזוי פי שניים כי המודל תמיד טוב כמו הדאטה שמזין אותו".


להסביר את המודל ללקוח הקצה


אחרי העבודה על הדאטה, תת-התחום הבא עוסק בכלים שמסייעים לפיתוח מודל למידת המכונה. בתחום הזה פועלים סטארט-אפים ישראליים כמו קומט (Comet), שמפתח תוכנה המאפשרת למדעני נתונים לנהל את תהליך פיתוח המודלים והניסויים. בשלב הזה רצה למעשה תחרות בין מאות ואלפי מודלים שונים, עד שמתקבל אחד שמספק את התחזית הטובה ביותר. הסטארט-אפ הישראלי (Deci) מפתח תוכנה שמאפשרת לתכנן מודלים שיהיו גם חסכוניים יותר במשאבי המחשוב שהם צורכים.

אחרי שיש מודל ודאטה, אפשר לנסות להפוך אותם מניסוי במעבדה למוצר אמיתי בשימוש. בשלב הזה פועלים סטארט-אפים ישראליים כמו קוואק (Qwak). אבל גם אחרי שיש מוצר ביד, הבעיות ממש לא הסתיימו. הסכנה שהמודל יהפוך ללא רלוונטי או לא מדויק במפגש עם המציאות מרחפת תמיד מעל. סכנה מרכזית היא של "סחף נתונים" (Data Drift), שמתרחש כאשר האוכלוסייה שהמודל רץ עליה בחיים שונה מהדוגמאות עליהם אומן במעבדה. כדי למנוע מקרים כאלה פועלים סטארט-אפים שמתמחים בניטור למידת מכונה כמו סופרווייז, שהוזכרה קודם, ואפוריה (Aporia), שגייס 30 מיליון דולר מאז הקמתו ב-2019.

"זה לא נפוץ כל כך בארץ, אבל בארה"ב מקובל שמועמדים עוברים ראיונות עבודה מול בוט מבוסס למידת מכונה, שנותן להם בסוף ציון", מדגים לירן חסון, מנכ"ל ומייסד אפוריה. "מערכת הניטור שלנו זיהתה שהבוט של לקוח נותן באופן קבוע ציון נמוך יותר למועמדים עם מבטאים שונים כמו הודי או ישראלי, פשוט כי אלו דברים שהבוט לא נתקל בהם בשלב אימון המודל. צריך לזכור שהדוגמאות שהמודל לומד מהן זוהי תמונת המציאות שהוא מכיר וכאשר העולם האמיתי לא מזכיר את הדוגמאות האלו יש בעיה".

לפעמים הבעיה היא לא שהמודל שלא אומן מספיק טוב, אלא המציאות שהשתנתה. "אחד הלקוחות שלנו הוא חברת שעוסקת בזיהוי הונאות ברכישות אונליין על בסיס ההתנהגות של הרוכשים", מספר רזון מסופרווייז. "אבל מספיק שאחד הסוחרים מכריז על מבצע גדול ומיד הלקוחות מתחילים להתנהג אחרת לגמרי. בשלב הזה אתה כבר לא יכול לסמוך על המודל".

סקר שוק שערך כהן מצא כי סטארט-אפים עם פעילות ניטור למידת מכונה בעולם גייסו עד לאוגוסט האחרון כ-3.8 מיליארד דולר ממשקיעים. חלק מהסטארט-אפים האלו מתמקדים אך ורק בניטור ואחרים מציעים כלים נוספים. כיווני התרחבות פופולריים של סטארט-אפים העוסקים בניטור הם לעולמות של יצירת אוטומציות שיסייעו ללקוחות לתקן בעיות שצצות במודל וגם לתחום של הסברת המודל למשתמש קצה. ארגונים פיננסים באירופה למשל מחויבים ברגולציה להסביר ללקוחותיהם למה מודל למידת המכונה סירב לתת להם הלוואה.

האם יתפתח פתרון קאנוני?

רוב הסטארט-אפים הישראליים בעולם ה-MLOps מציעים כלים ממוקדים שלרוב שייכים לתת-תחום אחד ועונים על צורך ספציפי בתוך תהליך הפיתוח והיישום של למידת מכונה. רוב הסטארט-אפים הישראליים גם גייסו סכומים צנועים יחסית של עשרות מיליוני דולרים.

אלא שבעולם פועלים גם סטארט-אפים ותיקים יותר שגייסו מאות מיליוני דולרים ומציעים פלטפורמות שנותנות פתרון מקצה לקצה, המכסה את כל שלבי התהליך. שמות מוכרים מאוד בתת-תחום זה כוללים את דאטה בריקס (DataBricks), שגייס עד היום כ-3.5 מיליארד דולר לפי שווי של 38 מיליארד דולר, מה שמציב אותו בצמרת הסטארט-אפים בעולם במונחי שווי; דאטה רובוט (DataRobot), שהגיע לשווי של 6.3 מיליארד דולר; ודאטה-אייקו (Dataiku), ששווה 4.6 מיליארד דולר.

"היסטורית כאשר התחילו לדבר על למידת מכונה בעשור הקודם, קמו סטארט-אפים עם מוצר ספציפי. אבל השוק אז לא היה בשל ולקוחות ביקשו עוד ועוד דברים וכך הסטארט-אפים הוסיפו בהדרגה יכולות למוצר. בסוף הם הפכו לחנות כלבו שעושה הכל אבל לא ממש מצטיינת בשום דבר", אומר חסון.

בעולם הזה של פתרון מקצה לקצה פועלות גם ענקיות הענן, אמזון, מיקרוסופט וגוגל, שמציעות גם הן כלים כאלו, אבל בשוק טוענים כי אלו לא מתאימים לכולם. "אם מגיע אלינו סטארט-אפ קטן וצעיר, אני ממליץ לו ללכת על פלטפורמה שתיתן לו פתרון כולל, גם אם הוא ב-60% מהרמה. אבל ככל שהצוות גדל, חברות מעדיפות לבחור בכל קטגוריה את הכלי הטוב ביותר", מוסיף רזון.

נישה נוספת ב-MLOps היא של כלי למידת מכונה אוטומטית (Auto ML), שמספקים מודלים מוכנים מראש וקלים לשימוש בתחום ספציפי המאפשרים גם למי שאינם אנשי מקצוע לאמץ למידת מכונה. בתחום זה, שנועד להתגבר על המחסור החמור בשוק במומחי למידת מכונה, פועל למשל הסטארט-אפ הישראלי פקאן, שגייס עד היום 116 מיליון דולר.

שוק ה- MLOps הוא עדיין צעיר מאוד ומבוזר למדי עם היצע רחב של כלים בכל תת-תחום. האם בשנים הקרובות נראה מנצחים ומפסידים ברורים בו? "כשמסתכלים על העתיד הקרוב, אני לא רואה פתרון אחד שישתלט על כל התהליך, יהפוך לקאנוני ויוביל את כל השוק", אומר כהן. אבל גם אם לא פתרון כולל, אז לפחות מובילי בקטגוריה. "אני חושב שלאורך הזמן נראה פתרונות שיחשבו לטובים ביותר בתתי-תחומים העיקריים של הכנת המידע, אימון המודל והפריסה שלו כמוצר", אומר גרינפלד.