"בשנים האחרונות מדע הנתונים (Data Science) משתלט על העולם. לא רק בתחום הטכנולוגיה אלא גם בתחומים כמו בריאות, שירותים פיננסיים, קמעונאות, משאבים טבעיים ועוד. האתגרים איתן פייסבוק או גוגל מתמודדות כשהן מנסות להיכנס לתחום, מחווירים לעומת האתגרים עמם מתמודדות חברות מסורתיות שאינן דיגיטליות", כך אומר מייקל לי, מדען נתונים אמריקאי והמייסד של ארגון "The Data Incubator", המפעיל תוכנית להכשרת מדעני נתונים תוך שמונה שבועות, בראיון ל"גלובס". לי הגיע לארץ לאחרונה כאורח של רשות החדשנות במסגרת שבוע הבינה המלאכותית שנערך באוניברסיטת תל אביב, בשיתוף אינטל ורשות החדשנות.
השימוש במדע נתונים גובר בשנים האחרונות בשל העובדה כי קיימים היום הרבה יותר נתונים, כתוצאה מחיבור מכשירים רבים לאינטרנט, ומהבנה של ארגונים כי ניתן להסיק מהם תובנות עסקיות משמעותיות. לאור זאת גדל גם הביקוש למדעני נתונים, שמשתמשים בכלי למידת מכונה כדי להפיק את אותן תובנות ולייצר תחזיות. הצורך הקיים בארגונים, וההבנה כי מי שלא יעסיק מדעני נתונים עלול להישאר מאחור, יצר מחסור בשוק. כך, לפי נתונים מעודכנים של חברת ההשמה להייטק אתוסיה, חסרים קרוב ל-400 אנשי מקצוע בתחום. תוכנית ההכשרה של לי אמורה לעזור לענות על הצורך הזה.
לי אומר כי הרקע האקדמי שלו - תואר ראשון במדעי המחשב מאוניברסיטת פרינסטון, תואר שני במתמטיקה וסטטיסטיקה מאוניברסיטת קיימברידג' ודוקטורט במתמטיקה שימושית מפרינסטון - הובילו אותו לתחום של מדע הנתונים. לאחר הלימודים עבד בוול סטריט כאנליסט כמותי (Quant) בחברות כמו ג'יי פי מורגן, D. E. Shaw ובלומברג. "זה תפקיד שדומה למדען נתונים, אבל זה היה עוד לפני שקראו לו ככה. הכלים הטכנולוגיים לא היו טובים כמו היום, אז לעשות את אותו הניתוח היה יקר יותר ודרש כישורים טובים יותר. לכן המקום היחיד בו היה רווחי לעשות את זה היה מסחר בשוק ההון".
לאחר מכן הפך לי למדען הנתונים הראשון בקרן הון הסיכון אנדרסן הורוביץ, משם עבר לאחת מחברות הפורטפוליו של הקרן, Foursquare - אפליקציית המלצות על מקומות קרובים לסביבתו של המשתמש. את ה-Data Incubator הקים ב-2014 מתוך רצון לסייע לאקדמאים שרוצים להיכנס לעבוד בתעשייה, וגם למנהלים שמעסיקים עובדים.
"אנחנו מסוגלים לאסוף היום כמויות גדולות של נתונים כי יש לנו סמארטפונים, לפטופים, מכשירים לבישים, וכולם מעבירים עדכונים בזמן אמת לענן. כך שאנחנו חיים בעולם מאוד מדוד, ועם כל המידע הזה מגיעים אתגרי מחשוב עצומים. מדען נתונים חייב ללמוד טכניקות כדי לעבוד עם ג'יגה-בייטים, אם לא טרה-בייטים ופטה-בייטים של מידע", אומר לי. "יש גם הרבה ערך בכמות המידע הזו כי עם יותר מידע אפשר לאמן מודלים טובים בהרבה".
לי מדגיש מספר אתגרים נוספים איתן צריכות להתמודד חברות שמשלבות מדע נתונים בארגון: "חברות שמתחילות את המסע הזה חייבות לעבור מספר עקומות של בגרות. עקומה אנליטית, שהיא היכולת לקחת הרבה מידע ולהסיק ממנו מסקנות; תפעולית - היכולת לקחת את כל מה שנלמד מהניתוח וליישם אותו בעולם האמיתי; וארגונית - להביא את הארגון כולו למצב בו הוא יכול לאמץ את השינויים שנגזרים מהמידע".
לדברי לי, למרות הקשיים של חברות מסורתיות להיכנס לתחום, חשוב שאלו יאמצו את מדע הנתונים והבינה המלאכותית משתי סיבות - הראשונה היא דרישה צרכנית: "צרכנים מצפים היום מכל חברה לחוויה צרכנית שתהיה פשוטה כמו לקנות מהאפסטור של אפל או לשלוח מייל בג'ימייל, וכן למענה דיגיטלי מיידי ואינטיליגנטי. זה כופה על חברות שימוש ביותר כלי אנליטיקה, מדע נתונים ובינה מלאכותית", אומר לי.
הסיבה השנייה היא הדינמיקה התחרותית. "אפשר לקחת כדוגמה את מנועי ההמלצות. צרכנים דורשים הרבה תכנים אבל לא תמיד יודעים מה הם רוצים, ולכן צריך לעזור להם למצוא תוכן. אחת הסיבות שאפשרה לנטפליקס להיות טובה יותר מספקי וידיאו אחרים היא שיש להם את המידע שמאפשר להם לעשות את זה".
מנהל לא יכול שלא להבין בתחום
על מנת להכשיר מדעני נתונים ולהתמודד עם המחסור באנשי מקצוע בתחום, לי מתאר שני מסלולים בדאטה אינקובטור - הראשון, תוכנית ה-Fellowship, שאורכת שמונה שבועות אינטנסיביים ומיועדת לבעלי דוקטורט או לפחות תואר שני. "הרעיון הוא לקחת אנשים מאוד מבריקים שיכולים ללמוד את החומר מהר, ולסייע לשילובם בתעשייה, ובכך להרחיב את היצע המומחים", אומר לי. לאחר ההכשרה, הדאטה אינקובטור פועל גם לשילוב הבוגרים בחברות שמשלמות עבור הגיוס, וכך מתאפשר לארגון להציע את ההכשרה בחינם. התוכנית פועלת בארבעה מיקומים בארה"ב ובכל רבעון מגישים מועמדות כ-3,000 איש, מהם רק 2% מתקבלים.
מה הרקע האקדמי של מדעני הנתונים בישראל
לדברי לי, הסטודנטים בתוכנית יכולים להגיע מדיסציפלינות מגוונות, ואפילו ממדעי החברה. "כשאנשים חושבים על מדען נתונים, הפרופיל הטיפוסי יהיה מישהו עם רקע בפיזיקה, מתמטיקה, אולי מדעי המחשב. אבל מה שמצאנו באמצעות תהליך המיון הקפדני שלנו, זה שגם אנשים עם רקע בכלכלה, כימיה, או מדעי המוח, למשל, יכולים להיות לפעמים מאוד טובים כמדעני נתונים. בכל שלב בתהליך המיון אנחנו בוחנים כישורים וטכניקות אחרים - קידוד ותוכנה, מתמטיקה וסטטיסטיקה ואפילו יכולת הצגת מצגות. אנחנו מחפשים אנשים עם שילוב הכישורים העוצמתי הזה, שדרוש כדי להפוך למדעני נתונים". לפי נתוני חברת אתוסיה מלפני כשנה, 75% ממדעני הנתונים בישראל למדו הנדסת מכונה, הנדסת חשמל, הנדסה, תעשייה וניהול, מערכות מידע ומדעים מדויקים.
מסלול לימודים נוסף שהדאטה אינקובטור מציע נוגע להכשרת עובדים קיימים בתאגידים. "עבדנו עם עשרות חברות פורצ'ן 500, וכן עם ממשלת ארה"ב, צבא ארה"ב וממשלת בריטניה, ועזרנו להם להכשיר צוותי עובדים קיימים. התאמת והגדרת תוכנית הלימודים נעשית עם החברות בהתאם לרמה הנוכחית של העובדים בתחום, והרמה אליה הם רוצים להגיע. קורס נוסף שהתחלנו להציע לאחרונה נוגע לצד העסקי של מדע הנתונים. הקורס אורך יומיים ומיועד עבור מנהלים שלא מגיעים מהתחום הטכני אבל צריכים להבין מה זה מדע נתונים, איך זה משפיע על העסק שלהם, איך לעבוד באופן אפקטיבי עם מדעני נתונים, וכן את נושא הפרטיות וההשלכות החוקיות של שימוש בנתונים ועוד. לפי מחקר של מקינזי יש מחסור של 190-140 אלף מדעני נתונים באופן גלובלי, אבל גם של פי עשרה יותר מנהלים ממוקדי נתונים".
לי הגיע לישראל כדי להציע הכשרה דומה לארגונים בארץ בשיתוף פעולה עם רשות החדשנות, במסגרת תוכנית חדשה שהרשות משיקה בשם "הסדנה לאיגוד לימודי טכנולוגיה מתקדמת". התוכנית החדשה תציע הכשרות לעובדים בתחומי הייטק שונים, כאשר המיקוד הראשוני הוא תחום מדע הנתונים והבינה המלאכותית. נעמי קריגר-כרמי, ראש הזירה החברתית-ציבורית ברשות החדשנות, מסבירה כי "כל חברת הייטק ישראלית צריכה עכשיו מדען נתונים, ואי אפשר פשוט לשבת ולחכות שהם יגיעו עם תארי דוקטור מהאקדמיה. חשוב לנו להגדיל את העוגה כי היום החברות גונבות את אותם אנשים אחת מהשנייה.
"לכן אנחנו מתעניינים במודלים כמו ההכשרה שמייקל מציע, שיכולים לקחת אנשים מרקעים שונים ולעזור להם בזמן קצר יחסית. התוכנית החדשה מאפשרת לקבוצה של חמש חברות הייטק ומעלה להתקבץ יחד ולהציע תוכנית הכשרה לעובדים שלהן, והן יכולות להשתמש בארגון חיצוני, כמו הדאטה אינקובטור, שיציע את ההכשרה הזו". חברות יכולות להגיש לרשות החדשנות הצעות להכשרות עד ה-9 בפברואר, והרשות תעזור לממן עד שני שלישים מהעלות ההכשרה. "נצליח להגדיל את העוגה כשנתחיל לחשוב איך חברות יכולות לשתף פעולה במקום להתחרות", אומרת קריגר-כרמי.
קריגר-כרמי התייחסה גם לסוגיה הניהולית, ולצורך בהכשרה של מנהלים שאינם מהתחום הטכני: "זה כמו שאי אפשר לדמיין מנכ"ל שלא מבין בתחום הפיננסים. הוא לא יכול להגיד - יש לי סמנכ"ל כספים שמתעסק בזה ואני לא עוסק בחלק הזה של העסק. אנחנו מבינים שדאטה יהיה דומה לכך בדרכים רבות. אי אפשר יהיה לא להבין בתחום".
צריך לדעת גם לספר סיפור
לי מדגיש כי התוכנית של הדאטה אינקובטור שונה מתוכניות אקדמיות בכך ש"אנחנו הרבה יותר מחוברים לתעשייה בהשוואה לאקדמיה. לכן אנחנו מצליחים להישאר מעודכנים במגמות הכי חדשניות. בעוד ששיעור באקדמיה יהיה מאוד תיאורטי, המטרה שלנו היא להפוך את המשתתפים בתוכנית לפרודוקטיביים מהר ככל האפשר. עבור מעסיקים החלק התיאורטי פחות משמעותי, אך מי שמנהל את האקדמיה זה פרופסורים. הם מקבלים קידום בהתבסס על מחקרים שעשו, והמחקר נוגע בעיקר למה שמעניין באופן תיאורטי, בניגוד לפתרונות שפשוט גורמים לדברים להיעשות ועוזרים לחברה לעשות כסף".
כחלק מההתמקדות בצד הפרקטי של מדע נתונים, חלק מתוכנית הלימודים נוגעת לכישורי תקשורת. "אני חושב שאחד הדברים הכי חשובים במדע נתונים זו היכולת לשכנע את המנהל לפעול באופן מסוים בעקבות התובנות שהוצאת מניתוח שעשית, ובשביל זה צריך לדעת לפשט את הדברים ולספר סיפור", אומר לי.
מה אתה חושב על כלים וקורסים שמאפשרים לאנשים ללמוד את התחום באופן עצמאי?
"הרבה אנשים שמגיעים לתוכניות שלנו בילו זמן בקורסים אונליין, ולדעתי זה מקום נהדר להתחיל ממנו. מהניסיון שלנו, רוב האנשים צריכים שיחזיקו להם קצת את היד, כי בלמידת מכונה ובינה מלאכותית אפשר להיתקע במקומות בהם למישהו עם ניסיון ברור למה נתקעת. מדריך יכול לעזור לך לצאת מהתקיעות ולחסוך ימים ושבועות בתהליך הלמידה. בעיקר בצד הארגוני בו זמן שווה כסף, מאוד חשוב לארגונים שהעובדים שלהם ילמדו את החומר מהר ככל האפשר".
אתה חושב שהחינוך צריך להשתנות בהתאם לטכנולוגיות החדשות גם לפני האקדמיה?
"אנחנו צריכים לשנות את הפרדיגמה החינוכית של חינוך בחטיבה ובתיכון כך שיהיה פחות ממוקד בחשבון דיפרנציאלי ואינטגרלי (חדו"א), וממוקד יותר באלגברה ליניארית ותכנות. המיקוד בחדו"א נובע ממורשת של המלחמה הקרה, כשהדבר הכי חשוב לעשות היה לבנות עוד טילים גרעיניים. כמובן שזה כבר לא דבר מאוד חשוב, יש לנו את כל הטילים הגרעיניים שאי פעם נצטרך, ומה שאנחנו באמת צריכים לעשות זה לחקור תחומים כמו ביומכניקה, ביולוגיה, בינה מלאכותית. אלה התעשיות החדשות של העתיד, וזה אומר שאנחנו צריכים לשנות את הדגש שלנו במתמטיקה".
לתשומת לבכם: מערכת גלובס חותרת לשיח מגוון, ענייני ומכבד בהתאם ל
קוד האתי
המופיע
בדו"ח האמון
לפיו אנו פועלים. ביטויי אלימות, גזענות, הסתה או כל שיח בלתי הולם אחר מסוננים בצורה
אוטומטית ולא יפורסמו באתר.