המדריך המעודכן למהפכה הטכנולוגית הגדולה

כולם אומרים עכשיו שהם מפתחים בינה מלאכותית, עפים על למידת מכונה ואוכלים רשתות נוירונים לארוחת בוקר ■ זאת בדיוק ההזדמנות לקחת צעד אחורה, להבין מה המושגים האלה באמת אומרים ולשאול מתי הם באמת מבטאים חדשנות - ומתי משתמשים בהם רק כדי למשוך תשומת-לב

בינה מלאכותית / צילום: שאטרסטוק
בינה מלאכותית / צילום: שאטרסטוק

קשה להתבלט כיום בעולם הסמארטפונים, שהפכו עם השנים דומים זה לזה. אולי זו הסיבה שבשבוע שעבר, כשהיצרנית אסוס השיקה בתערוכת הענק MWC בברצלונה מכשיר חדש בסדרת זנפון, היא ניסתה לגייס לטובתה את הבינה המלאכותית. לא את הטכנולוגיה, את הבאזז סביבה.

מסך המכשיר החדש כולל תכונה נחמדה: הוא מתאים את צבעי התצוגה למקום שבו נמצא המשתמש, ושומר על המסך דולק כל עוד מסתכלים עליו. אלה תכונות שנשענות על חיישנים המזהים את הסביבה, אך אסוס קראה לה "תצוגת AI". כשכתב The Verge ולאד סאבוב שאל את החברה איך בינה מלאכותית באה לידי ביטוי בפיצ'רים האלה - הוא נענה כי אסוס "מאמצת הגדרה רחבה למושג בינה מלאכותית". היא, כמובן, לא היחידה שעושה זאת.

המצב דומה גם כשבוחנים את השימוש במונח "למידת מכונה". פעם, לא כל כך מזמן, הוא היה שמור ליודעי דבר בלבד. כיום, אם מחפשים "Machine Learning" בגוגל, מקבלים קרוב ל-3 מיליון תוצאות, ועוד 320 אלף בגוגל ניוז. לפי גוגל טרנדס אנחנו נמצאים בתקופה שבה העניין סביב המושג הזה בשיאו, עם עלייה הדרגתית בחיפושים מאז 2014. שוב ושוב אנחנו נתקלים בפרסומים של אפליקציות, מוצרים וכלים חדשים שנשענים על "למידת מכונה". לעתים קרובות לא נלווה לכך הסבר מעמיק, מעבר לשימוש במילות הבאזז.

אין חולק על כך שההתפתחויות בתחום הבינה המלאכותית עומדות במרכז כמה מהמהפכות הטכנולוגיות המסקרנות ביותר כיום: הרכב האוטונומי, הערים החכמות, האלגוריתמים שמבינים שפה, היכולת של מערכות ממוחשבות להחליף בעלי מקצוע, והרשימה עוד אינסופית. ובכל זאת, איך אפשר להבחין בין מי שעושה משהו חדשני באמת לבין מי שרוכב על הטרנד וההייפ?

כעיתונאים, אנחנו מנסים לעשות זאת תמיד, כל מקרה לגופו. אלא שנראה כי אינפלציית השימוש במונחים הקשורים לבינה מלאכותית מחייבת לפחות להבין את המושגים האלה, ולהגדיר כללי אצבע שיאפשרו לבחון מתי יש הצדקה לשימוש בהם - ומתי מדובר בתרגיל ביחסי ציבור. כפי שהמומחים שהתראיינו לכתבה זו הדגישו, בינה מלאכותית ולמידת מכונה הן נושאים סבוכים ביותר, ונדרשים שנים של לימודים אקדמיים כדי להתמצא בהם. ובכל זאת, ננסה לספק את הבסיס.

כך למידת המכונה עלתה לגדולה

מטרתה של הבינה המלאכותית היא לגרום למכונות להתנהג בצורה שאנו, בני האדם, תופסים כאינטליגנטית. ההגדרה המדויקת של המונח אינה חד-משמעית, אך בהכללה אפשר לומר שבמקום שהתוכנה תעשה את אותו הדבר בכל פעם, היא תתאים את עצמה למה שמתרחש בכל זמן נתון, כאילו הייתה אדם המסתגל לסביבתו. אפשר להשיג את התוצאה הזאת באמצעות תכנות מראש של חוקים, שיסבירו לאלגוריתם איך לפעול במצבים שונים. ואולם, בשנים האחרונות עולה קרנה של שיטה אחרת.

פרופ' מקס וולינג הוא מומחה ללמידת מכונה מאוניברסיטת אמסטרדם, וסמנכ"ל פיתוח בענקית השבבים קוואלקום. למידת מכונה, הוא מסביר, היא הרעיון שבמקום ללמד את המחשב דבר מה דרך סט חוקים מדוקדק, נותנים לו ללמוד אותו בעצמו, באמצעות דוגמאות. כמו שאנשים בדרך כלל לומדים. "גילינו שזה יעיל יותר" אומר וולינג.

לדברי וולינג, ישנם שלושה סוגים עיקריים של אלגוריתמי למידת מכונה: למידה מפוקחת, למידה לא מפוקחת, ולמידת חיזוק. במודל מפוקח, תהליך הלמידה כולל אספקת נתונים רבים לאלגוריתם, יחד עם הסבר נלווה: לדוגמה, תמונה של חתול תלווה בתווית "חתול". המטרה היא שבשלב מסוים, כאשר האלגוריתם ייתקל בתמונה של חתול, הוא יבין לבד וללא הסבר במה מדובר. "אפשר לחשוב על מודל כזה כמו על ילד שהורה מצביע עבורו על חיות, ומסביר: 'זה אריה וזו ג'ירפה'", אומר וולינג.

המודל הלא מפוקח מורכב בהרבה ליישום, ובמשך שנים נחשב ל"גביע הקדוש" של הבינה המלאכותית. במודל כזה האלגוריתם מנסה למצוא בעצמו מבנים או דברים שיש להם את אותה פונקציה, מבלי שהוא מקבל הסבר בשום שלב - אלא על בסיס הצלבת נתונים בלבד. וולינג: "זה כמו ילד שמסתובב לבד, ומגלה שיש חיות ירוקות עם שיניים מחודדות. הוא שם אותן באותה קבוצה, ואם בשלב מסוים הוא שומע מישהו אומר 'זה קרוקודיל', הוא יבין שכולן קרוקודילים".

לבסוף, בלמידת חיזוק האלגוריתם נמצא באינטראקציה עם המשתמש: הוא מקבל דוגמאות ומבקש תוויות עבורן. "במקרה הזה הילד שואל את ההורה 'מהי החיה הזו?'", אומר וולינג. האלגוריתם של נטפליקס, למשל, הוא כזה: ראשית הוא שואל את המשתמש אילו תכנים הוא אוהב, ואז מבסס עליהם המלצות נוספות. בהמשך הוא מפתח את מנגנון ההמלצות בהתאם לתכנים שבהם צפה המשתמש ובהתאם למשוב ממנו: המלצה או דיס-המלצה.

יותר דאטה מספקת יותר תובנות

אורנה ברגמן היא חוקרת אלגוריתמים ומנהלת צוות בסטארט-אפ הישראלי זברה מדיקל ויז'ן, שמשתמש בלמידת מכונה כדי לאבחן מצבים רפואיים דרך סריקות של מכשירי הדמיה. מטרתו היא לסייע בהתמודדות עם המחסור ברדיולוגים, ובעתיד אף לעשות עבודה טובה יותר מרדיולוגים אנושיים. "היום רדיולוג מסתכל על מחקרים שנעשו, שלרוב ברפואה הן על קבוצות קטנות. אנחנו מאמינים שנוכל למצוא יותר סימנים מקדימים, קורלציה בין מחלות ועוד אינדיקציות, ולהגדיל את דיוק האבחון", היא אומרת.

כשברגמן מדברת על למידת מכונה, היא שמה דגש על ביג דאטה - היכולת של האלגוריתם להסיק מסקנה מתוך ערימת נתונים ענקית, שלבני אדם אין סיכוי להתמודד מולה. "האלגוריתמים רואים הרבה דוגמאות ועושים הכללה. אנחנו מביאים לאלגוריתם אלפי דוגמאות קליניות של תופעות, וגם דוגמאות שליליות (כלומר, תצלומים של אנשים המציגים ממצאים שדומים למחלה אך אינם סובלים ממנה). אז אנחנו מלמדים את המערכת, באמצעות מודל מפוקח, לזהות ממצאים ספציפיים ולדעת מה מצבו של החולה. הרעיון בלמידת מכונה הוא לא להגיד לאלגוריתם 'תסתכל על הגודל' או 'תסתכל על הצבע', אלא שהוא יסיק לבד את ההבדלים דרך תהליכים מתמטיים וסטטיסטיים".

ברגמן מחלקת גם היא את למידת המכונה לשלוש קבוצות, אם כי שונות מאלה של וולינג. קבוצה אחת היא אלגוריתמים שמסוגלים לזהות אובייקט קיים: למשל מצלמה שמזהה פנים בתמונה, אך לא נדרשת לזהות מיהו האדם המופיע בה. הקבוצה השנייה היא אלגוריתמים שמפענחים את המידע שלפניהם ומחלקים אותו לקבוצות: הם מסוגלים להבין אם בתמונה נמצא אדם אחד או אחר, או תפוחים מול בננות. הסוג השלישי הוא אלגוריתמי חיזוי: הם לא רק מזהים ומפענחים, אלא גם מנבאים את הצעד הבא, למשל כשמחשב לומד לשחק משחק. "גם פייסבוק מנחש מה המשתמשים יעשו הלאה", אומרת ברגמן, "יכולה להיות תוכנה שמשתמשת בשלושת סוגי האלגוריתמים, ולעתים נעזרים באחד כדי לעשות את השני. אלה טכנולוגיות חופפות".

אחת החברות שמפתחות אלגוריתמי ניבוי היא לייבפרסון הישראלית. לדברי מנכ"ל החברה ערן ואנונו, בעזרת למידת מכונה החברה יכולה לעקוב אחר הלקוחות באתרים של חברות גדולות, ולהסיק מסקנות לגבי התנהגותם כדי להציע חוויה משופרת. "המידע הזה הוא מכרה זהב", אומר ואנונו. "הלמידה מתבססת על חוכמת ההמונים, והמכונה משביחה עם הזמן כמו יין. ככל שהיא מסתכלת על יותר דאטה, היא יכולה להפיק יותר תובנות ולפעול לאורן. אפשר להסתכל על הצעדים שאדם עשה באתר מסוים, או על המאפיינים וההיסטוריה הרפואית שלו למשל, כדי להסיק לגביו מסקנות מבעוד מועד".

שימוש נוסף שעושה לייבפרסון בלמידת מכונה הוא פיתוח בוטים שמציעים שירות לקוחות. "הלקוח מתקשר עם מכונה שיש לה ידע על ההיסטוריה שלו ועל משתמשים שדומים לו. היא יכולה להנגיש מידע מהאתר, לשאול שאלות בסיסיות או לתת מידע רלוונטי לפני המעבר לנציג אנושי. זה חוסך זמן, ומעניק חוויה דיגיטלית לעומת החוויה האנלוגית השבורה שאנו רגילים לה בשירות לקוחות. הבוט גם לומד אילו תשובות הובילו לשביעות רצון אצל הלקוח".

ומה זו למידה עמוקה, עוד אחד מהמושגים שנזרקים שוב ושוב בלי הסבר נוסף? מדובר בסוג של אלגוריתם למידת מכונה, ששואב השראה מהמוח האנושי. במוח שלנו יש יותר מ-80 מיליארד נוירונים (תאי עצב), שמרכיבים את מערכת העצבים. המידע עובר בהם דרך נקודות מפגש, הנקראות סינפסות. אלגוריתמי למידה עמוקה מנסים לחקות את המודל הזה: ליצור נוירונים וסינפסות מלאכותיים, שמטפלים בכמויות גדולות של מידע באמצעות כמה שכבות עיבוד.

וולינג אומר כי מודלי למידה עמוקה יהיו לרוב טובים בסיווג תמונות ודיבור: למשל, כשתוכנה מקבלת משפט שמישהי אמרה, ויודעת לפענח מתוכו את המילים שנאמרו. "בשנתיים-שלוש האחרונות למידה עמוקה נהייתה מאוד נפוצה, והנגישו את זה גם למתכנתים שזו לא ההתמחות שלהם. עשו זאת דרך כלים שהם אמנם ברמה מאוד בסיסית, אבל נותנים תוצאות טובות", אומרת ברגמן.

הקריטריונים: כמות, הבנה, מורכבות

אז איך אפשר להבין מי מנצל את ההייפ שנוצר סביב למידת מכונה, ומי עושה משהו חדשני ואפקטיבי? קודם כל צריך להבין מה למידת מכונה היא לא. "יש הרבה חברות שמייצרות מכונת מצבים", אומר ואנונו, "היא יכולה להסתכל על סיטואציה, ולהמליץ לפי תבנית שהחליטו מראש שהיא נכונה לחברה ולפיה תכנתו אותה. זאת לא למידת מכונה. זה לא אלגוריתם שחי ומגיב בזמן אמת לשינויים כשדאטה זורם במערכת כל הזמן. המכונה לא למדה משהו על סמך תצפיות וגם לא משביחה עם הזמן". וולינג מוסיף: "אני בטוח שיש חברות שמשתמשות בדאטה או בסטטיסטיקה פשוטה, וממתגות את זה כבינה מלאכותית או למידת מכונה".

הקריטריון הראשון שעולה ללמידת מכונה אמיתית הוא כמות הדאטה. ברגמן אומרת כי יש צורך בכמות גדולה ומגוונת של מידע, וולינג מוסיף כי על הדאטה להיות רלוונטית למה שרוצים להשיג, ואילו ואנונו מסכם: "זו האפקטיביות האמיתית של מאשין לרנינג".

הקריטריון השני הוא הבנת סוג האלגוריתם שבו משתמשים. "כך ניתן לדעת מה אפשרי בעזרתו וכמה הוא אפקטיבי ליישום שרוצים להשיג", אומר וולינג, "אלגוריתם שצריך להבין איזה סרטים המשתמש אוהב, צריך להיבנות על משוב ממנו - זה אלגוריתם למידת חיזוק".

לעומת זאת, אם אני רוצה לחזות אם מישהו מפתח אלצהיימר בהתבסס על סריקת MRI, הדרך הטובה לעשות את זה היא לאסוף הרבה סריקות עם הדיאגנוזה, ואז מאמנים אלגוריתם למידה מפוקחת".

הקריטריון השלישי הוא מורכבות המקרים. ברגמן אומרת כי "בדרך כלל צריך למידת מכונה כדי לפתור בעיה שמצריכה הבנה עמוקה, לא משהו מיידי. כשהחוקים הרלוונטיים הם מתמטיים לא צריך למידת מכונה, אבל כשהחוקים יותר מעורפלים ואי אפשר לתת נוסחה שתמיד מצליחה - צריך. כדי להבדיל בין כלנית לרקפת, מספיק לתת קריטריון של צבע. כדי להבדיל בין כלנית לפרג, הקריטריונים יותר מסובכים. ואז לומדים לאט לאט להבדיל דרך הדוגמאות". ואנונו מוסיף לכך את יכולתה של המערכת לתפקד באי-ודאות: "כשאומרים שסביר שמשתמש יעשה משהו על סמך דאטה, מה הסבירות? מה הסיכון-סיכוי שהמערכת לוקחת כשהיא מציעה משהו?".

למידת מכונה רלוונטית במיוחד גם במקרים שבהם זמן החישוב באלגוריתם רגיל יהיה גבוה מדי מבחינה עסקית, או בלתי סביר מתמטית. "אם בשבריר שנייה יש מיליון וחצי איש באתר, ואני צריך לקבל עבורם החלטות בסיטואציה שכל הזמן משתנה, האלגוריתמיקה צריכה לזוז בקצבים מהירים ולקבל החלטות כל הזמן", אומר ואנונו.

ברגמן מוסיפה: "אצלנו אם ייקח לאלגוריתם יומיים זה לא יהיה רלוונטי, כי הרדיולוג כבר יסיים לפענח. זה תלוי מוצר".

בעתיד כולנו נוכל לאמן מכונות

האם יש תחומים שבהם למידת מכונה אינה רלוונטית? "יש הרבה תחומים שאין בהם דיגיטציה ושם קשה לייצר זרם של דאטה ולעבוד עליו", אומר ואנונו, "בעולם הרפואי במשך שנים עשו דיאגנוסטיקה, אבל חכמת ההמונים לא באה לידי ביטוי כי לא היה מחשוב".

וולינג מסייג באומרו כי "לרוב למידת מכונה יעילה בתחומים שבהם אוספים הרבה מידע, אבל כמעט כל תחום מושפע מזה. זה נמצא בערים חכמות, סופרמרקטים, משרדי עורכי דין. אולי זה פחות רלוונטי עבור עבודות אמנותיות, אבל זה משפיע גם שם: בעיקר אדריכלים בוחנים עכשיו שימוש בבינה מלאכותית. זה משהו שמזריקים לכלכלה והכל נע מהר וחלק יותר. כמו שכמעט כולם משתמשים היום במחשבים, זו הרמה הבאה. זו אבולוציה טבעית: דברים הפכו חכמים יותר ביולוגית ועכשיו אנחנו מפתחים דברים מלאכותיים שהופכים לחכמים, אולי אפילו חכמים מאיתנו".

לפי התחזית של וולינג, בעתיד יישומי למידת מכונה יהיו נפוצים ונגישים בהרבה מהיום: לא רק השימוש בהם - אלא אפילו התכנות שלהם. לדבריו גם קוואלקום, שבה הוא עובד, מעוניינת לפתח אפליקציות שיהיה ניתן לאמן בהתאם לצרכי המשתמש, למשל כדי לסווג תמונות שונות בטלפון שלו. "היום פיתוח אלגוריתם למידת מכונה מצריך אנשים שיש להם דוקטורט במדעי המחשב, אבל אני מדמיין עתיד שבו כולם יוכלו לאמן אותם בקלות", הוא אומר.

מה הם יעשו?

"יהיה אפשר למשל להגדיר יישום שישלח הודעה כשהחלב בבית נגמר. בתהליך האימון, האלגוריתם יהיה באינטראקציה עם המשתמש ויבקש לקבל דוגמאות שבהן יש מקרר עם קרטון מלא ועם קרטון ריק. זו רק דוגמה אחת, זה פותח המון אפשרויות".

Machine learning
 Machine learning

לומדים את למידת המכונה
 לומדים את למידת המכונה

מילון מונחים בסיסי לתחום הכי חם

בינה מלאכותית (AI). ענף במדעי המחשב. יצירת מכונות המחקות את האינטליגנציה האנושית ויכולות לבצע משימות שנחשבו לכאלה שנדרש היגיון אנושי עבורן. למשל: לקרוא, להבחין באובייקטים בתמונה, להבחין באיומים בכביש ועוד.

למידת מכונה (ML). תת-תחום של בינה מלאכותית. אימון אלגוריתם באמצעות דוגמאות רבות ולא באמצעות תכנות חוקים מראש. כך למשל, האלגוריתם יידע להבחין בין שני סוגי פרחים אחרי שקיבל תמונות רבות של שני הסוגים, ולא על סמך קריטריונים כמו צבע או גודל שתוכנתו אליו.

למידה עמוקה (Deep Learning). שם כולל לאלגוריתמי למידת מכונה השואבים השראה מהמוח האנושי. הוא מדמה את רשתות תאי העצב (הנוירונים) והסינפסות (נקודות המפגש בין התאים), ומטפל בכמויות גדולות של מידע באמצעות מעבר דרך כמה שכבות עיבוד. בשנים האחרונות למידה עמוקה הפכה נפוצה יותר.

מודל מפוקח/לא מפוקח (Supervised/Unsupervised) - סוגים שונים של אלגוריתמים ללמידת מכונה. במודל מפוקח האימון כולל הסברים: המפתח או המשתמש יציג לאלגוריתם תמונות של חתולים, למשל, מלווים בתבנית "חתול" - עד שהאלגוריתם יידע לזהות תמונות של חתולים בעצמו. במודל לא מפוקח הלמידה של האלגוריתם היא עצמאית: אם הוא ייחשף לתמונות רבות של חתולים וכלבים, המטרה היא שיידע למיין אותן לבד לשתי קטגוריות נפרדות.

שימושים

למידת מכונה משפיעה כמעט על כל תחום הדורש שימוש באינפורמציה רבה: מפרויקטי ענק כמו ערים חכמות, מפעלים יעילים יותר, מחסנים אוטומטיים ונהיגה אוטונומית; דרך ענפים כמו קמעונאות, תמחור שירותים, תרגום ואפילו אדריכלות ועריכת דין; עבור באפליקציות ועוזרים חכמים כמו סירי ואלקסה; ועד משחקים ועבודות אמנותיות.