עתיד הבינה המלאכותית (AI) אינו במודלי שפה גדולים, כמו זה שמאחורי צ'אט GPT - אלא במודלים שיודעים "להבין" איך העולם עובד ולתכנן את הביצוע של משימות מורכבות. זו הבשורה של ענקית הטכנולוגיה מטא (פייסבוק לשעבר), שחשפה מודל פורץ דרך של בינה מלאכותית שתפעל בצורה אנושית יותר.
החברה היא שחקנית חזקה במחקר בינה מלאכותית ברחבי העולם, ולפני שמונה שנים הקימה את FAIR - מרכז מחקר לבינה מלאכותית בפריז. במסיבת עיתונאים שנערכה שם השבוע, הציג יאן לקון, סגן נשיא ומדען הבינה המלאכותית הראשי של מטא, את החזון שלו לאחד המודלים הללו, בשם I-JEPA (ראשי תיבות של Image Joint Embedding Predictive Architecture). לדברי החברה, מדובר במודל שמאומן באמצעות יצירת מודל פנימי של עולם החיצון, ומשווה ייצוגים מופשטים של התמונות. זה כחלק משיטה בשם Objective Driven AI, מודלים חכמים יותר - במקום קופסה שחורה שיכולה להעריך או לחזות את המילה הבאה במחרוזת של טקסט, מדובר בשיטה שתנסה להסיק מה הכוונה בתשובה המבוקשת ולתכנן אותה בהתאם.
אינטליגנציה אנושית?
המודלים שקיימים כיום, הסביר לקון, עושים טעויות רבות ובהן שגיאות עובדתיות, חוסר במידע עדכני והיעדר של תכנון לתשובות ושימוש בכלים חיצוניים כמו מחשבון או מנועי חיפוש. "הן משטות בנו בקלות בגלל הרהיטות של המערכת", אמר, "אבל המערכת לא באמת מבינה את העולם".
יאן לקון, מדען הבינה המלאכותית הראשי של מטא / צילום: מטא
המטרה היא לפתח ארכיטקטורה חדשה, כזו שתתגבר על המגבלות של המערכות הקיימות, ותצליח ליצור מודלים שיוכלו ללמוד איך העולם עובד. הדרך שלקון מסביר זאת היא באמצעות למידה של תינוק - העובדה שבני אדם לומדים על העולם רק בעזרת התבוננות, היגיון והשכל הישר. מטא תנסה לפתח התנהגות ופעילות הדומה לאינטליגנציה אנושית.
לקון אמר לנו כי למודל החדש יש ביצועים חזקים במשימות שונות, והוא יעיל בהרבה בהשוואה למודלים אחרים של ראייה ממוחשבת שנמצאים בשימוש בתעשייה. לדבריו, מודל I-JEPA החדש שלהם, כמו גם מודלים אחרים, הוא חלק מניסיון לפתח ארכיטקטורה חדשה שתצליח להבין הקשר ושכל ישר, כדי לספק תשובות עליהן חשבו לפני, ולא רק ניחשו מה הפלט הסטטיסטי האפשרי הבא (שיכול להיות שגוי או לא שלם).
לדברי לקון, "מודל הבסיס יהיה בקוד פתוח. בגלל הפוטנציאל להשפעה על בני אדם ומידע שיש בכלל הציבור, זה חייב להיות שקוף". מתי זה יקרה? "זה לא יקרה ביום אחד" הוא אומר, "זה יהיה תהליך. אין לי מושג מתי זה יקרה".
במהלך שולחן עגול עם עיתונאים מרחבי העולם, לקון השיב לשאלת גלובס מה תהיה ה"קילר־אפ" (האפליקציה הטובה ביותר) של החברה. הוא ענה בפשטות: עוזר בינה מלאכותית עם יכולות ואינטליגנציה אנושיות. "העוזר הזה יהיה החבר הכי טוב שלך, אפשר לשאול אותו כל דבר והוא יעשה כל דבר שצריך. הוא ילמד נקודתית את המשתמש באופן פרטני, ואף אחד אחר לא יהיה חשוף למידע הזה או לגרסה האישית הזו. המודל הזה ישתמש בכל המקורות שזמינים באינטרנט. הוא יעשה הכל בשבילך".
לדבריו, "מודל הבסיס יהיה בקוד פתוח. משום שיש פוטנציאל השפעה אדיר על בני אדם והמידע הקיים בקרב כלל הציבור, זה חייב להיות שקוף". מתי זה יקרה? "זה לא יקרה ביום אחד, זה יהיה תהליך. אין לי מושג מתי זה יקרה".
לצד זאת יש יישומים בטווח הקצר שהחברה מדברת עליהם. לדוגמה - זיהוי תמונות באינסטגרם. אחת המורכבויות הגדולות של החברה היא זיהוי תמונות שעוברות על תנאי השימוש. מודל שיצליח לזהות בצורה יעילה אובייקטים בתמונה, יכול להזהיר למשל מפני עירום.
מטא מהמובילות במחקר
זה מצטרף לפיתוחים אחרים שהחברה הכריזה עליהם בחודשים האחרונים: בחודש אפריל האחרון, החברה הציגה את DINOv2 - שיטה חדשה לאימון מודלים של ראייה ממוחשבת. השיטה משתמשת בלמידה בפיקוח עצמי, כדי להגיע לתוצאות טובות יותר. המערכת יודעת לפלח אובייקטים בתמונה ללא ציון מטרה מוקדמת - כמו זיהוי כיור בתמונה של מטבח.
מה שמתחבר לשירותים צרכניים שהחברה השיקה כמו Make-A-Video (טכנולוגיה שפותחה בישראל שהופכת טקסט קצר לווידאו), כלי בינה מלאכותית שמנפיש ציורי ילדים או מודל שפה שיהפוך דיבור לכיתוב במעל לאלף שפות. החברה אף חשפה בימים האחרונים כלי מוזיקה בבינה מלאכותית, שאפשר לכתוב טקסט קצר או לתת דגימה סאונד מסוימת, ולקבל מוצר סאונד רחב לפי הבקשה. זאת לצד כלים לאפליקציות של החברה, כמו מחולל סטיקרים למסנג'ר.
רבים משווים בין מיקרוסופט וגוגל במרוץ על בינה מלאכותית, אך לא מתייחסים כל כך למטא. אורי אליאבייב, יועץ בתחום הבינה המלאכותית ומנהל קהילת Machine and Deep Learning Israel, קהילת הבינה המלאכותית הגדולה בישראל, מסביר כי " מטא היא לחלוטין חלק ממרוץ ה-AI והחודשים האחרונים הראו עד כמה היא חלק מהמשחק. בהיבט המחקרי והאקדמי היא ניצבת בשורה אחת עם שאר ענקיות הטכנולוגיה בתחום". לדבריו, "ההבדל העיקרי הוא שגוגל ומיקרוסופט שמות הרבה דגש על הבאה של היכולות האלה למוצרים הצרכניים שלהם, בעוד שמטא משתמשת לא מעט ביכולות שלה מאוחרי הקלעים. נראה שעכשיו יש מומנטום חדש שבו הם עתידים להכניס עוד ועוד שימושי AI במוצרים שלהם שמוכרים לקהל הרחב".
ובכל זאת, סרגיי וסצ'ונוק, אנליסט בכיר בבית ההשקעות אופנהיימר מסביר כי גוגל ומיקרוסופט לא צריכות לדאוג כרגע מההכרזה של מטא. "נושא הצרכנות הוא הרבה יותר רגיש. החברות המצליחות בתחום הזה הן חברות אנטרפרייז. מטא היא חלשה יותר בהיבט הצרכני. התחרות שיש בין גוגל למיקרוסופט זו תחרות צרכנית ובהיבטי ענן".
הבינה המלאכותית טובה למניה
לדברי מטא, הפיתוחים הטכנולוגיים המשמעותיים האלו יכולים להוות תשתית משמעותית למטא-וורס, העולמות הווירטואליים שהחברה פועלת להרחיב ולחזק. בחברה אומרים כי בזכות ממשקים מבוססי בינה מלאכותית כך התחום יכול להשתנות בכל מה שקשור לצריכת העולמות הווירטואליים. לדוגמה, לבקש בעזרת הקול איזה חפץ מסוים במטא-וורס, ומערכת בינה מלאכותית גנרטיבית תוכל לייצר את המוצר בקלות.
עם זאת, צריך לומר, לקון מתייחס לנרטיבים "השקריים" לדבריו שפורסמו. "יש נרטיב שקרי שה-AI הוא העניין החדש של החברה, וזה מגיע על חשבון המטא-וורס. אני רוצה לומר, ההשקעה בבינה המלאכותית לא באה על חשבון המטא-וורס. אלו שני דברים שצריכים אחד את השני. בלי ה-AI אין מטא-וורס, וגם בצורה הפוכה, יש דברים שיהיה אפשר לעשות עם הבינה המלאכותית, רק אם זה מתבסס על המטא-וורס. צריך עולם וירטואלי לזה".
מטא כבר הצליחה לעורר סביבה השנה עניין רב בנושא הבינה המלאכותית. בפברואר החברה הכריזה על מודל השפה שלה, LlaMA - אך החליטה לא לפרסם אותו כקוד פתוח ואמרה כי תאפשר לחוקרים לבקש גישה. זאת הדרך שהחברה רצתה לעודד מחקר סביב הנושא - כך היא מרוויחה עוד זוגות עיניים שעוברות על המערכות ומספקים מענה לבאגים במערכת או בעיות כמו הטיה, מידע מוטעה ועוד.
עם זאת, שבוע לאחר מכן המודל הודלף לאינטרנט. אפשר לומר כי הדלפת המודל לרשת היה אחד הדברים שעוררו עניין רב במיוחד במטא, בטח בענייני הבינה המלאכותית. לדברי ז'ואל פינו, סמנכ"לית מחקר Meta AI, כל פרויקט שמתחיל במטא מתחיל במטרה להיות קוד פתוח, אך "זה לא אומר שאנחנו נעשה את זה כל הזמן, יש מצבים שאנחנו מסיימים פרויקט ואנחנו לא משתפים אותו כי הוא לא נכון או לא בשל, או אפילו מצב שהמידע לא מתאים לפרסום".
בהקשר של הדליפה, "אני לא שמחה שזה פורסם. עם זאת, הגרסה המודלפת הובילה לחדשנות גדולה יותר", אמרה. לשאלת גלובס פינו ענתה כי, "הספין החיובי הוא שזה הגביר את החדשנות אפילו יותר. נקודה נוספת היא שזה מראה את השימושים הטובים, יותר מאשר השימושים רעים. זה נותן לנו ביטחון שהטכנולוגיה נכונה לפרסום".
ד"ר טל מימרן, ראש התוכנית במכון תכלית למדיניות ישראלית ומנהל מחקר במרכז פדרמן לחקר הסייבר באוניברסיטה העברית מסביר כי "בימינו, תמיד חייבים להכיר באפשרות שדליפה של מידע היא צעד שיווקי או אסטרטגי מתוכנן. ברמה המהותית, נראה שישנן תגובות חיוביות למודל ובמובן רחב יותר - נוצרת התחושה שמרוץ החימוש של בינה מלאכותית רק מתגבר. כעת, השוק יצטרך להגיב ולהחליט איזה כלי הוא הנוח, המדויק, והמלהיב ביותר, ולפי התגובות הראשוניות נראה שמטא לגמרי בתוך התחרות".
וסצ'ונוק אומר כי הבינה המלאכותית אף הייתה מהגורמים שסייעו לתיקון במניה של מטא. "הסיבה המרכזית לתיקון במניה היא הורדת ההוצאות - ההתייעלות של החברה והפיטורים. מה שמעניין כאן זה שהבינה המלאכותית הייתה עוד כלי של אוטומציה, וזה עוזר לחסוך בכוח אדם. הבינה המלאכותית עושה שלושה דברים למעשה: משפר את יעילות העובדים, משפר את האלגוריתמים ונותן זרם הכנסות מדאטה ובינה מלאכותית". מניית פייסבוק עלתה מתחילת השנה 119%, ומחודש מרץ, סמוך להדלפת מודל ה־AI בכ־60%. באחרונה אף אנליסט האינטרנט של חברת אופנהיימר, ג'ייסון הלפסטיין, העלה את מחיר היעד של המניה באחרונה מ־285 דולר למניה ל־350 דולר.
"הרנסנס החדש"
בעוד שישנם מומחים בתחום הבינה המלאכותית שסבורים כי יש סכנה משמעותית בפיתוח חסר תקדים של טכנולוגיה שאינה מובנית במלואה, לקון אמר כי "הבינה המלאכותית היא הרנסנס החדש לבני אדם". הוא הוסיף כי "בגלל התקלות שיש במודלי שפה גדולים, אנשים חוששים ומריצים בראש את הסכנות שיכולות להיות בעתיד בגלל הבינה המלאכותית", הוא מדגים זאת בעזרת מטוס הסילון בתחילת דרכו ועד כמה אנשים חששו ממה שיכול להשתבש, ואיך היום זו טכנולוגיה נפוצה במיוחד. "הסיבה שאנשים חוששים זה כי הם לא יכולים לדמיין שהם מייצרים מערכת בטוחה".
עוד טוען לקון כי העתיד לא יהיה ב-LLM, משמע מודלי שפה גדולים, אלא במודל החדש שהיא הציגה. משום כך, החשש לא רלוונטי כי העתיד לא שם. לדבריו, העולם הולך יותר לכך שבינה מלאכותית תפעל בצורה אנושית יותר. "זה לא יקרה מחר, ייקח לזה שנים כי יש עוד הרבה דברים לפתור". לקון מרגיע ואומר כי רובוטים לא ישתלטו על העולם: "אינטליגנציה שכזו לא כוללת בתוכה חשק לשלוט. זו תוכנה על מחשב, אפשר ללחוץ על הכפתור והמערכת תעצור. זה שטות גמורה שפתאום זה ישתלט על העולם, זה לא עובד ככה". לדבריו - המודל החדש יהיה כפוף לבני אדם לגמרי
בניגוד לקולות שקראו לעצור את המחקר בשם הבטיחות, לקון אמר בתשובה לשאלת גלובס כי חובה להתקדם בפיתוח: "יש שחקנים רעים שיש להם כלים מפותחים, ולכן צריך גם שחקנים טובים עם כלים כאלו. השאלה שנשאל היא האם השחקנים הרעים יהיו עם כלים מפותחים יותר מאשר השחקנים הטובים. ברשתות החברתיות יש שחקנים רעים שרוצים להפיץ פרופגנדה. בינה מלאכותית זו הדרך שלנו להתמודד עם ספאם, שיח שנאה או רעילות. זו לא הבעיה, זה הפתרון".
האם צריך רגולציה?
ישנם גורמים שונים בתעשיית הבינה המלאכותית שמנסים לקדם רגולציה בנושא, מתוך החשש שהסכנות קרבות ובאות. יחד עם זאת, לקון מציג דעה אחרת ופתוחה יותר. "אני לא נגד רגולציה, אני חושב שרגולציה היא מהלך הגיוני למוצרים וכלים. אם לקוח מתנסה במוצר בינה מלאכותית, צריך שם רגולציה. עם זאת, אני לא חושב שצריך לעשות רגולציה על מחקר ופיתוח ולנעול את זה עם מפתח", בכך הוא עוקץ את המבקרים ואומר שברגע שנגיע לפיתוח של בינה מלאכותית מאוד מתקדמת שיכולה להשתלט על העולם, הם בוודאות יפעלו ויעשו זאת.
מה הלאה? לדברי נאילה מארי, ראש מרכז מחקר הבינה המלאכותית של מטא באירופה, המזרח התיכון ואפריקה המטרה היא להבין איך המכונות לומדות ובוחנות את העולם. אחד הנושאים הוא להבין איך המערכות מבינות הקשר וסיבתיות, איך הן לומדת להתנהג מבחינת ערכים ותרבות. יתרה מכך, "יש לחברה מחויבות לקוד פתוח. שיתפנו פעולה עם חוקרים חיצוניים, מפתחים ועוד. אנחנו מקבלים בקשות נוספות מהקהילה, ואנחנו פועלים בצורה מאוד פתוחה בנושא".
***גילוי מלא: הכתב היה אורח של מטא במשרדי החברה בפריז