"התנדבתי במשך שנים עם אנשים בעלי מוגבלויות וראיתי איך בעזרת טכנולוגיה ניתן לשנות את חייהם לטובה", סיפרה ספיר כדורי, מהנדסת תוכנה בגוגל ישראל, שמובילה את פיתוחו של פיצ'ר שיסייע לחירשים לתקשר באמצעות שיחות טלפון. הפיצ'ר, Live Relay, הוצג בשבוע שעבר בכנס המפתחים השנתי של גוגל, Google I/O, וכדורי אמרה את הדברים במסגרת מפגש עיתונאים שנערך היום (ד') במשרדי גוגל בו מהנדסים ישראלים הציגו את הפיתוחים שהובילו שנחשפו בכנס.
כאשר Live Relay מופעל, הוא הופך את קולו של האדם שהתקשר לטקסט, והמשתמש יכול להשיב בטקסט, שיפוענח ע"י המכשיר ויוקרא בקול לאדם שהתקשר. הפיצ'ר עדיין נמצא בשלבי פיתוח ואין פרטים מתי יושק. "רציתי לשלב בין התחביב שלי, להנגיש טכנולוגיה לאנשים בעלי מוגבלויות לעבודה שלי בגוגל", סיפרה כדורי. "שיחות טלפון הם דבר מאוד אישי ולכן כל פיענוח הדיבור והטקסט מתבצע על הטלפון ובשום שלב לא נשלח מידע לשרתים של גוגל" הוסיפה.
יוסי מטיאס, סגן נשיא גוגל ומנכ"ל מרכז המחקר והפיתוח בישראל הסביר כי גם המודל שמאפשר להשתמש בבינה מלאכותית על גבי המכשיר על מנת לפענח את הדיבור והטקסט פותח בישראל, ולדבריו מהווה פריצת דרך משמעותית. מטיאס הוסיף כי העיצוב עבור בעלי מוגבלויות מעניק בסופו של דבר יתרונות גם לקהל הרחב, "פיצ'ר כזה מאפשר לענות לשיחת טלפון גם בפגישה או בתנאי רעש", אמר.
מטיאס הסביר כי הפיצ'ר פותח על בסיס פיצ'ר נוסף שפותח בארץ והושק לפני מספר חודשים - Call Screen, שמאפשר למשתמשים להציג תמלול של האדם שמתקשר כשנכנסת שיחה לא מזוהה, כדי להבין מי עומד מהצד השני והאם לענות לשיחה. "מאז שקול סקרין הוכרז, הוא הפך לאחד הפיצ'רים הפופולריים במכשירי פיקסל", סיפר מטיאס.
פיצ'ר נוסף שפותח בישראל והוצג בכנס שמסייע לבעלי מוגבלויות ומשתמש ביכולת לפענח דיבור על המכשיר עצמו הוא Live Caption, שמאפשר לקבל כתוביות אוטומטיות לכל וידאו או אודיו בסמארטפון, כולל סרטונים שהמשתמש עצמו צילם, בדומה לאפשרות שקיימת היום ביוטיוב. מיכל רמנוביץ', מהנדסת תוכנה מהצוות שהוביל את לייב קפשן הסבירה שהפעלת הפיצ'ר תהיה דרך כפתור הווליום במכשיר. מטיאס הוסיף כי "זו הגדרה מחדש של מה זה לעשות Mute לטלפון. זה לא שאני לא רוצה לדעת מה הטלפון אומר, אלא רק שאני לא רוצה את זה ברעש".
מאמצי ההנגשה של גוגל כוללים גם הנגשה של מידע לאנשים שמתקשים בקריאה, במדינות מתפתחות למשל. פיצ'ר נוסף בהובלה ישראלית שהוצג בכנס מתוך המטרה הזו הוא גוגל לנס עבור אפליקציית גוגל גו, שנועדה למדינות מתפתחות. האפליקציה מאפשרת למשתמשים לצלם תמונות, של שלטים למשל, מנתחת את הטקסט שבתמונה ומקריאה אותו בקול, ואף יכולה לתרגם אותו לשפה אחרת.
פרויקט נוסף שעדיין נמצא בשלב מחקרי הוא Euphonia, שמטרתו לאפשר את זיהוי הדיבור של גוגל גם עבור משתמשים לקויי דיבור, בשל מחלות כמו ALS למשל, שהטכנולוגיה מתקשה לזהות היום. דותן עמנואל, ראש צוות מחקר בחטיבת Google AI סיפר כי בגוגל ישראל החלו לעבוד על הפרויקט לפני כשנה. "לפעמים למערכות קשה להבין דיבור לא סטנדרטי, אבל בני המשפחה של החולים מבינים אותם. חשבנו שאם הם מסוגלים להתאים את עצמם, אולי גם המודלים שלנו יכולים", הסביר עמנואל. "התחלנו לאסוף הקלטות של חולים ולקויי דיבור ולאמן מודלים אישיים עבורם, מאחר שהרבה פעמים מדובר בחולים שסובלים גם ממוגבלות בתנועה. דווקא הפעלה של מכשירים בבית בעזרת רמקול חכם למשל תוכל לסייע להם, אבל המערכת לא מזהה את הפקודות הקוליות שלהם". עמנואל הביע תקווה כי בהמשך ייאסף מספיק דאטה על מנת לאמן מודל כללי יותר לזיהוי דיבור, אך הוסיף כי "בדרך אנחנו יכולים לעזור ללא מעט אנשים באופן פרטני וזו מטרה ראויה".
בעוד שגוגל מנסה להנגיש את מוצריה לכמה שיותר קהלים, בהם בעלי מוגבלויות או אנשים המתקשים בקרוא וכתוב, הקהל הישראלי עדיין לא נהנה מיכולות זיהוי הדיבור של גוגל שלא פועלות בעברית. אין עדיין בשורה בעניין זה, וכשמטיאס נשאל האם השירותים הקוליים יהיו זמינים בקרוב הוא השיב כי "המטרה שלנו היא שבסוף זה יעבוד בכל השפות. אבל יש יותר מידע באנגלית ולכן אנחנו מתחילים משם".
פרט לשירותים המתבססים על ניתוח דיבור וטקסט, במפגש הוצג גם כלי חיזוי השטפונות של גוגל שפותח בהובלת מהנדסים ישראלים ושעדכון עבורו הוכרז בכנס בשבוע שעבר. "בשעת משבר כמו אסונות טבע או פיגועי טרור, חשוב לאנשים לקבל גישה למידע כדי לשמור על עצמם", הסביר מטיאס וסיפר כי "לפני תשע שנים, כשפרצה השריפה בכרמל, הייתי במרכז הפיתוח שלנו בחיפה. לא היה הרבה מידע באינטרנט ולא ידעתי אם אני צריך לפנות את המשרד. למשטרה היה מידע וביקשתי מהצוות לדאוג שכל אחד יוכל למצוא את אותו בחיפוש. לפני שנתיים צוות מישראל ומהעולם השיק מוצר בחיפוש בשם SOS Alerts שמנגיש בחיפוש מידע חשוב תוך פחות משעה מרגע שיש אירוע משמעותי. מאז שהשקנו אותו היו 250 אירועים בהם זה הופעל ו-2 מיליארד צפיות במידע".
כחלק מהעיסוק במשברים, מטיאס סיפר כי בגוגל למדו ששטפונות משפיעים על עד 250 מיליון אנשים בעולם, והתראה מראש יכולה הייתה להגן עליהם טוב יותר, ולכן השיקו את הכלי לחיזוי השטפונות.
סלע נבו, ראש צוות מחקר ב-Google AI שמוביל את מאמצי חיזוי השטפונות הסביר כי "שטפונות הן אסון הטבע הנפוץ והקטלני בעולם. הם משפיעים על מאות מיליוני אנשים בעולם והורגים בין אלפים לעשרות אלפים כל שנה. אבל שליש עד חצי מההרוגים והמחירים הכלכליים ניתנים למניעה אם יש התראה מראש. הבעיה שבמדינות מתפתחות, מהן מגיעים רוב ההרוגים משטפונות, אין יכולת לייצר התראה מדויקת. בגוגל, אנחנו לוקחים מידע מתמונות לווין אופטיות וגורמים נוספים, מסיקים איך המים ינועו על פני הקרקע ומייצרים הערכות מדויקות. אנחנו מתריעים אקטיבית באנדרואיד למשתמשים שנמצאים במקומות מסוכנים, מראים בגוגל מאפס איפה יהיה בטוח ואיפה יהיה מסוכן ומנגישים את המידע על האירוע בחיפוש. בשנה שעברה עשינו פיילוט ראשון בעיר אחת בהודו והשנה אנחנו מרחיבים את הכיסוי למיליוני אנשים לאורך הגנגס והבראהמאפוטרה שהם שניים מהנהרות הגדולים בעולם".
נבו הסביר כי כרגע המיקוד הוא בשטפונות גדולים מנהרות שעולים על גדותיהם, אך בעתיד מקווים להצליח לחזות גם שטפונות בזק, כמו שמתרחשים בנגב למשל.
לתשומת לבכם: מערכת גלובס חותרת לשיח מגוון, ענייני ומכבד בהתאם ל
קוד האתי
המופיע
בדו"ח האמון
לפיו אנו פועלים. ביטויי אלימות, גזענות, הסתה או כל שיח בלתי הולם אחר מסוננים בצורה
אוטומטית ולא יפורסמו באתר.