למידת מכונה, או למידה עמוקה, הן מילות המפתח של התקופה. אבל חברת Nym הצליחה לתפוס לעצמה מובילות בתחום ניתוח הטקסטים הרפואיים, דווקא כשהלכה נגד האופנה הזו, וייצרה מערכת ביג דאטה שאין בה למידת מכונה בכלל. דווקא המערכת הזו מתאימה לצרכים של בית חולים או קליניקה רפואית, בבואם לגבות כסף מחברות ביטוח, והחברה הצעירה היא כבר גורם משמעותי בשוק.
עמיחי נידרמן, מייסד ומנכ"ל החברה (31) עשה את המסלול ההייטקי המלא של כיתת מחוננים, לימודי תואר במתימטיקה ומדעי המחשב כבר בתיכון, ושירות ביחידת הסייבר של 8200. "הייתי ביחידה 10 שנים. זו הייתה אחת התקופות היפות בחיי. פגשתי שם את החברים הכי טובים שלי, אבל מעבר לצד החברתי, זו הייתה תקופה מספקת, מבחינת האתגר ומבחינת האימפקט".
כשיצא לאזרחות, חשב על מסלול יזמי. "באותו הזמן אשתי נרין, שהיא רופאה, עסקה גם במחקר רפואי, והיא הייתה נעלמת לשעות לאיכילוב, כדי ללכת לחפש בתיקים את החולים שמתאימים לה למחקר. התיקים היו כבר ממוחשבים, אבל החיפוש היה לא אפקטיבי. כדי לחפש את החולים שעברו ניתוח מסוים, היא הייתה צריכה להשתמש בכל מיני טריקים, כמו למשל לחפש לפי שם של רופאה שהיא יודעת שאוהבת את הניתוחים האלה.
"אותי זה הטריד, כי הרעיון אצלנו ביחידה היה שכל מה שאפשר לעשות באוטומציה, עושים באוטומציה, וכל מה שאפשר לייעל מייעלים. גם מי שלא הגיע מעולם המחשבים וזה לא היה התפקיד שלו, למד לתכנת, והשתמש בזה. אז ביקשתי מאשתי ומאיכילוב אישור מיוחד להתחבר למערכת שלהם, וכתבתי להם אלגוריתם ניתוח שפה 'לעניים'.
"כתבתי את זה במהלך סופ"ש אחד וחג, וזה עבד. אשתי הייתה המתמחה הכי צעירה במחלקה, וזה עזר לה לייצר מחקרים ולהתקדם. אני נהניתי מכך שאני יכול לעשות משהו עם תרומה מהירה ומשמעותית כמו שהייתה לי בצבא, ומכך שאשתי יכולה לבלות יותר שעות בבית".
המחקרים כל כך הצליחו, שנרין החלה לנסוע לכנסים ולהרצות. "ואני נסעתי איתה, והתחלתי להבין קצת את עולם הבריאות. הבנתי מדוע היה קשה להביא אליו מוצרים כאלה. אם בתפקיד הצבאי שלי הוצאנו פרוטו-טייפים מאוד מהר, ואז עשינו להם התאמות למציאות בשטח, אז בעולם הרפואי אי אפשר לעשות את זה. מכל טעות אנשים יכולים למות. לכן המוצרים מפותחים בזהירות רבה, ומעגלי המכירה וההטמעה ארוכים מאוד. אבל זה לא חייב להיות המצב בצד האדמיניסטרטיבי של עולם הבריאות".
להבין את השפה
מעודד מההצלחה הראשונית, החליט ניידרמן להקים את Nym, יחד עם שותפו אדם רימון. "הוא חבר שלי מהיחידה, ואחרי השחרור מהצבא הוא למד בלשנות חישובית באוניברסיטת תל אביב. זה תחום שהקדים משמעותית את אלגוריתמי השפה הטבעית של החברות המסחריות, אבל הוא תמיד נשאר בגבולות האקדמיה, כשחלק מהמחקר היה סוגיות יסוד בשפה, כמו איך אפשר להבין סאבטקסט, סרקזם או תהיות היפותטיות שאינן בהכרח מסומנות בסימן שאלה.
"בשפה של הרופאים אין את הדברים האלה - ולכן, במובן הזה, היא קלה. שפה רפואית לא תכלול בדיחות או רפרנסים תרבותיים מורכבים. היא חייבת להיות מובנת לכל רופא שיקרא את התיק".
העובדים של Nym הם בעיקר אנשי פיתוח שנמצאים בישראל. "הרבה מהם שירתו איתנו ב-8200", מספר נידרמן. "יש לנו בלשנים חישוביים שהם אנשי פיתוח לכל דבר ועניין, עם תארים מתקדמים בבלשנות חישובית, והם מפתחים את מנוע הבנת שפה שלנו. מעבר לזה יש לנו גם רופאים - לכולם יש רקע במדעי המחשב או שהם לומדים לתכנת אצלנו בחברה, והם לוקחים חלק בפיתוח. בארה"ב יש לנו אנשי מכירות ומוצר ו-Customer Success, כולם נמצאים בחוף המזרחי".
על המוצר שלהם עבדו במשך כשנתיים, ורק אז ביקשו להיכנס לשוק. "נפגשתי בכנס עם חברה ענקית שנותנת שירותי קצרנות לרופאים, באמצעות מתמלל שיושב לידם. ישבתי ליד המנכ"ל, וכשהזכרתי את השירות הצבאי שלי, מייד הוא נדלק. 'איזה אקדח היה לך?', הוא שאל, ואמרתי לו שהיה לי מחשב ממש טוב. הוא התעקש להזמין אותי לבית שלו, לירות בפחיות בירה בחצר. זו הייתה הפעם הראשונה שלי בג'ורג'יה. יריתי יותר טוב ממה שחשבתי. עדיין יש לי את הפחית הזו".
כך נחתמה העסקה הראשונה עם חברת Scribing. "הם הציעו את השירות שלהם יחד עם השירות שלנו, כדי להיראות חדשניים יותר. וכבר מהעסקה הזו קיבלנו תשלום". בשנה שלאחר מכן נחתמו עסקאות נוספות, למשל עם Geisinger, רשת של 14 בתי חולים שגם מחזיקה בית ספר לרפואה משלה. בין המשקיעים של החברה נמנים גוגל ונצ'רס, בסמר, לייטספיד ו-Dynamic Loop Capital. בסך הכול גויסו 23 מיליון דולר.
"הצלחנו לקבץ סביבנו קבוצת לקוחות שמרוצים מהשירות. יש עשרות שמחכים לעבוד איתנו. בקרוב נגייס אנשי הטמעה, ומינואר 2021 נוסיף לקוחות במהירות רבה יותר, כאשר כל עסקה היא כמה מיליוני דולרים. השותפות עם Scribing היא עניין אחד, אבל מלבדה אנחנו הולכים ישירות ללקוחות, בדרך כלל חדרי מיון, מחלקות קרדיולוגיה ורדיולוגיה".
ממשק מבוסס קודים
כדי להבין את השוק שבו נידרמן פועל, יש להבין את מערכת הבריאות האמריקאית. "בתי החולים הם ארגונים פרטיים למטרות רווח, או לפחות מתנהלים ככאלה. חברות הביטוח גם הן גופים פרטיים או מתנהלות ככאלה, כולל הביטוח הממשלתי מדיקר. כל צד רוצה להרוויח כסף, ויש ביניהם חוסר אמון.
"חברות הביטוח רוצות לדעת בדיוק מה היה הטיפול, ועבור מה הן שילמו. אבל אין להן מספיק צוות כדי שיקרא כל אחד ממכתבי השחרור, וגם הרופאים לא רוצים לשלוח להם את מכתב השחרור שבו מפורט כל תהליך החשיבה שלהם. הם חושפים את עצמם לערעורים, ואפילו לאחריות משפטית".
הממשק שסוכם בין הגופים מבוסס על קודים. כל טיפול רפואי, כל אבחון וכל שימוש בציוד רפואי על ידי בית החולים, מקבלים קוד. את רשימת הקודים מגישים לחברת הביטוח, ולכל קוד יש תשלום. כדי לקודד תיק נדרשות כמה דקות, מה שאומר שהדבר יכול לעלות בשעת עבודה של רופא כל יום. אם ניזכר כמה יקרה שעת עבודה של רופא בארה"ב, נבין באיזה הפסד מדובר לבית החולים או לרופא עצמו בקליניקה הפרטית.
הרופא לא חייב לקודד בעצמו, ואכן התפתח מקצוע של מקודדים. "ישנם היום רבע מיליון מקודדים עבור מערכת הבריאות האמריקאית, וחלקם בכלל לא אמריקאים אלא יושבים בפיליפינים, בהודו, ויש אפילו קבוצה של מקודדות חרדיות בישראל". המקודד קורא את מכתב השחרור, ומתרגם אותו לשפת הקודים, וזאת אחרי שעבר קורס הכשרה בן כמה שבועות במונחים רפואיים.
"ככל שמערכת הקודים הופכת סבוכה ומורכבת יותר, כך פחות הגיוני שבני אדם יעשו את זה", אומר נידרמן. "היום קיימים במערכת הבריאות האמריקאית בערך 200 אלף קודים, כאשר בשלוש-ארבע השנים האחרונות כמות הקודים גדלה בצורה משמעותית. ככל שהקודים מורכבים יותר, המיון שלהם מצריך יותר ויותר ידע רפואי, שחסר אצל המקודדים".
אם המקודד עושה טעות, התביעה נדחית, ולא תמיד משתלם לבית החולים לפתוח אותה מחדש ולערער. "כך הם מפסידים מיליארדי דולרים בשנה בשל דחיית תביעות, בעקבות טעות בקידוד. אם יהיו יותר מדי ערעורים, חברת הביטוח עלולה להפסיק את התשלומים למשך כמה חודשים, עד שבית החולים יוודא שמערכת הקידוד שלו בסדר, ובתקופה הזו הוא עלול לסבול ממש ממצוקת נזילות. אם יש טעות בקידוד מול גורם ממשלתי, בחברת הביטוח עלולים להחליט שזו הונאה".
אף אחד לא ניסה להגיד לרופאים פשוט לכתוב בקודים מראש?
"על הרופאים יש לחץ גדול מאוד, והיומיום שלהם מאוד כאוטי. יש דיאלקטים רפואיים שונים, פורמטים שונים. רופאים צעירים לא יכולים להספיק ללמוד איך לכתוב בשפת קוד תוך כדי העבודה, שהיא בהולה מהיום הראשון שלהם במערכת. כשהיו ניסיונות לבקש מהם לכתוב בצורה יותר שבלונית, הם מאוד התנגדו לזה, או השקיעו בזה יותר מדי זמן".
חסם הקופסה השחורה
Nym היא לא החברה הראשונה שמנסה ליצור אלגוריתמים לפענוח הטקסט שכותבים הרופאים, והמרתו האוטומטית למאגר נתונים מובנה. חברות כמו IBM ומיקרוסופט עוסקות בכך, לצד עשרות חברות קטנות יותר. "זו בעיה שמנסים לפתור כבר 20 שנה", אומר נידרמן, "אבל לכולם היה דבר אחד במשותף: הם פיתחו מודלים שמבוססים על למידה עמוקה ולמידת מכונה.
"יש כאן שתי בעיות. אחת היא שמאוד קשה להגיע לרמת דיוק מספיק גבוהה בטקסטים רפואיים, בעיקר כי כל משפט מאוד עשיר במידע. הרופא מזכיר תרופה - האם זו התרופה שהמטופל לקח בבית או באשפוז? צריך להבין את רמת הביטחון שבה כל דבר נאמר. אם מוזכרת אבחנה - זו אבחנה של הרופא? אולי משהו שרוצים לשלול? אולי החולה אמר שזה מה שהוא מאמין שיש לו, והרופא ציין זאת אף שהוא חושב שזה משהו אחר?
"החסם השני הוא שאלגוריתמים של דיפ לרנינג עלולים להיות קופסה שחורה. כשאתה מגיש תביעה כזו לחברת הביטוח, וההסבר היחיד שלך הוא 'זה מה שהמחשב אמר' - הם לא ישלמו".
ולא יכולים להיות אלגוריתמים של למידת מכונה שאפשר גם להבין מה הם עשו?
"כשמדובר בהרבה דאטה ובלמידת מכונה עמוקה, כנראה שלא".
זה אומר שהעולם יצטרך לסגת מהרעיון של למידת מכונה בתחומים רבים.
"בהחלט יכול להיות. למשל אם אי פעם נרצה ליישם את האלגוריתם שלנו לתמיכה בהחלטות רפואיות, להערכתי אין שם מקום למודלים סטטיסטיים. אי אפשר להגיד לאדם 'נקטע לך רגל, כי כך עשו לרוב האנשים שדומים לך'.
"כשאמאזון פיתחו מוצר דיפ לרנינג לטקסטים רפואיים, הם ראו שהתוצאה משתנה לפי השינוי בשם המטופל. זה לא אמור לקרות. מערכות אחרות שהתאמנו על תיקים היסטוריים למדו בטעות ש'היא' זה תמיד האחות, ולא הרופאה".
הקורונה הביאה לקוחות
רימון ונידרמן יישמו את העקרונות של הבלשנות החישובית הקלאסית לבעיית הקידוד. "הבנו שלא נוכל לפענח טקסט ולקודד אותו, בלי להבין את הנרטיב הרפואי - מה הביא את החולה לבית החולים? מה הוא אמר לרופא שיש לו? מה הרופא חשב על זה? מי אמר למי כל משפט - החולה לרופא? הרופא לחולה? אימא של החולה?
"חלק מהחברות שניסו לעשות זאת פיתחו כלים 'על ידי מקודדים עבור מקודדים'. אצלנו מי שכותבים את הכללים לכלי הם רופאים. הם לא קוראים אותו כמו שמקודד קורא תיק, אלא כמו שרופא קורא תיק, אחרי שעבר קורס קידוד. בבדיקות חיצוניות הגענו ל-97%-98% דיוק באופן קונסיסטנטי. בזכות זה, יחד עם היכולת להסביר בדיוק איך האלגוריתם שלנו עובד - על בסיס חוקים, ולא על בסיס למידת מכונה - עשינו הרבה רעש בתעשייה.
"הדאון סייד הוא שאנחנו לא יודעים לעשות את זה על כל התיקים, אלא רק על 60% מהתיקים. קשה להיות במצב שבו אמרנו 'לא' לחלק מהלקוחות, אבל רצינו להיות ממוקדים - וזה השתלם.
"בינתיים, חלק מהתיקים אנחנו מחזירים, ואומרים שאי אפשר היה לקודד אותם באמצעות המכונה, ואז המקודדים שמחים כי הם מרגישים שהם מקבלים את התיק המורכב יותר, שרק בן אנוש יכול לעשות. אבל עבור מה שאנחנו מקודדים, הלקוחות יכולים להיות רגועים. ואם חברת הביטוח כן תערער עליהם או תעשה להם ביקורת, יש להם תיעוד מלא אוטומטי של כל ההחלטות".
איך השפיעה הקורונה על הפעילות שלכם?
"בהתחלה היה חוסר ודאות, כשלא היה ברור איך השוק יגיב, כמה לקוחות (שהם בתי חולים) יהיו פתוחים להכניס טכנולוגיות חדשות. אבל באזור מרץ כל הודו והפיליפינים נכנסו לסגר של כמה שבועות. חלק גדול מאותם המקודדים שאנחנו מחליפים הם הודים ופיליפינים, ומה שקרה זה שהמון בתי חולים איבדו בלילה אחד את האפשרות לקודד תיקים ולקבל החזרים מהחברות ביטוח.
"הם התחילו לפנות אלינו, ולבקש להשתמש בפתרון שלנו. גילינו שאחת מהסיבות להשתמש בנו זה הזמינות של השירות שלנו, שבגלל שהוא לא תלוי בבני אדם, מאפשר לנו לקודד 24/7 וגם במצב של מגפה עולמית כמו קורונה. לא היינו מוכנים לכמות לקוחות כזאת, אז כרגע יש לנו רשימת המתנה של בתי חולים וארגוני רופאים, שמחכים שנעלה אותם לאוויר".
Nym Health
פיתח מערכת ביג דאטה לבתי חולים וקליניקות רפואיות ● הוקם על ידי עמיחי נידרמן ואדם רימון, שהכירו ב-8200 ● עד היום גויסו 23 מיליון דולר, בין היתר מהקרנות גוגל ונצ'רס ולייטספיד