"יש לנו דאטה. המערך האפידמיולוגי נעזר במערכת חכמה שפותחה במשרד הבריאות לאיתור שרשראות ההדבקה. זו מערכת מהמובילות בעולם, שמשתמשת באלגוריתם בינה מלאכותית ומציגה את המידע המצטבר, מצליבה נתונים, ומעניקה מבט-על של כלל הנדבקים. המערכת תמשיך לסייע לנו בקטיעת שרשראות ההדבקה". כך כתב שר הבריאות יולי אדלשטיין בחשבון הטוויטר שלו בתחילת החודש, וחשף לעולם את המערכת הממוחשבת תומכת ההחלטות של משרד הבריאות.
אדלשטיין כתב את הדברים כתגובה לביקורות שהושמעו על משרד הבריאות ועל התנהלותו לאורך משבר הקורונה המתמשך. כך, הציבור נוכח לגלות שמקומות בילוי, חדרי כושר וחופי רחצה נסגרו והוטלו עליהם מגבלות, מבלי שלמשרד הבריאות היו נתונים על מספר הנדבקים בכל אחד מסוגי המקומות הללו. משרד הבריאות הוא זה שמתחקר חולים במסגרת חקירות אפידמיולוגיות ומחזיק במסד הנתונים המלא הנוגע לזמני ההדבקה, מקומות ההדבקה, זהות הנדבקים והתסמינים. אולם הנתונים חסרים ונראה שההחלטות מתקבלות באופן שרירותי.
ההידרדרות במצב בישראל והעובדה כי הגל השני מכה פה חזק יחסית לנעשה בשאר העולם, מחייבות לשאול מהי המערכת עליה דיבר אדלשטיין, מה תפקידה בקבלת ההחלטות, האם היא באמת מספקת "מבט-על" וכיצד היא נעזרת לשם כך בבינה מלאכותית. משיחות עם גורמים במשרד הבריאות עולה כי אדלשטיין צודק בדבר אחד: יש למשרד הבריאות מערכת לא רעה, אך בכל זאת אין נתונים ואין תמונת-על. הפרויקט התחיל עם כוונות טובות ונראה מבטיח, אך נתקע בחומה של מחסור בחוקרים אפידמיולוגיים, סדרי עדיפויות שגויים וליקויים בדרג קבלת ההחלטות. כל אלו מנעו יצירת דאטה איכותי שיאפשר שימוש אפקטיבי במערכת.
פיתוח מערכת בשיתוף פעולה ובזמן שיא
משרד הבריאות החל בפיתוח המערכת לאיתור וקטיעת שרשראות ההדבקה בה התגאה אדלשטיין בסביבות אמצע חודש מרץ ועשה זאת בשקט יחסי ומתחת לרדאר. המערכת פותחה על ידי מחלקת מדעני הנתונים של משרד הבריאות בראשות משה עוזיאל, בשיתוף פעולה עם מתכנתים מקהילת ג’אווהסקריפט ישראל. התהליך הוא תולדה של שיתוף פעולה שלהם עם מחלקת בריאות הציבור שבראשה עמדה פרופ’ סיגל סדצקי, שהתפטרה לאחרונה מתפקידה תוך שהיא מצביעה על ליקויים במערך הטיפול בקורונה. המחלקה מפעילה את מערך החקירות האפידמיולוגיות וכן לוקחת חלק בקבלת החלטות הקשורות להגבלות והטלות סגר ולהנחיות התו הסגול.
מאחורי הפיתוח עמדה ההבנה כי יש בעיית סינכרון בין החקירות האפידמיולוגיות למחלקה שמקבלת את ההחלטות על הנחיות ומגבלות. הנתק בתוך משרד הבריאות נבע ממגבלות טכנולוגיות - המערכת שאליה הזינו עשרות אלפי תיקים של חקירות אפידמיולוגיות, היא מיושנת ולא מאפשרת הצגת המידע במרוכז ובאופן ויזאולי.
לכן הוחלט לפתח מערכת חדשה שמקבלת אליה את כל המידע מהתיקים האפידמיולוגיים מצד אחד, ומציגה אותו באופן ויזואלי למקבלי ההחלטות מהצד השני. היא מציגה את המידע לפי מסננים שונים: זמן ומקום ההדבקה, סוגי מקומות ומאפייני הנדבקים. כמו כן, היא מציגה את השינויים במדיניות על ציר הזמן וכך יכולה להראות את השפעתם. המערכת לא מציגה רק נדבקים בודדים, אלא גם שרשראות: חולה מאומת יוצג כשהוא מקושר למי שהדביק אותו, ולאנשים אותם הדביק בעצמו. כך ניתן לראות כיצד מתפשטת המחלה, ולפחות על הנייר, לקטוע את התפשטותה.
כלומר, השימוש העיקרי במערכת הוא המחשה ויזואלית של הנתונים מהחקירות האפידמיולוגיות. במערכת יצרו דורות הדבקה, כשהדור הראשון כלל מעל 2,000 נשאים של הנגיף שהגיעו מחו"ל. במשרד ניסו לנתח איפה השרשרת נקטעה מהר יחסית ואיפה המשיכה להתפשט כמה דורות קדימה.
הפיתוח התבצע בזמן שיא עבור משרד הבריאות, של שבועות ספורים בלבד, ובסביבות חודש אפריל כבר עלתה לאוויר גרסה של המערכת בקוד פתוח, כלומר גופי בריאות אחרים בארץ ובעולם שבידיהם נתונים על הדבקות יכולים להשתמש בה בחינם. המערכת ממשיכה להתעדכן על בסיס שבועי, וצוות מדעני הנתונים שמופקד על פיתוחה מוסיף פיצ’רים חדשים, לבקשת מחלקת בריאות הציבור.
הכל מתנקז לחקירות האפידמיולוגיות
עד כאן מדובר בסיפור הצלחה שכולל שיתוף פעולה בין מחלקות שונות במשרד הבריאות ובין קהילת מתכנתים, שהביאה לפיתוח מהיר של מערכת איכותית. אולם ככל שמתעמקים בסיפור, הולכים ומתבהרים הליקויים בשיטות העבודה ומספקים תזכורת כי טכנולוגיה לבדה אינה הפתרון.
המערכת אמורה לשמש את בכירי משרד הבריאות כתומכת החלטות מדיניות, על ידי בדיקה של השפעתם של צעדים, כמו החלת מגבלות או הסרתן על שרשראות ההדבקה. אולם למשל, רק לאחר שנשמעה ביקורת ציבורית על סגירת חדרי הכושר, נתבקש צוות הפיתוח להוסיף פיצ’ר שיאפשר סינון נתונים לפי סוג מקום ההדבקה, והוא עלה לאוויר לפני כשבועיים. כלומר, במשך מספר חודשים נקבעו מגבלות, ורק באחרונה הבינו במשרד הבריאות שכדי לקטוע שרשראות הדבקה יש לדעת כמה מהן החלו או צברו תאוצה במקומות בילוי, חדרי כושר, בתי כנסת ובאוויר הפתוח.
בנוסף, מתברר שהמערכת לוקה במחסור חמור במידע עדכני, שבלעדיו השימושים שלה מוגבלים ביותר. המערכת מאפשר לזהות איפה יש מחסור בנתונים, על ידי כך שהיא מבינה שלא ניתן לזהות איפה צמחו שרשראות ההדבקה. בישראל נאספים נתונים משלושה מקורות: איכוני שב"כ, אפליקציית "מגן" וחקירות אפידמיולוגיות. השניים הראשונים תומכים במערך החקירות האפידמיולוגיות ואינם עומדים בפני עצמם. אך עם מאות בודדות של חוקרים בכל הארץ, שצריכים לטפל במאות ואף אלפי מקרים מאומתים המתגלים כל יום, אין דרך לבצע חקירות ביעילות ובמהירות.
כך, במצגת שמשרד הבריאות הציג בכנסת ב-19 ביולי הופיעו נתונים על מקומות ההדבקה בשבוע שבין ה-10 ל-16 ביולי. מתוך 7,998 חולים מאומתים בתקופה הרלוונטית, משרד הבריאות איתר את מקום ההדבקה רק של 2,228 מהם, כלומר 27%. אותו השקף חושף גם איפה מתחיל הכשל - מתוך כלל החולים המאומתים בשבוע הזה, רק 64% עברו חקירה אפידמיולוגית. לא צוין מה קרה עם שאר החולים.
הסיבה לפערים נעוצה בכך שלוקח שבוע עד מספר שבועות לביצוע חקירה אפידמיולוגית על חולה מאומת. אבל גם עצם קיומה אינו מבטיח קבלת נתונים מספקים, ומתוך אלה שנחקרו, 43.5% בלבד הצליחו לאתר את מיקום ההדבקה.
יותר מכך, במשרד הבריאות מזהירים שגם הנתונים הקיימים אינם מדויקים משום שהחולים לא תמיד זוכרים היטב את הפרטים כשהם נשאלים עליהם בחקירה, ואין זה פלא: כשהחקירה מתבצעת שבועיים אחרי שהחולה אומת, סביר שכבר שכח היכן שהה בכל רגע נתון. זה הסיפור של המערכת של אדלשטיין על רגל אחת: משרד הבראות מגויס לפיתוח מערכת שנועדה לאסוף ולהציג דאטה, אבל אין מספיק דאטה להזין את המערכת.
בינה מלאכותית ושימושים מוגבלים
אדלשטיין התהדר בציוץ שלו כי המערכת כוללת בינה מלאכותית, סוג של מילת קסם. היה ניתן לחשוב כי בבסיס המערכת עומדים אלגוריתמים של בינה מלאכותית, שמאפשרים לחזות את התפשטות המחלה ומסייעים לקבלת החלטות, אך לא כך המצב.
הבינה המלאכותית אינה משמשת כלל לניתוח נתונים. המקום היחיד בו ישנה בינה מלאכותית במערכת הוא ביכולת ניתוח שפה טבעית המשמשת לקריאה של התיקים האפידמיולוגיים, איתור של מידע בתוך הטקסט החופשי שכותבים החוקרים והזנתו למערכת באופן אוטומטי. הטכנולוגיה באה לענות על אחד האתגרים של החקירות האפידמיולוגיות - העובדה שחלק מהמידע שנאסף בהן נכתב בכתב חופשי על ידי החוקרים, יכולה להקשות על זיהוי מוקדי הדבקה בשל כתיב שונה. המערכת מזהה מילים בעלות משמעות זהה - בר או באר.
למה לא משתמשים בבינה מלאכותית לצורך יצירת תחזיות - למשל איתור דפוסים המצביעים על כך שצפויה התפרצות באזור מסוים? תובנות כאלו היו מאפשרות להטיל סגר ומגבלות על אותו האזור כדי למנוע את ההתפרצות.
לשם יצירת תחזיות יש צורך בכמות גדולה של נתונים לאימון האלגוריתמים. מכיוון שהקורונה היא יחסית חדשה וישראל היא מדינה קטנה, נתונים כאלה לא יכולים להגיע ממקרי קורונה קיימים בישראל. אלו צריכים להיות נתונים על התפשטות של מגפות שונות ברחבי העולם, כמו מגפת הסארס במזרח אסיה.
לאחר אימון האלגוריתמים, יש צורך בנתונים עדכניים כדי לקבל על בסיסם החלטות על צעדי מדיניות רלוונטיים. האלמנטים הללו לא קיימים במערכת משרד הבריאות, אך חברות פרטיות, מוסדות אקדמיה ומחקר ומדינות שונות מפתחות מערכות המשלבות אלמנטים של בינה מלאכותית כדי להפיק תחזיות מהנתונים המוזנים אליהן.
ככל הידוע, במשרד הבריאות נרתעים מקביעת מדיניות עתידית על בסיס הנתונים, מכיוון שהם חלקיים. "יש פחד לחשוף את הנתונים יותר מדי, כדי למנוע מאנשים שאינם בעלי מומחיות בנושא להסיק מסקנות לא נכונות", אומר גורם במשרד הבריאות ל"גלובס". זה יכול לנבוע מזה שהם מסתכלים על הדאטה הקיים, ולכן המסקנות הן א‘, ב‘, ג‘. אני אומר כל הזמן: הדאטה חלקי והחקירה האפידמיולוגית מתפתחת עם הזמן. רק שבועיים שלושה אחרי האירוע של הפיראט האדום, אותרו כל שרשראות ההדבקה של האיש שהיה שם". עד כה משרד הבריאות העדיף להימנע מחשיפת הנתונים מכיוון שהם חלקיים, והתבססות עליהם תוביל ליצירת תחזיות לא נכונות. בימים אלה, המשרד מפתח פלטפורמות להנגשת המערכת והנתונים בה לחוקרים וקובעי מדיניות, תוך ניסיון
להגדיר היטב את טיב הנתונים שהיא יכולה לספק ואת השימושים המוגבלים שאפשר לעשות בהם.
במשרד הבריאות מתמודדים עם מחסור בנתונים מכיוון שמערך החקירות האפידמיולוגיות לא מספיק אפקטיבי. החוסר בנתונים מלמד שהתשתיות אמנם קיימות, אך אף מערכת, חכמה ככל שתהיה, לא תעזור להילחם בקורונה עד שלא יתעדפו איסוף מידע שמיש, אמין ורלוונטי. "המערכת היא רכיב בתוך אקו-סיסטם גדול, ומשבר בהיקף כזה לא יכול להיפתר על ידי מערכת בודדת", אומר אותו גורם במשרד הבריאות. למרות זאת, קובעי המדיניות פספסו הזדמנויות לאיסוף נתונים יעיל ולחיזוק המערך האפידמיולוגי, ופעם אחר פעם שמו את יהבם בשב"כ.
מלבד הגדלת מספר החוקרים, אפליקציית ניטור מגעים כמו ה"מגן", שמושקת בגרסתה השנייה בימים אלה, יכולה לשפר את יעילות המערך האפידמולוגי. ה"מגן" אוספת מידע על מיקומם של משתמשים באופן וולונטרי ופרטי - על גבי מכשירי הטלפון שלהם בלבד. רק כאשר משתמש באפליקציה מוצא את עצמו בחקירה אפידמיולוגית, הוא יכול לבחור לחשוף את המידע על מיקומו בפני החוקר, וכך לספק מידע מדויק שלא מתבסס על הזיכרון.
בגרסתה הראשונה של האפליקציה נמצאו ליקויים, והתברר שהשימוש באפליקציה חדשה שפותחה על ידי סטארט-אפ צעיר, הוא לאו דווקא הצעד הטוב ביותר. לאחר מקצה שיפורים, הושקה החודש הגרסה השנייה של אפליקציית המגן, שעושה שימוש בטכנולוגיית בלוטות’, שהיא מדויקת יותר מהטכנולוגיות ששימשו את הגרסה הראשונה.
בנוסף, לא נערך קמפיין ציבורי רחב שהביא להתקנתה של האפליקציה בקרב חלק מספיק מהציבור, ויש לקוות שבגרסתה השנייה יתקיים קמפיין כזה. מבלי שחלקים נרחבים בציבור יתקינו את האפליקציה, לא יהיה שיפור במערך האפידמיולוגי.
על פני האפליקציה הזו נעשה שימוש רחב באיכוני השב"כ, שמסייעים באיתור חולים באופן נקודתי, אך לא יכולים להזין מערכת כמו זו של משרד הבריאות. ראשית, בשבועות האחרונים מתברר שהשב"כ אינו כל יכול, והאיכונים אינם מדוייקים. שנית, האיכונים מפרים את חירויות הפרט ונוגדים את עקרונות הדמוקרטיה, ולכן הם מותרים לביצוע רק על אנשים שמשרד הבריאות ביקש לנטרם, בעקבות מידע מחקירה אפידמיולוגית. כל נתון שנאסף מאיכוני שב"כ נמחק בתוך שבועיים מיום איסופו - מה שמקשה על יצירת מאגר נתונים עם היסטוריה רחבה.
כמה ימים לאחר פרסום הכתבה נמסר ממשרד הבריאות בתגובה: "המערכת מבוססת על כלל המידע הרלוונטי מתוך מערכת החקירות האפידמיולוגיות. בעצם, מרגע עליית המערכת לאוויר בגרסתה הראשונה לפני כחודשיים על סמך המידע הקיים ,היא כבר סייעה ביצירה של תובנות והבנה של התנהגות שרשראות ההדבקה. כל מערכת מידע היא טובה רק כטיב והיקף המידע שמוזן לתוכה. יצירת שרשרת הדבקה היא תהליך הנמשך על פני מספר ימים כפועל יוצא של ביצוע החקירות האפידמיולוגיות. הפער הכרונולוגי בין הידבקות האדם לבין השתלבותו בשרשרת הדבקה היא כורח המציאות. כמובן שככל שפער זה יצומצם, כך ייטב. המערכת לא נועדה לקטיעת שרשראות הדבקה פרטניות. כלומר היא כלי לקביעת מדיניות ולא לטיפול פרטני במקרים.
"המערכת משמשת לניטור שרשראות הדבקה ולהפקת תובנות. קיים נתיב מחקרי נפרד המתבסס על נתוני החקירות (אך לא רק) ליצירת תחזיות. המערכת מבוססת על כלל המידע הרלוונטי מתוך מערכת החקירות האפידמיולוגיות. בעצם, מרגע עליית המערכת לאוויר בגרסתה הראשונה לפני כחודשיים על סמך המידע הקיים, היא כבר סייעה ביצירה של תובנות והבנה של התנהגות שרשראות ההדבקה. החשיבה וההטמעה יחד עם אנשי בריאות הציבור של מקומות ההדבקה וסיווגם לסוגי המקומות בתוך מערכת שרשראות ההדבקה החלו הרבה לפני שהנושאים נידונו בפורומים השונים.
"איכוני השב"כ מסייעים מאד לקטיעת שרשראות הדבקה פרטניות ואיתור מגעים שעליהם להיכנס לבידוד. המערכת לא נועדה למטרה זו אלא מתמקדת בחולים, ונועדה כאמור למטרת קביעת מדיניות, ותכנון. משרד הבריאות עסק בחודשיים האחרונים בשיפור משמעותי של אפליקציית המגן, אשר גרסה חדשה שלה הושקה ביום שני השבוע. מבין השיפורים הטכנולוגיים, שיפורים אשר אמורים לתרום לדיוק הנתונים ולחקירות האפידמיולוגיות ככל שישותפו עם החוקר".