כמה פעמים מצאתם את עצמכם מתארים שוב ושוב את תלונותיכם בפני רופאים שונים, מארגנים את ההיסטוריה הרפואית שלכם לכדי סיפור רציף, מדגישים פרטים אחדים ומשמיטים אחרים? התיק הרפואי שלכם אולי פרוש לפניהם, על המחשב, אבל הזמן קצר, וכך החלטות שהיה מוטב לקבל על סמך מידע רב מתקבלות על סמך מידע מועט.
עידן הביג דאטה עשוי לשנות את כל זה ולהפוך כל ביקור אצל הרופא למיני-ניסוי קליני שיניב את הטיפול הטוב ביותר: מערכת ממוחשבת תאתר ברחבי העולם קבוצה של אנשים עם נתונים דומים לאלה של המטופל (למשל אנשים הסובלים מאותה מחלה ויש להם נתוני רקע, גנטיים ואחרים, דומים), תבדוק אילו טיפולים ניתנו ותציע את הטיפול המוצלח ביותר. חברת התוכנה SAP חותרת כבר היום להקמת מאגר מידע שיאפשר לרופא לבצע חיתוך אד-הוק כזה, בעיקר במחלות כמו סרטן.
בשיחה עם מומחי תחום הבריאות בענקיות הביג דאטה גוגל ג'נומיקס ו-SAP ניסינו להבין לאן החיבור הזה בין רפואה להרבה מאוד מידע עוד יכול להגיע.
האתגר: איסוף המידע
ברוב התחומים שבהם מיישמים היום טכנולוגיות של ניתוח ביג דאטה (מאגר מידע אדיר של נתונים מבוזרים ולא מאורגנים), המידע הוא זמין מאוד והאתגר המרכזי הוא איך לנתח אותו, אבל בתחום הרפואי, האתגר הוא קודם כול באיסוף המידע: ראשית, רובו המוחלט כלל לא נמצא באינטרנט. חלקו שמור עדיין בניירות, וחלקו שמור במגוון תוכנות מחשב שאינן מתקשרות בהכרח אלה עם אלה. שנית, להבדיל מהמצב בישראל, שבה מטופלים מזוהים במספר תעודת הזהות שלהם, ברוב המדינות הזיהוי נעשה לפי שם, והוא יכול להיכתב בכמה אופנים. קושי שלישי נוגע לקידוד המידע - חלקו נכתב בשפה חופשית על ידי הרופא וחלקו אגור בתמונות.
בניגוד לעבר, חברות הפועלות בתחום הביג דאטה אופטימיות היום וטוענות שישי בידיהן הטכנולוגיה להתמודד עם כל הקשיים הללו. "עד לפני כמה שנים, אגירה ושליפה של מידע נעשו בשיטות דומות לאלה שהיו מקובלות בשנות ה-80", אומר ד"ר דיוויד דלייני, סמנכ"ל רפואי למדינות אמריקה בתאגיד אחסון המידע וכריית המידע SAP.
"בשנים האחרונות חלה מהפכה בתחום, עם המעבר לשירותי ענן ולאלגוריתמיקה מתוחכמת יותר של שליפת מידע". מערכת HANA של החברה נחשבת כלי מתקדם ביותר בתחום מאגרי המידע, ויש לה גרסה ייעודית לעולם הרפואה. "המערכת הזאת מאפשרת להגיע לפרטי המידע החשובים מהר מאוד, לנתח אותם בזמן אמת ולהביא אותם לאדם הנכון", אומר דלייני.
דלייני מצביע על חולשות המחקר הרפואי היום ואומר כי רובו "מבוצע על בסיס נתונים שנאספו לפני שנים, ואיטיות האיסוף וביצוע המחקר מובילים לכך שמבחינת רבים, כשהתוצאות מגיעות, הן כבר לא רלוונטיות". מעבר לכך, בניסויים של תרופות, למשל, "כדי לדעת אם התרופה פועלת על 'רוב האנשים', מוציאים חולים 'מיוחדים' מהניסוי. אלא שבעולם האמיתי כל החולים מיוחדים, והרופא אומר, 'חולה כמו שלי בכלל לא היה בניסוי, אז מה מעניין אותי הניסוי?'. כך הוא מתחיל בתהליך ניסוי וטעייה להתאמת התרופה לחולה, כאילו הוא היחיד בעולם. היכולת לנתח נתונים רבים בזמן אמת אמורה לפתור את הבעיה הזאת. היום הרופאים פועלים לפי אינטואיציה, אבל לפעמים רופא נתקל במצב נדיר שהוא אינו מנוסה בו, ואנחנו לא רוצים שהוא יפעל על פי אינטואיציה שאין לו".
הרווח של הצרכן: יותר מידע, יותר תחרות
האם גם הצרכנים יוכלו להיחשף לכל המידע הזה ולהתחיל לעשות "ניסויים" בעצמם? למשל, אם אני שמה לב שאקמול משפר את התפקוד הקוגניטיבי שלי, האם אוכל לבדוק באינטרנט אם זה קורה גם לאחרים? "בשלב הראשון זה לא בתכנון, וזה קצת מוגזם לרוב הצרכנים", אומר דלייני, אבל עידן הביג דאטה נושא בשורה צרכנית מבחינות אחרות. "אנחנו יכולים היום לאפשר למטופל בתהליך שיקום או שינוי באורח חייו לראות בזמן אמת עד כמה הוא התקדם ביחס לקבוצה של אנשים דומים לו. זה יכול לתת מוטיבציה", הוא אומר.
יישומי הביג דאטה ברפואה גם יאפשרו למטופלים להתכונן טוב יותר לפגישה עם רופא. על בסיס נתוניו הרפואיים של הצרכן ותוצאות הבדיקות שלו, אלגוריתם מסוים יוכל לספר לו מה עשויות להיות האבחנות וההחלטות שיהיה עליו לקבל. בפגישה עם הרופא, יהיה עליהם רק לדון באפשרויות. נשמע מוזר? עד לפני כמה שנים גם הרעיון שנקבל תוצאות בדיקות ברשת ונוכל לקרוא מיד על משמעותן היה מופרך.
גם הכוחות הכלכליים שדוחפים את עולם הרפואה להסתמך על טכנולוגיות ביג דאטה עשויים להביא עמם יתרונות לצרכנים. מערכות הבריאות, שהגיעו לקצה היכולת התקציבית שלהן, הפסיקו את כל ההשקעות שלא הניבו חיסכון כספי מיידי, למשל רכישת ציוד רפואי מתקדם, אבל מהר מאוד הן גילו שלגישה החסכונית עלול להיות מחיר כבד בטווח הרחוק.
כדי לדעת היכן לחסוך והיכן כדאי בכל זאת להשקיע, אותן מערכות נזקקות להמון מידע שנצבר על פני שנים ולניתוח אינטליגנטי שלו. ברגע שיהיו כל אלה, מערכות הבריאות יוכלו לתגמל רופאים ומוסדות רפואיים בהתאם לתוצאות הטיפול, ולרופאים יהיה תמריץ להשתמש במערכות המידע הללו, הנקראות "מערכות מומחה".
מבחינת הצרכן, הכיוון הזה מבטיח שוק בריאות תחרותי יותר. אם היום רובנו הולכים לאיבוד כשאנחנו מחפשים רופא המתמחה בבעיה שממנה אנחנו סובלים ומסתמכים בעיקר על המלצות חברים, בעתיד כל אדם יוכל לראות איזה רופא משיג את התוצאות הטובות ביותר ובאיזה בית חולים יש המכשירים המתאימים ביותר לטיפול בו.
בעבר רופאים התנגדו להוספת מערכות מומחה משום החשש מפני פספוס של נתונים חשובים, אבל היום הגישה מתחילה להשתנות - הן משום שכמויות המידע מאיימות להטביע את הרופאים והן משום שבשיטת תגמול המבוססת על הצלחות יש פחות מקום לניסוי וטעייה בהתאמת הטיפול.
ב-SAP החליטו ליישם את הטכנולוגיה שלהם בתחום הטיפול בסרטן תחילה, שבו הפרקטיקה המקובלת עדיין היא של ניסוי וטעייה, אף שהתרופות ש"מנסים" הן יקרות, יש להן תופעות לוואי קשות ולעתים הן לא מועילות. מכוני מחקר שעובדים עם הטכנולוגיה הזאת אומרים שכבר היום הם מצליחים להפיק מכל המידע תובנות המובילות לשיפור הטיפול בחולים עם מאפייני מחלה מסוימים.
הפציינט הבריא: גוגל מגדירה מהי בריאות
בינתיים, בחברת גוגל ג'נומיקס עובדים על פרויקט "הפציינט הבריא", שעלותו עשרות מיליוני דולרים לפחות. נקודת המוצא של החברה היא שבדרך כלל אנחנו הולכים לרופא רק כשאנחנו חולים. כשאנחנו בריאים, אנחנו לא במעקב, ולכן אף אחד לא באמת יודע איך נראית בדיוק "בריאות".
פרויקט הפציינט הבריא יאסוף מאלפי אנשים, שלא אובחנו כלוקים במחלה כלשהי, מידע גנטי, מולקולרי (בדיקות דם, שתן וכדומה) וקליני (איך האדם מרגיש וכיצד מתנהג גופו בתנאים שונים). הבריאים ייחשפו לתרופות שונות, למזונות שונים ולמצבים רגשיים שונים כדי לבחון את השפעתם. מתוך כמויות המידע האדירות יאותרו דפוסים המעידים על בריאות, באותו אופן שבו מערכות אחרות מנסות לאתר דפוסים המעידים על מצב מחלה.
הגדרת הבריאות הזאת תאפשר לאתר "חריגות מבריאות" מבעוד מועד. איסוף המידע על האדם הבריא ייערך על ידי גוגל ג'נומיקס ויהיה מידע של החברה, אבל כל רופא יוכל להשתמש בו ולבצע השוואות בעזרת כלי הניתוח של גוגל בין קבוצת הבריאים למטופל.
במקביל לפרויקט "הפציינט הבריא", גוגל ג'נומיקס עובדת על יצירת "מנוע חיפוש גנטי" שייתן לחוקרים כלים נגישים לבצע את מחקריהם. "הצגה מפורטת של גנום של אדם מסוים כוללת 100 ג'יגהביט של מידע". אומר דיוויד גלאזר, המוביל את פעילות קבוצת גוגל ג'נומיקס. "בין כל שני אנשים יש דמיון ב-99% מהמידע הזה, והבדלים קטנים שקובעים במה הוא עלול לחלות".
כדי להבין אילו גנים משפיעים על אילו מחלות, יש לקחת כל 100 ג'יגה כאלה של מידע, לשלב אותם במידע הקליני הידוע על החולה, ואז להשוות זאת לאלפי חולים, עם אותה כמות מידע. "אבל אנחנו יודעים לעשות זאת", מרגיע גלאזר. לדבריו, האתגר הוא לפתח שיטות לקרוא את הרצף הגנטי מבדיקות המעבדה ולבנות כלי ניתוח של המידע.
אחד היישומים של "מנוע החיפוש הגנטי" הוא פרויקט "אוטיזם 10,000" שגוגל שותפה לו, באמצעות פלטפורמת Google Cloud Platform. במסגרת הפרויקט כבר נאספו יותר מ-12 אלף דגימות גנטיות של ילדים אוטיסטים ובני משפחותיהם, והשלב הבא הוא פענוח הרצף הגנומי של כל דגימה (היום המחיר הוא פחות מ-1,000 דולר לרצף), העברת המידע לכלים של Google Cloud Platform ואספקתו בחינם לכל חוקר שירצה לעשות בו שימוש, יחד עם כלי המחקר.
"זה היופי של שיתוף המידע בענן", אומר גלזר. "בשיטת הענן גם לחוקרים שאין להם משאבים רבים יש גישה לכל הנתונים". לשם השוואה, אם תרצו "להוריד" למחשב האישי שלכם מידע מגנום אחד, הזמן שזה ייקח לכם דומה לזמן הדורש להורדת מאות סרטים באורך מלא. טכנולוגיית הענן מאפשרת לשאול את המאגר שאלות, לבצע את הניתוח במחשבים רבים במקביל ולאחזר לחוקר רק את המידע שמעניין אותו.
יישום נוסף של ה-Google Cloud Platform הוא חקר הגנטיקה של סרטן. כאשר גידול סרטני מתפתח, הגנטיקה שלו משתנה ללא הרף, ולכן התרופות חייבות להיות מותאמות לא רק לגנטיקה של אותו אדם אלא גם לגנטיקה המשתנה של הגידול. חישבו באיזו כמות מידע מדובר, הרי כל שינוי בגנום של הגידול פירושו עוד 100 ג'יגה בייט.
יש גם צד מפחיד: לך תתווכח עם מחשב
"Sampling is dead", אומרים המומחים של SAP וגוגל, ומכוונים לכך שנגמר עידן הרפואה המבוססת על מחקר מדגמי בלבד. תחשבו על אלבומי התמונות שלנו מהעבר. בשנות ה-50 וה-60 הם כללו תמונות ספורות מכל שנת חיים, ואילו היום אנחנו מצלמים ומתעדים כל רגע. השאיפה היא שבתחום המידע העסקי, וגם הרפואי, תהיה לנו מעין "מצלמת אבטחה" שתאפשר לנו לחזור בכל רגע לכל אירוע שהתרחש בעבר ולצפות בו ממגוון זוויות.
לפחות בתחום הבריאות, זה יכול להציל חיים לשימוש בביג דאטה בתחום הרפואה יש גם סכנות. פרטיות היא כמובן הסוגיה הראשונה שעולה לדיון. החברות עונות עליה באמצעות הצפנה והבטחה להסרת הפרטים המזהים מהמידע הרפואי האישי כאשר הוא עובר לשימוש חברות הביטוח או חברות התרופות הגדולות לצורך הניסויים הקליניים שלהן. אולם, בעיקר בחברות העוסקות בכריית מידע למחייתן, קשה שלא לדמיין מכירה של המידע למפרסמים שישתמשו בו כדי לבצע שיווק ממוקד של מוצרים רפואיים לאוכלוסיות מסוימות. על פניו זה לא דבר רע, אך הוא עלול להוביל לרפואת יתר ואפילו לרפואה לא טובה.
מעבר לכך, כריית מידע רפואי אישי על ידי חברות הביטוח עלולה להוביל להפליה של מבוטחים, בלי שהן יידרשו לתת דין וחשבון על סיבת ההפליה, בדיוק כפי שעושות היום חברות האשראי, המאשימות אלגוריתמים של ביג דאטה בכך שהם קובעים את דירוג האשראי של אדם, ולך תתווכח עם מחשב.
אבל אלגוריתמים מציבים גם סכנה מסוג אחר - הם נוטים לחזור על מה שכבר היה. אלגוריתם רפואי יכול להציע טיפול שכבר בוצעו כמוהו בעבר, גם כאשר יש היגיון בהצעת דבר מה חדש. לכן לא נותר אלא לקוות שהמכונה לא תהפוך לשליטה בעל כוח רב מדי.
ביג דאטה והמלחמה באבולה: לתפוס אותה עוד לפני שאובחנה
אחד השימושים המעניינים של תחום הביג דאטה הוא איתור מגיפות מבעוד מועד, מיפוי התפוצה שלהן וטיפול ממוקד בהן. טכנולוגיות ביג דאטה מיושמות בתחום הזה כבר שנים רבות, והן משתכללות והולכות - גם במלחמה הנוכחית במגפת האבולה המשתוללת באפריקה, שכבר גבתה 4,000 קורבנות.
טכנולוגיות המאפשרות ניתוח מהיר של מידע מאפשרות למפות בזמן אמת מהיכן מגיעים דיווחים חדשים על המחלה ולפענח מאופן ההתפשטות של המחלה - מספר הנדבקים, קצב ההידבקות והצפיפות - היכן יש סיכון שהמחלה תהפוך למגפה והיכן מדובר רק במקרים בודדים.
היכולת למפות מגפות באפריקה עברה שדרוג משמעותי עם החדירה המאסיבית של טלפונים סלולריים למדינה. היבשת ממש דילגה דור מבחינת הטכנולוגיה, ואף שלמעטים מאוד היה מחשב אישי או אפילו טלפון קווי, בגלל הקושי לפרוש תשתיות בכל כפר קטן, היום כמעט לכולם יש מכשיר סלולר שלכל הפחות מעביר הודעות טקסט, ואת המידע הזה אפשר לכרות.
אבל עוד לפני כריית המידע הטקסטואלי, ניתן להפיק תובנות מספירת השיחות המתקבלות במחלקות הרלוונטיות בבתי החולים ובקוי העזרה הייעודיים באזורים השונים. כך, מכריית מידע מ-150,000 טלפונים, נבנתה מפה של צירי התנועה הקלאסיים של אוכלוסייה באזור, וברגע שהמגפה מתחילה להתפשט ניתן לראות להיכן היא צפויה להגיע בימים הבאים ולתכנן להיכן להביא כוחות סיוע או היכן להטיל מגבלות תנועה.
כמו בתחומים אחרים, גם כאן כריית המידע מחליפה את שיטות הדגימה בשטח, המבוצעות באמצעות סקרים ושאלונים שנכתבים עט ולעתים לא יגיעו לעולם למחשב - עד שתושיב מישהו לקודד את כל הנתונים, הם כבר יהיו לא רלוונטיים.
ככל שמקורות המידע מגוונים ועשירים יותר, אפשר לעשות בהם דברים מתוחכמים יותר. חיבור של מידע ממקורות שונים - טלפוניה, טקס, רשתות חברתיות ומידע מבוסס תנועה - מאפשר לשים לב לסימני המחלה המדווחים על ידי חולים לחבריהם ברשת לפני שהם בכלל אובחנו; לראות באילו אזורים פועלים על פי הכללים למניעת הדבקה ובאילו מקומות כדאי לצאת בקמפיין נוסף.
ניסיונות אחרים לנבא מגיפות כבר הוכיחו את יתרונות הביג דאטה. בשנה שעברה לדוגמה זוהו מוקדי מגפת השפעת בעולם המערבי, חודשיים לפני שהתקבל מידע רשמי.
כך, בעוד הגלובליזציה מקילה את התפשטות המגפות, לפחות הגלובליזציה המקוונת שלנו נותנת לנו כלים לעקוב אחרי התפתחותן ולהילחם בהן באופן יעיל יותר.
ביג דאטה