מהפכת הביג דאטה שמובילה שינויים בתעשיות שונות, מגיעה גם אל העולם האקדמי. הסטארט-אפ ביקונקיור (BeaconCure) הוקם לפני כשנה וחצי על בסיס שילוב בין טכנולוגיות מידע וביואינפורמטיקה. את החברה הקימו אנשי ההיי-טק יורן בר ואילן כרמלי אשר עסקו לפני כן בטכנולוגיות בתחום הפרסום והחינוך. מי שמשקיע בחברה הוא נועם שטרן-פרי, אחד מבעלי המניות של חברת האלגו טריידינג פיינל. לחברה שלוש מטרות: לעזור לחוקרים לאתר בקלות מאמרים והצעות למענקי מחקר רלוונטיים לתחומם; להבדיל בין מאמרים שהם 'מדע טוב' ו'מדע רע' ובעתיד גם לפתח אלגוריתם "מדען", כזו שיודע לפתח השערת מחקר ולבדוק אותה ממש בעצמו.
"יצאנו לדרך עם ברכתו של נועם", מספר בר, "החלטנו לבדוק האם יש דרך שיש לה מודל עסקי, אשר יכולה לסייע במחקר בתחום של מחלות נדירות. התחלנו לבדוק כיצד מקימים חברות וקרנות השקעה בתחום המחלות הנדירות, אבל בהדרגה הבנו שעם כל הכבוד, זה לא העולם שלנו. בתחום הזה דרושות קרנות מאוד גדולות ועשירות ומומחיות מאוד גדולה".
איך בכל זאת אפשר להשתמש בידע שנצבר באופטימיזציה של פרסומות ולהמיר אותו לתחום הרפואה? בר וכרמלי לא ויתרו והחליטו לפתח מנוע חיפוש שיבצע כריית מידע ממחקרים בעולם הרפואי. "היום, הנגישות למידע מחקרי ממדעי החיים היא משהו שנחשב לבלתי אפשרי עד אפשרי אבל מאוד יקר. גם אם יש לך כסף לרכוש גישה לכל המאמרים ולהשתמש במנועי החיפוש הקיימים כמו תומסון רויטרס או גוגל סקולר (Scholar), סביר להניח שתקבלי 5,000 תוצאות שלא תוכלי לתעדף ביניהן או אפס. במקביל יש חוקרים רבים שעובדים באותו זמן על אותו התחום, ולא נפגשים. אף אחר לא יודע לא איפה להשיג מימון ולא מה מצבם של המתחרים שלו. אפילו חברות המסחור באוניברסיטאות לא תמיד יודעות מה יש אצלן בבית".
בר מוסיף כי: "החוקרים מבלים מחצית מזמנם בחיפוש כסף. הם כל היום עוברים על ניוזלטרים שרוב המענקים בהם בכלל לא מתאימים להם".
בינתיים הולכת ותופחת בעיה חדשה - בעיית השחזור, שזכתה גם לכינוי "משבר השחזור" (Crisis of reproducability). זוהי דרך מנומסת לומר כי ניסויים רבים מניבים תוצאות טובות רק במעבדתו של החוקר המקורי שערך אותם, אך לא בעולם האמיתי. "אם חוקר באוניברסיטה או חברת ביוטק קטנה רוצה לדעת אם ניסויים נוספים תומכים בהשערות המחקריות שלה, היא רוצה לדעת שאלה היו ניסויים טובים וברי שחזור".
לזהות העתקה או גניבה
הברירה בין ניסויים ברי שחזור לבין ניסויים "רעים" היא היום עניין פופולרי שתפס למשל את תשומת ליבו של המיליארדר הצעיר ג'ון ארנולד, שעשה את הונו בחברת אנרון, אך שמו לא נקשר לשערוריות שהפילו את החברה. ארנולד ואשתו לורה הקימו קרן שתפקידה לתמוך בטכנולוגיות שנועדו להפוך את המדע למדויק יותר ומוטה פחות. הם תומכים למשל במערכת שבה חוקרים יכולים לרשום את כל ההשערות והניסויים אליהם הם יוצאים - כדי שיהיה להם קשה יותר לסובב, לבשל או להעלים את התוצאות מאוחר יותר. גם מארק צוקרברג הביע עניין בנושא, במסגרת הקרן שהקים יחד עם אשתו פרסיליה צ'ן, למלחמה במחלות נדירות.
המערכת של ביקונקיור משלבת את שתי היכולות הללו: היא מאתרת עבור חוקרים באקדמיה ובתעשייה מידע על מחקרים, מענקים ומתחרים רלוונטיים. כמו כן המערכת כוללת אלגוריתם שנועד להצביע על מחקרים חשודים, לעומת מחקרים כשרים. "הפרמטרים שקל לבחון הם מיהו החוקר, מה הוא פרסם בעבר, האם עבד עם צוות או לבד, באילו חומרים השתמש והאם הגיוני להשתמש בחומרים האלה, כמה זמן זה לקח לו. לפעמים אפשר לזהות שהייתה כאן העתקה, גניבה, או משהו לא הגיוני. מאידך, השתמשנו במודלים מעולם הפרסום כדי לגלות כי מחקר X שעשה אדם א', בעצם הניב תוצאות שמכוונות לאותו הכיוון כמו מחקר Y שעשה אדם ב', ולכן יש סיכוי ששניהם הולכים בכיוון נכון, גם אם מה שהם אומרים חדש למדע לחלוטין או סותר הסכמות קודמות".
כיום הדרך המקובלת בעולם המדעי לשפוט את איכותו של מאמר, היא כמות האזכורים הנוספים שהוא מקבל כביבליוגרפיה של מאמרים שמתפרסמים אחריו. התפיסה היא שכפי שכל תחום המדע מבוסס על ביקורת עמיתים, כך גם החשיבות והאיכות הכללית של מאמר, יכולה להיקבע על ידי הידע המצטבר של חוקרים אחרים מאותו התחום. אם הם 'מריחים' שחוקר מסוים אינו אמין או שמסקנותיו מאוד לא סבירות, הוא לא יצוטט.
אולם לדעת בר וכרמלי, זה לא מספיק. "חוכמת ההמונים היא נושא חמקמק, חרב פיפיות", אומר בר, "לפעמים מאמרים מאוזכרים דווקא על דרך הוויכוח, או שישנה תופעת עדר סביב מאמר מסוים שאיננה באמת מוצדקת". המערכת של ביקונקיור תיקח בחשבון את חוכמת ההמונים סביב מאמר בבואה לבחון את האיכות שלו ואת הרלוונטיות שלו עבור החוקר המחפש, אולם לא תשתמש בכך כפקטור יחיד.
בחזון של החברה, המערכת תנסה בשלב כלשהו גם להניב תובנות מדעיות באופן עצמאי. "אם אנחנו רואים שכשמישהו מחפש מולקולה B בהקשר של סרטן וכל הזמן עולים לו מאמרים שקשורים גם במולקולה C, אולי אנחנו נבין מזה שמולקולה C גם היא חשובה בתחום הזה", מסביר בר, "יכול גם להיות שהמערכת תאתר דמיון פיזי בין מולקולות מסוימות, ששני חוקרים עובדים עליהן במקביל, והקישור ביניהן יוביל אותם לתובנות חדשות לגבי מנגנון הפעולה שלהן. זה עולם שלם".
זה קצת דומה למה שעשתה קומפיוג'ן, אלא שקומפיוג'ן לא הצליחה להתפתח על בסיס מודל של מתן שירות לחוקרים והיא החליטה ליישם את הידע שלה לפיתוח מוצרים באופן עצמאי.
"עובדים אצלנו באמת שני מומחים לשעבר מקומפיוג'ן שהזהירו אותנו מהתהליך הזה, ואנחנו טרם החלטנו אם אמנם נציע ללקוחות שלנו שירות בלבד, או שגם נדרוש תמלוגים מן המוצר הסופי שלהם, במקומות בהם התרומה שלנו גבוהה. במקרה של התמלוגים, השמיים הם הגבול מבחינת ההכנסות הפוטנציאליות".
"נחזור ללקוח עם פתרון"
בר: "חשוב להבין שהמערכת שלנו היא לא מערכת אוטומטית מלאה שיושבת אצל הלקוח. אנחנו יושבים עם הלקוח, מבינים את הצורך שלו, ומייצרים את החיפוש שמוזן לתוך המנוע שלנו, שבנוי על אלגוריתמיקה ייחודית אבל גם על נתונים קליניים שחלקם נמצאים רק אצלנו. אנחנו נחזור אל הלקוח עם פתרון, ולא עם תוצאות חיפוש רבות. נניח, חברת מסחור טכנולוגיות של אחת האוניברסיטאות ביקשה מאיתנו לחפש עבורה בתוך האוניברסיטה שלה את כל המחקרים בתחום מסוים לפני שהם מתפרסמים ואת כל החברות בעולם שעובדות על אותו התחום ויכולות להתעניין במחקרים אלה. לא הבאנו להם תוצאות חיפוש, אלא תשובות".
- אתם יחסית מבוזרים מבחינת סוג הפתרונות ומבחינת הלקוחות.
"אנחנו בתהליך של פיתוח ועוד לא החלטנו בדיוק במה נתמחה. כל אחד מהעולמות שתיארנו לעיל - חיפוש מתחרים, תובנות מדעיות ואפילו חיפוש גראנטים, הוא עולם בפני עצמו. אנחנו יודעים שנעסוק בכל התחומים האלה כי רוחב היריעה נחוץ כדי שהאלגוריתם שלנו באמת יהיה טוב. באיזה מן הנתיבים נרוץ הכי מהר והכי עמוק? את זה אנחנו עדיין לא יודעים". עד היום הריצה החברה 20 פרויקטים, לדברי בר - ללקוחות מרוצים. "ברגע שהאלגוריתם יהיה גמור, הלקוחות יוכלו לשפוט סופית אם אנחנו מציעים להם ערך אמיתי, או לא. עד אז אנחנו מאוד זהירים".
Beaconcure
שנת הקמה: 2015
תחום פעילות: מערכת כריית מידע ממאמרים מדעיים
מנכ"ל: יורן בר
גיוסי הון: מיליוני דולרים בודדים
משקיעים: נועם שטרן פרי
לתשומת לבכם: מערכת גלובס חותרת לשיח מגוון, ענייני ומכבד בהתאם ל
קוד האתי
המופיע
בדו"ח האמון
לפיו אנו פועלים. ביטויי אלימות, גזענות, הסתה או כל שיח בלתי הולם אחר מסוננים בצורה
אוטומטית ולא יפורסמו באתר.