כיצד ניתן לרתום את ההתפתחות המואצת במחקר ופיתוח תחום הבינה המלאכותית ומדע הנתונים להבנת תחום המשפט הארכאי? בפקולטה למשפטים באוניברסיטת בר-אילן מנסים לענות על השאלה המסקרנת, באמצעות פתיחתה לאחרונה של "המעבדה למשפט, מדע הנתונים ואתיקה דיגיטלית" - מרכז "ביג דאטה" למחקר התחום המשפטי, הראשון מסוגו בישראל.
המעבדה שהוקמה עוסקת באינטרקציה שבין המשפט ומדע הנתונים. שתי המטרות העיקריות שלה הם להעמיק את המחקר האמפירי-משפטי מבוסס נתונים, המשתמש במתודות, כגון למידת מכונה, עיבוד שפה טבעית, ניתוח רשתות חברתיות ושיטות נוספות; ולא פחות חשוב מכך, להתמקד גם בניתוח נורמטיבי ואתי של ההיבטים המשפטיים והרגולטוריים של ביג-דאטה, דאטה אנליטיקס, בינה מלאכותית ויישומים טכנולגיים אחרים.
את המעבדה מנהלים ד"ר איתי בר סימן טוב, ראש המעבדה ומרצה בכיר בפקולטה למשפטים של אוניברסיטת בר-אילן, וד"ר איילת סלע, מרצה למשפט וטכנולוגיה בפקולטה למשפטים באוניברסיטת בר-אילן.
בראיון בלעדי ל"גלובס", מספר ד"ר סימן טוב על המעבדה, המחקרים שכבר ערך בתחום, וההתפתחויות העצומות שעוד צפויות להעסיק אותו בשנים הקרובות.
אפקט בג"ץ
לדברי ד"ר בר סימן טוב, "בשנים האחרונות נכנסה אוניברסיטת בר-אילן מאוד חזק לתחום ה- Data Science ("מדע הנתונים"). אחת מהמטרות שלנו היא לחבר חוקרים מתחום מדע הנתונים עם חוקרים מדיסציפלינות אחרות. אחת מהדיסציפלינות האחרות היא זו של הפקולטה למשפטים, ולמעשה זו היא הפקולטה המובילה כיום בחיבור עם מדע הנתונים או Artificial intelligence ("בינה מלאכותית")".
מה כבר הספקתם לעשות במעבדה בהקשר של חיבור בין משפט למדע הנתונים או בינה מלאכותית?
"התחלנו לעשות שימוש בכלים של מדע הנתונים או של בינה מלאכותית כדי לבצע מחקר משפטי (כלומר, מחקר שתכליתו לבדוק מהו המצב המשפטי ביחס לסוגיה מסוימת, מ' ב'). הדיקן של הפקולטה, פרופ' אורן פרז, כבר פרסם כמה מחקרים שחשפו כל מיני התנהגויות שנוגעות למשפט. באמצעות מודלים מתמטיים של ניתוח רשתות שעוזרים להבין קשר בין גורמים, הוא ראה, למשל, שכתבי עט אמריקאיים מובילים מצטטים כמעט אך ורק את עצמם, ופועלים במעין סוג של קרטל. כיוון אחר שנבדק, הוא האופן שבו חברות שונות עובדות עם קודים וולנטריים של הגנה על איכות סביבה.
במחקרים שאני ערכתי השתמשתי במתודולוגיות אחרות, והתמקדתי בעיקר בניתוח ממוחשב של טקסטים. סוגיה מרכזית שאני עוסק בה היא ניתוח של דיונים בוועדות הכנסת באמצעים ממוחשבים, על-מנת לענות על שאלות חוקתיות. במחקר אחד, למשל, בדקתי האם ועד כמה ביקורת שיפוטית, והאפשרות שבית המשפט יתערב ויבטל חוקים של הכנסת, משפיעה על המחוקקים. התשובה היא שיש אינדיקציות מרתקות שמלמדות שהביקורת השיפוטית של בית המשפט אכן משפיעה על חברי הכנסת".
כלומר, לפי המחקר שערכת - לפני שמחוקקים נוקטים עמדה בסוגיה חקיקתית כלשהי, הם פוזלים לעבר בית המשפט והביקורת הצפויה שלו?
"כן. ניקח לדוגמה אחד מהמחקרים המרכזיים שערכתי, בקשר לחוק ההסדרים (מעשה חקיקה אחד שמאגד בתוכו עשרות ולעתים מאות דברי חקיקה, שמועבר בכנסת כמקשה אחת יחד עם ההצבעה על תקציב המדינה, מ' ב'). במשך הרבה מאוד שנים נשמעו קולות שלפיהם מדובר בהליך חקיקה פגום ולא דמוקרטי, אבל המשיכו לעשות בו שימוש מאוד נרחב, מתוך ההנחה שהוא לא מפר שום כלל בתקנון הכנסת. ואז הגיע פסק הדין בעניין 'ארגון מגדלי העופות', שקבע שיש בעיה גדולה עם חוק ההסדרים מבחינה משפטית: בית המשפט פיתח דוקטרינה משפטית חדשה שתאפשר לו להתערב בעתיד בחוק ההסדרים. בימה"ש העביר מסר לכנסת שעליה למתן את השימוש הנרחב בחוק ההסדרים.
"אני בדקתי אם המחוקק שינה את ההתנהלות שלו בעקבות פסק דין 'ארגון מגדלי העופות'. כדי לבחון את זה, צריך לעבור על הדברים שאמרו ח"כים בדיונים בוועדות הכנסת לקראת חקיקת חוק ההסדרים. לכאורה, אפשר לעשות את זה באמצעים אנושיים, אבל במקרה הזה מדובר במאגר נתונים עצום - מעל 400 פרוטוקולים המשתרעים על-פני 12 אלף עמודים. ברור שזה בלתי אפשרי לעבור על זה בעין אנושית בזמן סביר. ומכאן הגענו לאתגר שלנו - ללמד מחשב לנתח את הטקסטים האלה ולזהות את ההשפעות של ביקורת שיפוטית בהם.
"ביצענו את המחקר באמצעות Machine Learning ("למידת מכונה"). בהתחלה, נתנו למקודדים אנושיים לקודד 26 מתוך ה-400 פרוטוקולים בצורה ידנית. הם עברו על 220 אלף מילים, וממש קראו מילה במילה. ואז הגיע השלב שבו אנחנו מלמדים את המחשב - הזנו לקוד מה מהווה אינדיקציה להשפעה של הביקורת השיפוטית על המחוקקים, ומה לא מהווה. ברור שרוב האמירות שנאמרות בדיונים האלה בכלל לא רלוונטיות לסוגיה שבדקנו, ולכן החוכמה הייתה להזין למחשב גם דוגמאות שמראות לו מה הטקסט הרלוונטי מתוכו צריך לאתר את ההשפעה".
ומה היו המסקנות?
"גילינו שמדובר במשימה מאוד קשה למחשב לנתח את הטקסטים ברמת דיוק של אדם, אבל כן הגענו לרמה כזאת שאיפשרה לנו לצמצם את כמות הטקסטים שמצריכים ניתוח אנושי לכ-260 קטעים קצרים.
"הממצאים החשובים שקיבלנו רק ממחישים כמה חשוב לעשות שימוש במדע הנתונים בהקשר של משפט, כי אחרת לא היינו מצליחים לעלות המסקנה הברורה והחשובה שקיבלנו: מצאנו עושר אדיר של ביטויים שמלמדים כי חברי הכנסת מושפעים ומודעים לפסק הדין, ובחלק מהמקרים אף מורתעים ממנו".
אספקט הרתעתי
לדברי ד"ר בר סימן טוב, הוא זיהה שני סוגי השפעה שונים של פסק דין "ארגון מגדלי העופות" על חברי הכנסת. "האספקט השכנועי: חברי כנסת שממש מצטטים מפסק הדין בעניין 'ארגון מגדלי העופות', ומשתמשים בכך כטיעון לצמצום את חוק ההסדרים; והאספקט ההרתעתי: אמירות מפורשות, למשל של ח"כ גדעון סער, שלפיהם חברי הכנסת צופים ביקורת שיפוטית עתידית, ולכן צריכים לשנות את ההתנהגות אם לא רוצים שבית המשפט יתערב בפעם הבאה", הוא אומר.
"חשוב להדגיש מסקנה נוספת מהמחקר - אלה לא רק יועצים משפטיים, או חבר כנסת מהאופוזיציה; מצאתי שחקני מפתח של ממש, כמו יו"ר הוועדה ויו"ר הקואליציה, שהושפעו מפסק הדין. מדובר באמירות חזקות ומפורשות, בסגנון של 'אם לא נעשה כך וכך, זה יגיע שוב לבג"ץ והוא יתערב'.
"עוד נתון מעניין שמצאנו, הוא שבשנים הראשונות אחרי 'ארגון מגדלי העופות' ניכרה השפעה מאוד גדולה, ואז ההשפעה הלכה ודעכה, עד בג"ץ 'דירה שלישית' (בג"ץ ביטל ב-2017 את הסעיף בחוק ההסדרים למיסוי דירה שלישית בנימוק שבהליך החקיקה נפל פגם מהותי שפגע בזכות ההשתתפות של חברי ועדת הכספים בכנסת בהליך החקיקה - מ' ב'), שהקפיץ שוב את ההשפעה המרתיעה".
הגנה על הפרטיות
ד"ר בר סימן טוב מציין כי מעבר לשימוש בטכנולוגיה למחקר משפטי, ניתן לקחת את הכלים הטכנולוגיים שלב נוסף, ולסייע לפתור בעיות משפטיות שבהן אנו נתקלים בחיי היומיום. "היה לנו מחקר שבמסגרתו ניתחנו את התנאים והמדיניות של השימוש של אפליקציות בסלולר", הוא מפרט. "זה מאוד חשוב, כי כולנו מורדים כל הזמן אפליקציות כשכל אחת מהן מגיעה יחד עם מסמך משפטי, שגם בית המשפט קבעו במספר הזדמנויות שיש לו תוקף משפטי. אבל בפועל, אף אחד לא קורא את תנאי השימוש ומדיניות הפרטיות וכולם מאשרים אותם אוטומטית. זו באמת משימה כמעט בלתי אפשרית לקרוא את המסמכים האלה: הם גם מאוד ארוכים, וגם כתובים בשפה משפטית סבוכה. היה פעם מחקר שמצא שכדי לקרוא את כל תנאי השימוש באפליקציות צריך להשקיע כשליש מהיום.
"אנחנו יודעים בוודאות שלא קוראים את תנאי השימוש, כי עשו המון ניסויים שהגיעו למסקנה הזאת: הכניסו כל מיני תניות מצחיקות ועדיין אנשים חתמו על ההסכם. למשל, ככה לא מעט אנשים התחייבו לנקות שירותים ציבוריים. מכאן, שיש בעיה גדולה: מצד אחד כולנו מאשרים מסמך משפטי עם משמעויות אמיתיות, ומצד שני אנחנו לא קוראים אותו בכלל".
ומהי הסכנה?
"ההשפעות של זה יכולות להיות עצומות. היום כבר מבינים שזה לא רק שאנחנו נותנים הסכמה לדברים שפוגעים לנו בפרטיות כשאנחנו מאשרים תנאי שימוש של אפליקציות, אלא שאנחנו בחלק גדול מהמקרים ממש מאשרים לאסוף עלינו מידע כל הזמן.
"בחלק מהמקרים המשתמשים נדרשים לאשר שכל הודעה ששלחת תיקרא על-ידי האפליקציה, אתה מאשר לה להקליט אותך גם כשאתה לא מדבר בטלפון, לנטר כל עמוד שגלשת בו, לאכן אותך ועוד. החשש הגדול שלנו הוא שגם חברות וגם ממשלות זרות אוספות עלינו מידע, כמו שקורה עם עם אפליקתית 'טיק טוק' והסינים, והן אוגרות אצלן כמויות אדירות של מידע. במקביל, מתפתחים הכלים שיכולים לעשות שימוש במידע האדיר הזה, וכבר ראינו הדגמות לכלים שיכולים לספק תובנות מדויקות על משתמשים אפילו יותר ממה שחברים קרובים יודעים.
"ולמרות הסכנות הגדולות, ההתמודדות שלנו היום עם זה במישור המשפטי מאוד מוגבלת. בהקשר הזה החלטנו לפתח כלים מבוססים בינה מלאכותית ושיוצאים מתוך מדע הנתונים, ולהתמודד עם הסכנה. אחד משני פרויקטים שעשינו בתחום, ד"ר איילת סלע ואלון זינגר מהפקולטה למשפטים, פרופ' דוד סרנה ויהונתן שלר ממדעי המחשב, ואני, זה לבנות באמצעים טכנולוגיים Data Base ("מאגר נתונים") של כחצי מיליון אפליקציות, וגם פיתחנו כלים שתפקידם לנתח את מדיניות הפרטיות שלהן. זה משהו שברור שאתה לא יכול לעשות בכלים אנושיים".
ואיך המסקנות שהגעתם אליהן עוזרות לי בתור מי שמוריד אפליקציות?
"זה ייתן שני דברים. אחד, במישור של המשתמשים, המטרה היא לפתח כלי, אולי 'אפליקציה לאפליקציות', שיאפשר במקום לקרוא הכל להציף רק את הקטעים הספציפיים בטקסט שהמערכת מזהה כבעיתיים. אפשרות נוספת היא פשוט שהאפליקציה תסרוק את כל האפליקציות שיש בתחום מסוים, ותציג לך דירוג שלהן. למשל, נניח לאפליקציה של פנס, היא תציג סקירה ברמה של 'רמזור': דע לך שמתוך האפליקציות של הפנס שאתה יכול להוריד אלה הכי מסוכנות, אלה בסיכון בינוני, ואלה הבטוחות.
"מישור שני של השפעה נוגע לרגולטורים. אם הם מנסים לעבור על תנאי השימוש בצורה אנושית ידנית, הם יכולים לכסות רק טווח מאוד קטן. יש מיליוני אפליקציות, שגם כל הזמן משנות את תנאי השימוש שלהן. באמצעות כלים טכנולוגיים, הרגולטור יכול לאתר תניות שחשודות כלא חוקיות, ולהתמקד בהן באכיפה".
במה הולכת להתרכז המעבדה שיוצאת בימים אלה לדרך?
"המטרה שלנו היא ליצור מסה קריטית שתאפשר לנו לעסוק בשלושת הממשקים המרכזיים שבין משפט לבין מדע הנתונים ובינה מלאכותית: לשפר את יכולת המשפט להתמודד עם הסכנות והאיומים של Big Data ("נתוני עתק") ובינה מלאכותית; לשפר, ממש לעשות מהפיכה, בתחום של מחקר משפטי אמפירי; ולפתח כלים שיכולים לעזור לעורכי דין ורגולטורים.
"אנחנו רוצים לבחון מה יהיה תפקידו של עורך הדין בעתיד: האם באילו משימות המחשב יחליף אותו? ובנוסף, להשתמש באמצעים טכנולוגיים כדי לשפר ניסוח חקיקה והליכים משפטיים".
לתשומת לבכם: מערכת גלובס חותרת לשיח מגוון, ענייני ומכבד בהתאם ל
קוד האתי
המופיע
בדו"ח האמון
לפיו אנו פועלים. ביטויי אלימות, גזענות, הסתה או כל שיח בלתי הולם אחר מסוננים בצורה
אוטומטית ולא יפורסמו באתר.