בדיוק כשנדמה שהבינה המלאכותית בדרך לשנות את העולם, ניצב בפניה איום משמעותי

אתרים כמו רדיט ואמנים כמו שרה סילברמן, מרגרט אטווד וג'יימס פטרסון מתאגדים כעת מול ענקיות הבינה המלאכותית ● הטענה: יצירותיהם, שנמצאות ברשת, משמשות את החברות באימון מודלי ה-AI שלהן - ללא רשותם ובלי שקיבלו תשלום על כך ● האם ניצחון שלהם במלחמה יכול להסיג את התחום שנים לאחור? ● כתבות מעוררות השראה ממיטב עיתוני העולם, פרויקט מיוחד  

דיפה סית'הראמאן וקיץ' הייגיThe Wall Street Journal | 23.09.2023

מימין לשמאל: שרה סילברמן, מרגרט אטווד וג'יימס פטרסון. המשוואה משתנה? / צילום: AP - Taylor Jewell, רויטרס - Alberto Cristofari/Contasto

מימין לשמאל: שרה סילברמן, מרגרט אטווד וג'יימס פטרסון. המשוואה משתנה? / צילום: AP - Taylor Jewell, רויטרס - Alberto Cristofari/Contasto

אודות הפרויקט "בחזית ה-AI"

כולם מדברים על בינה מלאכותית, אבל כמה מאתנו באמת אימצו אותה לחייהם? בשבועות האחרונים יצאנו למסע בין כמה מהמוחות החריפים והמובילים בתחום, וביקשנו מהם לסייע לנו להרים את מכסה המנוע של הטכנולוגיה המהפכנית.

אנחנו שמחים להגיש לכם מסע בן עשרה פרקים אל רזי ה-AI, שבו נחקור את התופעה ובעיקר נמפה את ההיבטים היישומיים שלה. בכל שבוע נביא לכם פרק שעומד בפני עצמו, אך יש משמעות גדולה גם לאפקט המצטבר. בואו, יוצאים לדרך. 

אמל"ק

מהפכת הבינה המלאכותית כבר יוצאת משליטה, ואפילו בנימין נתניהו ואילון מאסק מצאו עצמם השבוע מפטפטים על הנושא מול מיליוני צופים. אך מאחורי הקלעים, ככל שהמהפכה מתקדמת, צפות גם הבעיות, הביקורות והתלונות. אחת מהן שייכת לסופרים ולאומנים שהבינו לאחרונה שהחברות מסתמכות על המידע הרב שקיים באינטרנט על מנת "לאמן" את המערכות שלהן. כעת נראה כי הקרקע מוכנה למלחמה סביב השאלה האם ואיך הם צריכים פיצוי. באיזו חופשיות צריך לאפשר לחברות גדולות לעשות שימוש במידע, כיצד ישורטטו הגבולות והאם המשוואה העסקית החדשה עדיין תהיה משתלמת עבור מפתחי הבינה המלאכותית? השאלות שמסעירות את עולם ה-AI

בדיוק כשנראה שהבינה המלאכותית בדרך לשנות את הכלכלה העולמית, ניצב בפניה איום משמעותי: בחודשים האחרונים סופרים, אמנים וכותבי יצירות אחרות מתחילים להבין שהבינה המלאכותית היוצרת בנויה בחלקה על הגב שלהם.

לאורך השנים חברות בינה מלאכותית, כולל OpenAI, בנו מערכות באמצעות קיבוץ של מידע מהאינטרנט והזנתו לאלגוריתמים מאמנים שמלמדים את המערכות לחקות דיבור אנושי. כעת נראה כי הקרקע מוכנה למלחמה סביב השאלה אם ואיך יוצרי תוכן צריכים לקבל פיצוי.

עוד בסדרהלכל הכתבות

הצג עוד

ביולי האחרון אלפי מחברים, כולל הסופרים מרגרט אטווד וג'יימס פטרסון, חתמו על מכתב פתוח שדרש מחברות הבינה המלאכותית המובילות לקבל רשות מסופרים על השימוש ביצירותיהם לאימון מודלים של AI - ולשלם להם. הקומיקאית שרה סילברמן ומחברים אחרים גם הגישו תביעות נגד OpenAI ונגד מטא על שלכאורה הכשירו את מנועי ה־AI שלהן על עותקים לא חוקיים של הספרים שלהם שאנשים הורידו והותירו במקומות שונים באינטרנט.

מו"לים של חדשות אמרו שהשימוש ללא אישור בתוכן שלהם הוא הפרת זכויות יוצרים. חלקם, כולל המו"ל של החברה־האם של הוול סטריט ג'ורנל ניוז קורפ, ערכו דיונים עם חברות טכנולוגיה בשאלה כיצד הן עשויות לקבל תשלום על השימוש בתוכן שלהן בהכשרת מנועי AI.

בתוך כך AP ו־OpenAI הכריזו החודש על הסכם שלפיו חברת הטכנולוגיה תקבל גישה לסיפורי AP מהארכיון. נוסף על כך, אתר המדיה החברתית רדיט החל לדרוש תשלום על חלק מהגישה לתוכן שלו. אילון מאסק ציין את העובדה שחברות AI מגרדות "כמויות עצומות של דאטה" כמניע להחלטה שקיבלה לאחרונה X, שאז עוד נקראה טוויטר, להגביל את הגישה לכמות הציוצים שחלק מהמשתמשים יכולים לצפות בהם. כמו כן, שחקנים ותסריטאים ציינו חששות שאולפנים בהוליווד עלולים להשתמש ב־AI כדי להעתיק את המראה שלהם או לתפוס את מקומות העבודה שלהם.

"איך החברות יפנו לכל סופר וסופר?"

המתחים המסלימים משקפים חשיבה מחודשת נרחבת יותר על ערך הכתיבה והתוכן המקוון, ועד כמה צריך לאפשר לחברות גדולות לסרוק אותו. פטרסון, אחד הסופרים הפופולריים ביותר בארה"ב, אמר שהרעיון שהשתמשו בכל ספריו - יותר מ־200 - ללא רשותו כדי לאמן תוכנות AI "מפחיד" בעיניו. "זה לא ייגמר טוב לאנשים יצירתיים", אמר בראיון.

ספרים הם אמנם חלק משמעותי מדאטת האימונים למודלים של בינה מלאכותית, אבל החברות לא חשפו את כל הכותרים שמערכות ה־AI שלהן עשו בהן שימוש. חלק מהסופרים חושדים שהשתמשו ביצירות שלהם בין היתר משום שהמודלים יכולים באופן מדויק לשחזר קטעים שלמים מפרקים שונים. התלונות שהגישו סילברמן וסופרים אחרים טוענות שהחברות אימנו את המערכות על "ספריות צללים" לא חוקיות, הכוללות גם ספרים שחלים עליהם זכויות יוצרים.

ב־OpenAI ובגוגל אמרו שהחברות מכשירות את המודלים על מידע ש"זמין לציבור" - משפט שלדעת מומחים כולל טווח רחב של תוכן, כולל מאתרים פיראטיים ואתרים הנמצאים מאחורי חומות תשלום. ב־OpenAI גם אמרו שהחברה מכבדת את הזכויות של היוצרים והסופרים, ושהרבה בעלי מקצוע יצירתיים משתמשים ב־ChatGPT.

אך במבט רחב, לסכסוכים האלה יש פוטנציאל לקבוע גבולות חדשים או להוסיף עלויות משמעותיות לגישה לדאטה באופן שישנה רדיקלית את המשוואה העסקית מבחינת כלי ה־AI החדשים האלה.

התביעות עלולות להכריח חברות להבנות את כל נושא הרישוי בנוהלי איסוף מידע בעתיד, או לדרוש תשלום בדיעבד על חומר מוגן זכויות יוצרים ששימש להכשרת המודלים של החברות. גם בתי המשפט עלולים לדרוש מחיקה של מודלים שנבנו על סמך דאטה מוגנת, מה שעלול להסיג את תחום ה־AI לאחור שנים רבות.

מגבלות על הדאטה אף יאתגרו את הקלות שבה חברות AI יכולות לבנות גרסאות עתידיות של מודלי השפה שלהן. "המקרים חדשים ועוסקים בשאלות של קנה מידה שלא ראינו בעבר", אמר מהטאב חאן, עמית מחקר בפרויקט חברת האינפורמציה של בית הספר ייל למשפטים, פרויקט המתמקד במחקר חקיקה ומדיניות הקשורה למדיניות מידע. "השאלה נעשית פרקטית - איך החברות יפנו לכל סופר וסופר?".

חשש שהמערכות יחליפו תסריטאים ועיתונאים

ההשקה של ChatGPT בנובמבר, עם התמהיל של שימושים פרקטיים ויכולת משעשעת לכתוב תסריט בסגנון וודי אלן, גרמה להתפוצצות של ההתעניינות בכלי AI ומרוץ חימוש בין החברות השונות.

כוחם של צ'טבוטים נובע ממערכות AI המכונות "מודל שפה גדול" - חברות יכולות להוציא עשרות מיליוני דולרים או יותר כדי להכשיר כמה מהמודלים הגדולים ביותר. זאת באמצעות שימוש בדאטה שאספו תוכנות אוטומטיות ששואבות מאתרים ברחבי האינטרנט.

תומכי AI טוענים שגישה חופשית למידע חיונית עבור טכנולוגיה שלומדת באופן דומה לבני אדם ושיש לה פוטנציאל עצום מעבר לסיוע במקום העבודה. "אם בן אדם יכול לגשת בחופשיות וללמוד מהמידע באינטרנט, הייתי רוצה לראות שלמערכת AI יהיה מותר לעשות אותו דבר. אני מאמין שזה ייטיב עם החברה", אמר אנדרו אנג, שמשקיע בחברות בתחום ומנהל מעבדת מחקר AI באוניברסיטת סטנפורד.

נוסף לזכויות יוצרים ישנו חשש גובר שמערכות בינה מלאכותית עלולות להחליף תסריטאים, עיתונאים או סופרים, שכבר היום עושים פחות כסף ביצירת התכנים. אלא שמפתחי AI טוענים מצדם שבעוד הטכנולוגיה עלולה לפגוע במקצועות מסוימים, היא גם תיצור סוגים חדשים של משרות.

המכתב הפתוח ששלחה ביולי האחרון אגודת הסופרים פנה למנכ"לים בחברות טכנולוגיה לדיון בתשלום אפשרי על אימוני מודלים שכבר נעשו ועל עסקאות רישוי עם סופרים שישלמו להם. מרי רייזנברגר, מנכ"לית האגודה, אמרה שהשיחות היו פרודוקטיביות אך נחוצה השתתפות של כל חברות ה־AI. רייזנברגר אומרת שהנושא יימשך משום שהחברות צריכות יותר ויותר מידע כדי לקדם את כלי ה־AI שלהן. המודלים שבנו "אפילו לא הולכים לעבוד בעתיד, אלא אם כל הזמן יקבלו חומר טרי".

"לא יכולות לרושש אמנים בלי להתרושש בעצמן"

צריך לומר שהתלונות והתביעות מהחודשים האחרונים מבוססות על אתגרים משפטיים שהיו בעבר לבינה המלאכותית, שייצרה תמונות וקוד מחשב. בנובמבר, למשל, הוגשה תביעה ייצוגית נגד OpenAI ומיקרוסופט. בתביעה נטען ש־GitHub Copilot, כלי AI יוצר שמתכנתים משתמשים בו, הפר רישיונות של תוכנות קוד פתוח באמצעות שכפול קטעי קוד ברישיון מבלי לתת על כך קרדיט.

תביעות ייצוגיות אחרות הוגשו בנפרד גם נגד OpenAI, מיקרוסופט וגוגל בשם משתמשי אינטרנט. הם טענו כי המנהג של החברות לגרד אתרים להכשרת המודלים שלהן מפר את זכויות המשתמשים לפרטיות וקופי.

ב־OpenAI לא חשפו הרבה לגבי הדאטה המשמשת לאימון מודל השפה האחרון שלה, GPT-4, וציינו סיבות של תחרותיות. ניירות המחקר המקדימים של החברה מראים שגרסאות קודמות של מודל ה־GPT הזה הוכשרו בין היתר על עמודי ויקיפדיה באנגלית ועל דאטה שליקטה עמותה ששמה Common Crawl.

באפריל רדיט, מקור דאטה מרכזי ל־OpenAI ואחרות הבונות מודלים גדולים של שפה, הכריזה שתתחיל לדרוש תשלום על גישה ישירה לדאטה בקנה מידה גדול. מערכות ה־AI "תלויות לחלוטין בדאטה איכותית, שנעשתה בידי בני אדם, ואם השוק הזה יקרוס, גם המערכות שלהן יקרסו", אמר מת'יו באטריק, עורך דין המייצג את שרה סילברמן וכמה אחרים התובעים חברות טכנולוגיה על השימוש בתוכן שלהם לאימון AI גנרטיבי. "הן לא יכולות לרושש אמנים בלי לרושש גם את עצמן".

הכתבה פורסמה במקור בחודש יולי בוול סטריט ג'ורנל.

צרו איתנו קשר *5988