מיפוי הגנום האנושי הושלם, אבל הדרך ארוכה לפענוח מלא שלו

22 שנה אחרי שהוכרז על השלמת הפרויקט הבינלאומי הענק, הוכרז החודש שוב על סיומו, עם הפענוח של 8% מהגנום שהתעלמו מהם בעבר • כבר היום מפותחות תרופות למחלות מסוימות על בסיס הפרויקט הזה, אבל נדרשים עוד מיליוני מיפויים נוספים כדי להבין איך עובד מנגנון ה-DNA המורכב • מה הושג ולאן הולכים מכאן

ריצוף גנטי של הגנום האנושי / צילום: אתר פרויקט הגנום האנושי
ריצוף גנטי של הגנום האנושי / צילום: אתר פרויקט הגנום האנושי

בשנת 2000 התבשרנו על השלמת תהליך ריצוף הגנום האנושי. והנה עברו 22 שנה, והחודש שוב התבשרנו, בגיליון מיוחד של כתב העת Science, על ההשלמה (הפעם באמת) של ריצוף גנום אנושי אחד. די הרבה השתנה מאז שנת 2000, אבל דבר אחד ברור: ריצוף של גנום אנושי אחד אינו מספיק כדי להבין באופן מלא כיצד עובד מנגנון הדנ"א. בשביל זה נצטרך כנראה ריצופים של עוד גנומים רבים.

מטרת פרויקט הגנום האנושי הייתה לקרוא את סדר האותיות שבהן כתוב גנום של אדם אחד בריא. אנחנו רחוקים עדיין מהידיעה כיצד לתרגם את השפה הזאת. "אם חייזר יפרק שעון הוא ידע ממה זה בנוי אבל לא איך זה עובד. אנחנו היום יכולים לקרוא בקלות את הקוד, אבל מבינים באופן מלא איך הוא רץ על המכונה", מסבירה פרופ' אורנה אלרואי-שטיין מבי"ס למחקר ביו-רפואי וחקר הסרטן בפקולטה למדעי החיים באוניברסיטת תל אביב. אבל כדי שנוכל אי פעם להבין בדיוק איך ה"מכונה" (כלומר, בן אנוש חי) פועלת, אנחנו צריכים קודם כול להשיג לפחות ספר אחד בו כתוב הקוד המלא. זה היה פרויקט ריצוף הגנום.

 
  

הריצוף המלא התברר כחלקי

הגנום הוא אוסף כל ה-DNA שיש לנו בתא. יש לנו 23 זוגות כרומוזומים בתא, וכל זוג דומה מאוד זה לזה, אבל לא זהה - אחד מגיע מהאם ואחד מהאב. כל כרומוזום בפני עצמו הוא למעשה סליל כפול ארוך של DNA. הסליל הכפול מורכב משתי שרשראות שמתאימות בצורה מושלמת זו לזו. כל שרשרת מורכבת מרצף של ארבעה בסיסים שונים, המסומנים באותיות A,C,G,T. כשהשרשראות הללו מקופלות ודחוסות, גודלן פחות ממאית מילימטר. 

הבסיסים הם ה"אותיות" בשפה של הגנום, שבהן כתוב ספר ההוראות שמסביר כיצד ייראה ויתנהג הגוף שלנו. הגנום נמצא בגרעין התא, ועוד קצת חומר גנטי שמגדיר אותנו נמצא במיטוכונדריה, מחוץ לגרעין, אבל כמותו זניחה בהשוואה לגנום שבגרעין. בכל תא בגוף שלנו, בין שהוא תא עצב, תא עור, כבד או כליה, ה-DNA כמעט זהה, למעט הבדלים קטנים הנובעים ממוטציות בעת חלוקת התא.

פרויקט ריצוף הגנום התחיל ב-1984, בהשקעה של כ-2.7 מיליארד דולר. בשנת 2000 הוכרז על השגת הטיוטה הראשונה של הריצוף, ובאפריל 2003 הוכרז סיומו של הפרויקט, עם השגת הריצוף השלם. במיפוי השתתפו מכוני המחקר מכל העולם, ובמקביל עבדה גם חברה פרטית, שסיימה באותו זמן ובתקציב נמוך בהרבה. בסופו של דבר, רוצף לא גנום של אדם אחד, אלא ערבובייה של כרומוזומים מאנשים שונים, אבל סך הכול רוצפו כל 23 זוגות הכרומוזומים שיש לאדם בתא.

אלא ש"השלם" לא היה שלם באמת. למעשה, רוצפו רק 92% מהגנום. אמנם כל החלקים של הגנום נקראו, אבל להרכיב אותם יחד לרצף אחד - זה כבר היה סיפור אחר. לגבי 8% מה"מילים", לא היה ברור היכן הן נמצאות ברצף הכללי. טכנולוגיות חדשות שפותחו מאז מאפשרות היום לחבר את חלקי הפאזל ולהניח את ה-8% במקומם, ולקבל סוף סוף את הרצף המלא. זה האירוע שנחגג בגיליון מיוחד של Science.

בכל זאת, עדיין חסר משהו מהותי - המיפוי של כרומוזום Y. השלמת הריצוף נעשתה לפי גנום של אישה, ולה יש שני כרומוזומי X, כך שכרומוזום Y לא מופה במאמץ הנוכחי.

כ-99.9% מהגנום האנושי הוא זהה בקרב בני אדם, ולכן למיפוי שלו יש משמעות גדולה. הוא מספר לנו מהי תוכנית המתאר לדבר הזה שקוראים לו בן אנוש. אלא שאותם אזורים קטנים שבהם יש הבדלים זעירים, לפעמים הבדל של "אות" DNA אחת, הם שהופכים כל אחד מאיתנו לכל כך שונה מאחרים, וזה בעצם מה שהכי מעניין אותנו.

התקווה הגדולה הייתה שנוכל, אם לפשט, להשוות בין גנום של אדם חולה לגנום "רגיל", וכך נגלה מיד את הגן הפגום שגרם את המחלה. באופן הזה נוכל לאבחן מחלות (אפילו כשהעובר עוד ברחם), להבין את המנגנון שלהן כדי לפתח תרופות, ואולי גם לרפא מחלות באמצעות עריכה גנטית. התקווה הזאת התבדתה.

אורנה אלרועי-שטיין / צילום: תמונה פרטית
 אורנה אלרועי-שטיין / צילום: תמונה פרטית

המחלות שהרוויחו מפרויקט הגנום

נניח שיש לנו גנום. מה עושים איתו? "כדי לחשוב על זה, אנחנו צריכים להבין שה-DNA הוא השפה של כל היצורים החיים", אומר קפלן. "אנחנו יכולים אפילו לקחת הוראות מיצור אחד ולשים אותן בחיה אחרת".

אם ריצפנו גנום אחד, כמה ממנו אנחנו מצפים לראות בדיוק באותה צורה אצל כל בני האדם?
קפלן: "אומרים שמעל 99.9%. האמת היא שאנחנו לא יודעים בדיוק, בין השאר כי רק עכשיו ריצפנו הכול, והאזור שעכשיו רוצף כנראה כולל יותר הבדלים מהאזורים האחרים.

"אנחנו מחלקים את הגנום שלנו לגנים. אפשר לומר שגן הוא כל רצף של אותיות שמקודד RNA. לפעמים ה-RNA הזה יוצר בגוף חלבון, ואז אנחנו נאמר שזה היה DNA מקודד". חלבונים הם אבני הבניין של הגוף שלנו ואמצעי התקשורת שלו. נניח, קולגן שבונה את הסחוס והעור שלנו הוא חלבון. אינסולין הוא חלבון קטן. ואלה רק כמה דוגמאות.

"האזורים בגנום שמקודדים חלבונים, הם יותר שמורים בין בני אדם מאשר אזורים לא מקודדים".

אז אם נשווה כעת בין גנום של אדם בריא לגנום של אדם לא בריא, נוכל לראות את הפגמים?
אלרואי שטיין: "אם יש פגם ב-DNA שמוביל להיווצרות RNA שלא מתקפל לא טוב, או שהחלבון מתקפל לא טוב, או שלא נוצרים מספיק RNA או חלבון, אז עלולה להיווצר מחלה, תלוי עד כמה התפקיד של אותו תוצר הוא קריטי. המחלות הגנטיות מהסוג הזה, שבהן יש פגם בתוצר בעל פעילות קריטית וברורה הן הפשוטות ביותר להבנה. לפעמים רואים בגוף ממש עודף או חסר בחלבון או חלבון לא תקין".

מחלות גנטיות נדירות כמו גושה או פברי הן מן הסוג הזה. לעומת זאת לעיתים הפגם הוא בתוצר שהחשיבות שלו מאוד משתנה בין סוגי התאים השונים וזה מקשה על ההבנה של מנגנון המחלה.

פענוח מנגנוני המחלה האלה הם ההצלחה של המחקר הגנטי. היום ישנן כבר בשוק תרופות שנועדו לסלק חלבון פגום, או להוסיף חלבון חסר. קיימות תרופות, בעיקר בניסויים קליניים, שמנסות לפעול גם ישירות על ה-DNA, כדי לפתור את הבעיה במקום היווצרה. זה אפשרי בעיקר כאשר צריך "להשתיק" DNA שמקודד חלבון מיותר.

"כדי לגלות את הגנים הבעייתיים, אנחנו לא צריכים שוב למפות את כל הגנום של החולים ולהשוות אותו במלואו לגנום הבריא. יש אזורים שאנחנו יודעים בסבירות גבוהה שהם שמורים בכל הגנומים. לכן אנחנו מחפשים את ההבדלים רק במקומות מסוימים, וזה הרבה יותר קל".

ד''ר נעם קפלן / צילום: תמונה פרטית
 ד''ר נעם קפלן / צילום: תמונה פרטית

תרשימי זרימה אינסופיים שמחכים למיפוי

אבל מכאן זה נהיה רק מסובך יותר. רק כ-1.5% מהגנום מקודד לחלבונים. המון גנים שלפני שנות ה-2000 עוד נקראו "ג'אנק DNA" מוכרים עכשיו כבעלי תפקידים רבים ושונים בגוף, כולל בקרה על רמות הביטוי של הגנים האחרים. 

לדברי אלרואי שטיין, "מדובר בתרשימי זרימה אינסופיים שאנחנו רק מתחילים למפות". דמיינו משרד ובו מעט עובדים (ה-DNA המקודד), והרבה מאוד מנהלים שהם תוצרי הגנים השונים, כפופים אלה לאלה בהיררכיה לא ברורה, אבל הם משפיעים על העבודה.  "לדוגמה, התפקיד של האחד הוא להמריץ פועל מסוים, של השני להמריץ את הממריץ, של השלישי לדכא את הממריץ ושל הרביעי לדכא באופן ישיר את הפועל הראשי - בתגובה לסיגנל מהסביבה", מסביר אלרואי שטיין. "זו דוגמה פשוטה. למעשה, הקומבינציות הרבה יותר מורכבות. אם מזהים פגם באחד הגנים הללו, קשה מאוד לדעת איך הוא משפיע על התוצאה הסופית, ועוד יותר קשה להתערב בכך בצורה מדויקת".

לא רק זאת, עם השנים התברר שרוב המחלות שלנו, אלה שמאפשרות לנו להגיע לבגרות ולא הורגות אותנו בגיל צעיר, הן מחלות המושפעות מהרבה יותר מגן אחד. למשל אם בעבר קיוו לגלות גן או כמה גנים הגורמים לאוטיזם, התברר שיש מאות ואולי אלפי גנים שמופיעים בשכיחות גבוהה יותר אצל אוטיסטים ובשכיחות נמוכה יותר אצל אנשים ללא אוטיזם, והם כנראה מניעים את המחלה. אבל מדובר רק בשכיחות. גן מסוים שקושר לאוטיזם יכול להופיע אצל אדם שכלל אינו על הרצף, ואצל אוטיסטים לאו דווקא יופיעו כל הגנים שזוהו.

כדי להבין את המנגנון של אוטיזם, נצטרך לעשות את תרשים הזרימה המלא ולהבין איך כל שינוי במאות או אלפי הגנים הקשורים לאוטיזם משפיע על ההתנהגות של כל התרשים, ואיך כל המערכת הזו מתנהגת גם בממשק עם גורמים סביבתיים, ממחלות חום וסטרס אצל האם בזמן ההיריון ועד תוכנית הטיפול שהילדים מקבלים בכיתת התקשורת.

כעת אפשר להבין מדוע מיפוי של גנום אחד, ואז השוואה של גנומים "תקולים" אליו, רחוק מלהוביל אותנו להבנת הרכיב הגנטי של אוטיזם, מחלות פסיכיאטריות, מחלות מטבוליות, אלצהיימר, פרקינסון, דלקת מפרקים, לחץ דם גבוה, סרטן, ולמעשה רוב המחלות של האנושות. זה לא אומר שאנחנו לא מנסים. בשנים האחרונות, הטכנולוגיה שמאפשרת להגיע לריצוף יחסית מדויק של חלקים גדולים מהגנום הוזלה מאוד. היום מדובר במחיר של כ-1,000 דולר לבדיקה.

המשימה הבאה: לחקור את אזורי השונות בין אנשים

"נערכים מחקרים שנקראים Genome Wide Association, שבהם משווים אלפי או אפילו מאות אלפי אזורים ב-DNA שבהם יש שונות גנטית בין בני אדם. מנסים לגלות את כל הגנים שקשורים באותה מחלה. יש לא מעט אתגרים שנותרו בדרך להבנה אמיתית של מנגנוני המחלות".

אלרואי שטיין אופטימית יותר. "פרויקט הגנום הוא ענק. רוצפו כבר חלקי גנום של מיליוני אנשים, ועוד המון בעלי חיים וצמחים. על המידע הזה עושים עבודות ביואינפורמטיקה ואלגוריתמיקה מרשימות מאוד, והטכנולוגיה כל הזמן משתפרת באופן דרסטי. אנחנו כבר מתחילים להבין כמה דברים למשל לגבי המנגנונים של מחלת הפרקינסון, או של מחלת האלצהיימר.

"בהקשר של מחלות זיהומיות למשל, ידוע שיש אנשים שעמידים להדבקה ע"י וירוס HIV כי חסר להם מרכיב מסוים של הרצפטור שאליו נקשר הווירוס, ולאחרונה התגלו דברים דומים גם לגבי וירוס הקורונה, כשהעמידות האישית משתנה מווריאנט לווריאנט. חשוב גם להזכיר שפרויקט הגנום מאפשר פיתוח של 'רפואה מותאמת אישית'. אם נדע, למשל, שבחולה מסוים מופיעים גנים מסוימים ולא אחרים, אז יש לו סיכוי להגיב לטיפול ספציפי ולא אחר".

אם כך, הפרויקט של מיפוי גנום אחד הושלם, אך רק מיליוני גנומים ועבודת ביג דאטה מורכבת יאפשרו לנו לתרגם את הקוד ולתת משמעות למה שהוא היום בעבור המדענים בעיקר מילים חסרות פשר הכתובות בספר. זה פרויקט הרבה יותר גדול מכפי ששוער כשפענוח הגנום הוכרז לראשונה.

המגבלות של אבחון גנטי פרטי

חברות פרטיות המציעות אבחון גנטי לאנשים פרטיים מסתכלות על מקומות מסוימים בגן שבהם מופיעים הבדלים מסוימים, ובוחנים את המצב רק שם. "לדוגמה, יודעים שיש גן מסוים שמשפיע מאוד על הקצב שבו את מפרקת קפה, או גן אחר שיכול לנבא הופעה עתידית של פרקינסון, אז מחפשים ומדווחים רק עליהם", אומר קפלן. "זה אינו מיפוי של כל מערכת היחסים הגנטית שלך עם קפה או עם פרקינסון".

בדיקות "צ'יפ גנטי" בהיריון פועלות במנגנון דומה. הן לא ממפות את הגנום של העובר באופן מלא, אלא מחפשות כמה גנים שידועים כבעייתיים, או הכפלות או החסרות גדולות של הגנום. לכן לעתים הורים שיושבים מול יועץ גנטי לאחר בדיקה כזו יקבלו תשובה שלפיה הגן של התינוק שלהם שונה מהמצופה, אבל שאף אחד לא יודע לומר להם מה המשמעות של ההבדל. או שיאמר להם שהילד הוא בעל גנים שנמצאים בשכיחות רבה יותר אצל ילדים עם אוטיזם, אבל אין באמת דרך לדעת אם הוא עצמו אמנם יהיה אוטיסט. לפעמים, התשובות הללו רק מבלבלות את ההורים, ויוצרות מצוקה ללא פתרון.

פריצת הדרך שהובילה להשלמת הפרויקט

מה בעצם לא הצליחו החוקרים לקרוא ב-2000, ואיך התרחשה פריצת הדרך עכשיו? כדי להבין זאת, דמיינו את הגנום כספר, שאנחנו יכולים לקרוא בו רק כמה מילים במקביל.  "בתהליך ריצוף הגנום, כאילו לקחנו ספר, גזרנו ממנו חתיכות, בכל חתיכה יש כמה מילים, ובמקרה שלנו - רצפי DNA", מסביר קפלן. "לוקחים מבחנה עם המון רצפי DNA קצרים ומזינים את תוכנה למכונה.

"במכונה יש לוחית ובה המון בורות מיקרוסקופיים. לכל בור נופלת לא יותר ממולקולה אחת, שמכילה כמה 'מילים' מהספר שלנו. המכונה מזרימה לתוך הבורות הקטנים חומרים כימיים, שזוהרים בצבע שונה כתלות באות שהם מזהים. לוחית הזכוכית מצולמת, ולפי סדר הצבעים שמופיע, ניתן לדעת מה רצף האותיות בכל אחד מהבורות. אנחנו יכולים לקרוא ככה מיליוני רצפי אותיות, במקביל".

מרשים. אבל אז יש לנו המון חתיכות שגזרנו מהספר. עכשיו אנחנו לא יודעים איך הן היו מסודרות בספר עצמו?
"נכון. לכן אנחנו חותכים את הספר יותר מפעם אחת. חותכים שוב ושוב, ובכל פעם המשפטים נחתכים במקום אחר. אם נמשיך באנלוגיה לספר, אם באחד החיתוכים השגנו את המשפט 'ילד אחד הלך' ובחיתוך אחר 'אחד הלך לבית הספר', כנראה הם באים זה אחרי זה. מדובר במיליארדי רצפי DNA שיש לקרוא ואז לחבר לפי סדר כדי לקבל רצף של 3 מיליארד (!) אותיות, שמהן מורכב גנום אנושי אחד. למרבה המזל, רוב התהליך נעשה על ידי מחשב.

מה ההבדל בין ה-92% שרוצפו בשיטה הזאת עד 2003, וה-8% שנותרו לא מפוענחים?
"ככל שהמילים יותר נדירות, יהיה לנו קל יותר לנחש איזה מילה באה אחרי איזו מילה.  הבעיה היא שיש מילים ומשפטים שחוזרים על עצמם כמה פעמים בגנום. אפילו המון פעמים. ואז מתבלבלים, קשה לדעת מה מתחבר למה".

מה בעצם השתנה עכשיו, שאיפשר את המיפוי המדויק יותר?
קפלן: "שתי התפתחויות טכנולוגיות עיקריות. האחת, היא טכנולוגיה שאפשרה לקרוא רצפים ארוכים יותר. נניח עכשיו במקום לחבר רצפים שכל אחד מהם באורך של כמה מילים, אנחנו יודעים לקרוא פסקה שלמה ברצף (מאות אלפי אותיות בבת אחת לעומת מאות בעבר). כמובן, כשאנחנו מנסים לחבר רצפים שהם ארוכים יותר, קל יותר לראות היכן החפיפות ביניהם. כמו פאזל עם חתיכות יותר גדולות.

"כדי להבין את מבנה ה-DNA בתאים השונים הומצאה טכנולוגיה בשם Hi-C שיודעת לבדוק לגבי כל שתי נקודות בגנום כמה פעמים הן נגעו אחת בשנייה במרחב. מה שאנחנו ראינו הוא שככל שנקודות קרובות יותר על רצף הדנ"א הן נוטות יותר לגעת זו בזו במרחב, והבנו שניתן לאמץ את החוקיות הזאת כדי להשתמש ב-Hi-C בדרך חדשה שלא חשבו עליה: לפתור את בעיית הרכבת הגנומים. זו הגרסה הפשטנית של הסיפור, אבל מצאנו חוקיות בין המבנה של ה-DNA לרצף שלו.

"ראיתי שאפשר להשתמש בשיטה הזאת כדי לנבא היכן ממוקמים רצפים של DNA לאורך הכרומוזום, ולפתור את בעיית ההרכבה, או לפחות לעזור לפתור אותה. פרסמנו את הרעיון הזה במקביל לקבוצה אחרת שהגיעה אליו ממש באותו הזמן, ופתאום זה פרץ. המון חוקרים ואפילו חברות מסחריות משתמשות בשיטה הזו".

כך, אותם 8% של מילים בספר הגנום שנקראו בעבר אבל לא ידעו היכן למקם אותן מוקמו כעת, וגנום אחד פוענח באופן מלא. חוץ מכרומוזום Y.