סמנכ"ל טכנולוגיות בסלקום: אין קשר בין התקלה לקיצוצים בחברה

בסלקום עדיין לא יודעים מה מקור התקלה שאירעה בשבוע שעבר: "הנושא עדיין בבדיקה"

"צוותים משותפים שלנו ושל נוקיה-סימנס עובדים בלי הפסקה על מנת לאתר את מקור התקלה. בלילה של יום חמישי, 24 שעות אחרי התקלה, הגיעו 5 מהנדסים של נוקיה, שכל אחד מהם אמון על כל מרכיבי הרשת. אנחנו מקבלים מהם תמיכה יחד עם המהנדסים שלנו. הנושא עדיין בבדיקה" - כך אומר ליפא אוגמן, סמנכ"ל טכנולוגיות בסלקום, בשיחה עם "גלובס".

- לא איתרתם עדיין את מקור התקלה?

"לא".

- יכול להיות שנעשו עבודות כלשהן בלילה הקודם לתקלה, ושאולי שם אירעה שגיאה כלשהי שגרמה לבעיה?

"אנחנו כל הזמן עושים עבודות ברשת. עבודות לא היו צריכות לגרום לתקלה, והן גם לא הגורם לתקלה. זו רשת הנדסית שיש בה עבודות כל הזמן. זו רשת מתפתחת, עולה בקיבולת, עולה בשירותים. כל העבודות עברו בהצלחה בימים שלפני התקלה, והן לא הגורם לתקלה".

בנוקיה בודקים

- אגף ההנדסה בסלקום מתייעל למיטב ידיעתי ביותר מ-10% בתקציבו בשנה. ייתכן שיש קשר בין הקיצוצים לתקלה?

"אין קשר. האגף מתייעל בגלל שיפור תהליכים והתמקצעות, וכל גוף שמכבד את עצמו, ברגע שהוא מעמיק את הידע ולומד שיטות עבודה חדשות, החובה שלו להתייעל. להתייעל בפרויקטים, כלומר, לעשות פרויקטים שמביאים להתייעלות וגם להתייעל בתהליכי עבודה. כל ההתייעלות שהיתה אין לה שום קשר לתקלה, לגמרי".

- ומה לגבי מחלקת הבקרה שלכם שהתפרקה בהנדסה, וחלק מאנשיה התפזרו וחלק פוטרו?

"מחלקת הבקרה מפתחת כלי בקרה. היא לא אחראית לבקרה השוטפת של הרשת. היא מפתחת כלים. זה עניין של טרמינולוגיה, אומרים בקרה, אפשר לחשוב שהם יושבים עכשיו ומגלים תקלות. הם מהנדסי יישומי בקרה. כלומר, מפתחים כלים שמאפשרים לי להתייעל.

"אם יש מערכת שעושה בקרה יעילה, אז אני צריך פחות בקרים שיישבו בשולחן, לדוגמה. אז המחלקה הזאת היא מחלקת פיתוח של כלי בקרה, ולא מחלקה תפעולית בשוטף. כן נעשו בה שינויים עכשיו, ואין לזה שום קשר לתקלה. זה לא קשור לתפעול, זה לא קשור להנדסה. זה כלים עתידיים שמפתחים. זה לא קשור לתקלה, משום שבמחלקת המיתוג לא נגענו".

- האם תערכו שינויים כתוצאה מהתקלה?

"אני עדיין לא יודע מה אני צריך לתקן. אנחנו עובדים ברציפות. אנשי נוקיה מנסים כל הזמן לחקור לעומקם של דברים מה הגורם לתקלה".

- אתה יכול להסביר מה היתה התקלה בעיניים מקצועיות?

"ראינו ביקוש גבוה לשיחות שגרם להרבה מאוד עומסים בין HLR (מאגר נתונים שמזהה את הלקוחות ומה השירותים שכל משתמש מנוי עליהם) אור-יהודה ו-STP (מתג איתותים). ה-STP זה אותו אלמנט איתותי מרכזי שנמצא ברשת והוא מנתב את כל הפונקציות הסלולריות בין מרכיבי הרשת השונים.

"HLR אור-יהודה עובד עם אחד משלושה HLR אקטיביים שנמצאים באתרים גיאוגרפים שונים ומגבים אחד את השני. במקרה של כשל באחד מהם, ה-HLR המגבה תופס פיקוד בתוך שניות, ולא אמורים להרגיש הפסקה משמעותית בשירות. כלומר, זה לא שאני צריך לקחת את בסיס הנתונים ולהעתיק אותו ואת הגדרות הלקוחות, אלא זה משהו רשתי שיודע לקחת פיקוד בצורה אוטומטית.

"הקונפיגורציה שלנו של שלושה HLR פלוס 1 הרבה יותר חזקה מאשר ארבעה HLR, כי יש לך אלמנט של שריד גיאוגרפי שיודע לקחת פיקוד אם יש כשל באחד מ-2 ה-HLR. ובוא נגיד שאנחנו גאים מאוד בדבר הזה".

תסריט בלי גיבוי

- למרות שולי הביטחון, איפה היה אמור להיכנס הגיבוי?

"לא היתה לנו בעיה ב-HLR, כנראה. הגיבוי נכנס. הבעיה היתה בקישור בין ה-HLR. גיבוי לא עוזר אם אתה נכנס לעומס של תקשורת. גיבוי זה לכשל. אם יש לך כשל, למשל אם ה-HLR יצא מכלל פעולה, או יש לך בעיה במבנה, שריפה, הצפה או פיגוע כזה או אחר, יש לך מה שנקרא אלמנט לא מתפקד, וזה יכול להיות גם תקלה אלקטרונית - הגיבוי ייכנס. אבל ברגע שיש לך הפצצה (של תנועה כתוצאה מניסיונות חוזרים ונשנים להתקשרות, ג.פ.), אז הפצצה תפסיק גם את הגיבוי. לתסריט הזה אין גיבוי".

- לכן נאלצתם פשוט להוריד את ה-HLR ולהעלותו מחדש?

"במהלך העבודה הוא לא היה תקול, כי אם הוא היה תקול, הגיבוי היה פותר את זה. אבל במסגרת הפעולות עשינו הרבה דברים, בין היתר להוריד את ה-HLR ולהעלות אותו מחדש. כאמור, יש לנו גיבוי".

הבהרה: בניגוד לפרסום ב"גלובס" ביום חמישי על הימצאותם של שני HLR בסלקום, בניגוד לארבעה בחברות אחרות, מתקן אוגמן כאמור כי לסלקום יש שלושה HLR פלוס 1 לגיבוי. אנו מתנצלים על הטעות.