$
חדשות טכנולוגיה

מידע הולך ונעלם

ארכיונים, יצירות אמנות, בלוגים וגיבויים של מיליוני אתרים נמצאים בסכנה. הסיבה: חומרת מחשוב לא אמינה והתקדמות טכנולוגית שהופכת מידע דיגיטלי שנוצר לפני עשור למיושן ובלתי קריא. באיחוד האירופי כבר עובדים על הפתרון

דורה קישינבסקי 17:4101.04.09

בסוף שנות השמונים פצח אבי בפרויקט שורשים. תמונות ישנות סודרו ופוענחו, תעודות בנות 80 שנה תורגמו, ושיחות טלפון השלימו את החסר בהיסטוריה המשפחתית שלנו. את התוצאות הזין אבא לתוכנת עץ משפחתי מתקדמת במונחים של אז, וכשנפטר ב‭1991-‬ השאיר אחריו ערימות של מידע בעל ערך רגשי עצום. הבעיה: הכל שמור על דיסקטים של ‭5.25‬ אינץ‭,'‬ ובקבצים שרק אותה תוכנה נשכחת משנות השמונים ידעה לקרוא.

 

הסיפור אינו נדיר. בבתים אחרים, מילותיו הראשונות של הילד נשמרות על קלטת אודיו שהסרט שלה נקרע או שאין עוד טייפ שיכול להשמיע אותה. הבר מצווה וטקס סיום בית הספר שמורים על קלטת VHS שהולכת ומתבלה. מכתבים, עבודות ושירי נעורים שנכתבו במעבדי התמלילים איינשטיין או קיוטקסט כבר אינם ניתנים לקריאה. ועל השקופיות של תמונות המשפחה הישנות והסרטים למקרן הביתי שנזרק מזמן כבר לא מדברים.

 

"הניו יורק טיימס" הכניס החודש למודעות הציבורית את המונח "ריקבון נתונים" ‭.(Data Rot)‬ זהו התהליך שבו מידע יקר ערך הולך לאיבוד כי הכלי שבו הוא מאוחסן מתקלקל, או שכבר אין מכשיר שיכול לקרוא אותו. ריקבון הנתונים אינו תופעה חדשה - גם פפירוסים ולוחות חרס התקלקלו - אבל ככל שהטכנולוגיה מתקדמת הוא מתרחש במהירות רבה יותר.

 

כך, בעוד רבים חושבים שהפיכת מידע לדיגיטלי - למשל, סריקת צילום והעלאתו לאינטרנט - מבטיחה לו חיי נצח, המציאות למעשה הפוכה. פורמטים של קובצי מדיה מתחלפים במהירות, וגם מצלמות, אייפודים ודיסקים קשיחים נבנים עם אורך חיים של שנתיים-שלוש בלבד, מתוך הנחת היצרנים שבתוך כמה שנים ממילא יחליפו אותם בדגם מתקדם יותר.

 

אמצעי אחסון המידע מתחלפים כל כמה שנים - והמידע עלול ללכת לאיבוד אמצעי אחסון המידע מתחלפים כל כמה שנים - והמידע עלול ללכת לאיבוד צילום: shutterstock

 

הרבה כבר אבד

 

הבעיה גדולה יותר מנוסטלגיה אישית. יצירות אמנות שאובדות בגלל סרטים מגנטיים שהתקלקלו ופילם שכבר אי אפשר להקרין הן אובדן לתרבות כולה. מגזין הקולנוע המקוון ‭Moving Image Source‬ התאבל בחודש שעבר על יצירות מופת קולנועיות שמכל בחינה מעשית אינן קיימות יותר, מכיוון שאף גורם מסחרי לא היה מעוניין להעבירן מעותקי הפילם הישנים והבלויים לפורמט דיגיטלי. תרומתו הכספית של סטיבן ספילברג לארכיון הסרטים היהודיים בירושלים, שנקרא מאז על שמו, סייעה להציל את הסרטים בארכיון מגורל דומה.

 

ובעוד רוב הסרטים ותוכניות הטלוויזיה נשמרים בארכיון פיזי כלשהו, את שימורו של מה שנוצר באינטרנט קשה הרבה יותר להבטיח. אתרים נסגרים מדי יום. שיחות מהפורומים של אתר IOL הישראלי נמחקו לבלי השאר זכר, 200 אלף הבלוגים שנכתבו באתר ‭Diary-X‬ נעלמו עם קריסתו ב‭,2006-‬ משום שלא היה להם גיבוי, וכך גם האלבומים באתר שיתוף התמונות ‭Digital Railroad‬ שנסגר.

 

אבל הבעיה איננה רק של תוכן גולשים, אלא של ההיסטוריה של האינטרנט כולו: "ארכיון האינטרנט", ארגון שסורק את הרשת זה 12 שנה ושומר העתקים ממיליוני אתרים בנקודות זמן שונות, הודיע לאחרונה שהוא מתקשה להדביק את קצב הצמיחה של הרשת. כיום מתווספים לארכיון מדי חודש כ‭100-‬ אלף גיגה של מידע. החודש הוא ניצל מסכנת סגירה, לאחר שחברת סאן סייעה לבנות עבורו מרכז נתונים חדש. אלמלא העזרה מסאן, היה נגמר המקום במחשבי עמותת "ארכיון האינטרנט‭."‬ המידע עצמו, שמהווה מוזיאון, ספר היסטוריה וארכיון שימושי גם יחד, שמור כיום על מחשבים בסן פרנסיסקו, ויש לו מרכז גיבוי אחד במצרים. אם הוא יאבד, לא יהיה ארכיאולוג שיוכל לשחזר את מה שהיה בו.

 

פרויקט השימור הבינלאומי

 

עבור גופים עסקיים, הפתרון לבעיית ריקבון הנתונים ברור: "הגירה" ‭(Migration)‬ מתמדת של המידע והעברתו למדיית אחסון חדשה בכל פעם שאחת כזו מגיעה לשוק. משה ינאי, מייסד חברות האחסון דיליג'נט ו‭,XIV-‬ שנמכרו ליבמ תמורת כמה מאות מיליוני דולרים, אמר ל"כלכליסט‭:"‬ "כיום המעבר לטכנולוגיות חדשות נעשה באופן השקוף לחברה, שכלל לא צריכה לדעת על כך. ומכיוון שהנפח של אמצעי האחסון החדשים גדל כל הזמן, המידע הישן לרוב תופס בהם רק פינה קטנה. כך זה מתנהל מאז שנות השבעים‭."‬

משה ינאי. הפתרון הוא ב"הגירת המידע" משה ינאי. הפתרון הוא ב"הגירת המידע" צילום: בועז אופנהיים

 

אנשים פרטיים, ארגונים ללא מטרות רווח וממשלות נתקלים לעתים בבעיה אחרת, כשהם מנסים לשמור מידע עבור עצמם, או עבור קהל לא ידוע שירצה להגיע אל המידע הזה בעתיד. פתרון לכך מציע פרויקט CASPAR של האיחוד האירופי, שמטרתו למצוא דרך לאחסן ולשמר תכנים תרבותיים, מדעיים ואמנותיים. בפרויקט משתתפים חוקרים מאונסקו, סוכנות החלל האירופית ועוד מוסדות אקדמיים וחברות, כולל צוות ישראלי ממעבדת המחקר של יבמ בחיפה.

 

יחד הם מפתחים עקרונות ותשתיות תוכנה לשימור מידע, כך שיהיה אפשר לאחסן אותו לשנים, באופן אמין ובטוח ובלי צורך לעקוב בחשש אחרי שינויים טכנולוגיים מהירים. ביבמ מדברים על "אחסנת מידע לדורות‭;"‬ הרעיון הוא שכל נתון יישמר לצד כמות גדולה של נתונים נלווים שמסבירים על טיבו של הקובץ, תכולתו, מתי נוצר ואיך אפשר לקרוא אותו.

 

ד"ר דלית נאור, מנהלת קבוצת מחקר בתחום האחסון ביבמ ישראל, מסבירה: "האיחוד האירופי הוא המוביל העולמי בשימור מידע, אולי מפני שלאירופאים יש יותר סנטימנט להיסטוריה ולתרבות שלהם. הרעיון בפרויקט הוא ששום פרט מידע לא מאוחסן כבייט חסר משמעות, אלא מגיע עם נתונים נלווים שאומרים מאיפה נלקח, מהי ההיסטוריה שלו ואם יש לו עוד עותקים‭."‬

 

לדברי נאור, הרבה מידע מהעשורים האחרונים כבר כמעט לא ניתן לפענח. "סוכנות החלל האירופית שומרת קלטות על גבי קלטות עם מידע‭,"‬ הוא אומרת. "אבל גם אם ננסה לחבר אותן לכונן מתאים, לא בטוח שעדיין קיימות התוכנות שיכולות להבין מה נרשם שם. והמצב בנאסא האמריקאית גרוע יותר. לנאסא היה הרבה תקציב בשנות השמונים, אז היא לקחה את המידע ועיבדה אותו למידע ממוחשב. אלא שככל שהמידע יותר מעובד, כך יש פחות סיכוי שהוא יישמר‭."‬

 

נאור מאמינה שבעתיד יצמח ענף שירותים חדש שתכליתו שימור מידע עבור ארגונים ואנשים פרטיים, ודאגה להעבירו בין מדיומים שונים של אחסון ותקנים משתנים של טכנולוגיה. "זה העתיד‭,"‬ היא אומרת.

בטל שלח
    לכל התגובות
    x