איך לינוקס מתמודדת עם התפוצצות המידע?
מאת:
דורון אופק, 5.9.17, 08:00
הגישה הלינוקסאית לתחום: הגישה החדשה של SDS לניהול והפעלת האגירה האדירה של המידע.
לא פשוט לדמיין כיצד נראית התפוצצות המידע. העולם מייצר 2.5 טריליון ג'יגה בייט ליום, אבל המשמעות האמיתית של המקום ההולך ואוזל היא לא רק בשטחי דיסק, אלא בכיס של כל אחת ואחד מאיתנו. מכיוון ששטחי אחסון - הענן המאחסן את התמונות, את המידע הרפואי או את העדפות הקנייה שלנו, עולים כסף. ומישהו צריך לשלם את זה.
חשוב להבין, שלאף ארגון אין אינטרס למתן את הצטברות המידע. למשטרה, שמתחילה לאגור צילומי מצלמות דש-בורד
Dashboard, אין שום רצון להגביל את אחסון הסרטונים. רשתות השיווק לא מעוניינות לאבד את המידע, שאספו על העדפות הקנייה שלנו והרשתות החברתיות, ובכן, הן לא רוצות לאבד אפילו שבריר. ובכל הבלגן הזה חייבים לעשות סדר.
אתן לכך דוגמה. בעבר, כאשר הייתי מגיע אל רופאת המשפחה, היא היתה מסתייעת, במקרה הטוב, בכרטיס קרטון קטן המכיל חלק מהמידע הרפואי שלי. כיום, בפני כל רופא משפחה חשופה כל ההיסטוריה הרפואית - החל מחוליים, ניתוחים וכלה בתוצאות בדיקות מעבדה מלפני שנים. הטיפול הרפואי משתפר מכך לאין ערוך, אבל גם כל מערך האחסון של אותו מידע עולה לא מעט. והרי ברור, שאף אחד מאיתנו לא ירצה, שיתחילו למחוק נתונים, שהרי נתוני עבר רפואיים יכולים להשפיע על טיפולים עתידיים. וכך, כמויות המידע הולכות וגדלות.
בלינוקס זה חייב לעבוד
מכיוון שצד הביקוש לא יתמתן בעתיד, קהילת הלינוקס החלה לתת פתרונות לנושא מכיוון אחר. עם התמשכות האגירה האדירה של המידע התברר, שלכ-80% מהמידע הנאגר אין צורך לגשת באופן יומיומי ותדיר. לכן, ניתן ליצור פתרונות אחסון זולים יותר, איטיים יותר, שיוכלו להקיף מידע רב וגדול. אך מי ינהל אותם? ואיך יפעילו אותם? כאן נכנסת הגישה החדשה.
SDS- Software Defined Storage
בדרך כלל, כאשר חברות היו מבקשות לקנות פתרונות אחסון הן נאלצו להסתפק בפתרונות מוכנים - סטורג' של חברה קניינית, שמגיע כארון מושלם - דיסקים, שרתים, חומרה, תוכנות ניהול ומערכות קבצים. מערכות אלו הן יחודיות, מהירות, אך יקרות מאוד.
הגישה הלינוקסאית לתחום החליטה לבטל את הייחודיות ולהחליף אותה בסטנדרט - מערכות ניהול סטנדרטיות, מערכות קבצים סטנדרטיות, שאליהן ניתן לצרף כמעט כל סוג של חומרה. ההבדלים בעלויות עצומים - במקום סטורג', שמתחיל מסכומים של כ-100 אלף דולרים ויכול להאמיר לחצי מיליון דולרים ואף יותר, ניתן ליצור ארון כזה ב 25 אלף דולרים.
למעשה, הגישה היא להוציא את ה"חוכמה" מרמת ההתקן עצמו לרמה של אפליקציה גנרית, ואז היכולות השונות לא תהיינה תלויות בהתקן של יצרן כזה או אחר, אלא הן תהיינה כחלק מתוכנה, שאותה ניתן לשדרג בקלות ולטפל בה בקלות. כך, שהקשר החד ערכי לסוג החומרה יינתק וארגוני הלקוח יכולים לעבוד על סוגי חומרה שונים.
איך ניתן להשתמש ביכולת הזו? קחו למשל בנייה של מערכת התאוששות מאסון (
DR). בשכפול נתונים, הסטורג'ים יודעים לעבוד רק עם מערכות מאותו המותג. בגישה הישנה, היה צורך להתקין סטורג' ממותג, מהיר ויקר. בשיטת ה-
SDS ניתן להתקין ארון שונה וזול יותר ולשכפל את הנתונים גם אם מדובר בארון שונה לחלוטין וזול הרבה יותר.
זאת ועוד, רבות מהפצות הלינוקס השונות עושות שימוש במערכת קבצים מסוג
BTRFS, שכוללת יכולת של מניעת אחזקת קבצים כפולים (די דופליקיישן), ומנגנוני כיווץ המוטמעים מראש בתוכנה עצמה, מה שמאפשר להתמודד ביעילות יתרה עם כמויות הדאטה ההולכות וגדלות.
הסטנדרט הוא המלך
"סטנדרטי" בעולם הקוד הפתוח, הוא לא מילת גנאי. לא מדובר בקוד לבינוניות. מדובר ביכולת לבנות, לברוא, להתפתח. תארו לעצמכם, שלכל מכשיר חשמלי היה שקע אחר - ייחודי. גישת הקוד הפתוח, הסטנדרטיזציה, היא השקע האחיד, 220
V נמצא בבית. הסטנדרט מאפשר פיתוח ושיפור אך יותר מהכל הוא מאפשר תחרות, דבר, שתוכנה קניינית ממעטת לעשות.
למעשה, תוכנה קניינית לרוב לא תהא סטנדרטית ותהיה מאוד מאופיינת וספציפית. הדבר הזה טוב לספק, מכיוון שהלקוח צריך להמשיך איתו לנצח, אבל רע ללקוחות. ומהפכת "האופן סורס" בהקשר הארגוני מרפאת את זה.
קריאת כיוון לעולם מוגדר תוכנה
הכיוון אותו מגדירות הפצות הלינוקס השונות הוא עולם מוגדר תוכנה. ניתוק מוחלט כמעט מהברזלים. אחסון מוגדר תוכנה, וירטואליזציה של שרתים וענן אירגוני פנימי, ואפילו הרשת - המתגים, הנתבים, כולם מוגדרי תוכנה. כולם וירטואליים. ואז, כאשר כלל הרכיבים יהפכו סטנדרטיים, והתוכנה תנהל את כולם, נוכל סוף סוף להתחיל להתמודד עם כמות המידע העצומה, שמגדירה את העידן החדש של ימינו.
קרדיט צילום תמונה עליונה: ניב קנטור.
מאת:
דורון אופק, ספטמבר 2017.
מנהל חברת
SUSE ישראל, שמפתחת מערכות קוד פתוח לארגונים