$
חדר מחשבים

על מלפפונים ולמידה עמוקה

ענף ה-deep learning שהוא נגזרת של תחום למידת מכונה מאפשר למחשבים ללמוד מודלים חדשים. מהנדס יפני מצא לטכנולוגיה שימוש אפילו בחוות המלפפונים של הוריו

ניר חינסקי 15:4119.01.17
למידה עמוקה (Deep Learning) הוא תחום חדש של מחקר מבוסס למידת מכונה (Machine Learning), שנועד לקדם את הטכנולוגיה צעד אחד קרוב יותר לאחד מיעדיה המקוריים – בינה מלאכותית. לא תהיה זו הגזמה אם נאמר שמתן דוגמאות ליישומים המבוססים על למידת מכונה (Machine Learning) ולמידה עמוקה (Deep Learning) מוגבל רק בידי הדמיון שלנו.

הסיפור הבא ממחיש את נכונותה של הצהרה זו. על הקשר בין מלפפונים לבין למידה עמוקה, שמענו בגוגל קלאוד מפי מקוטו קויקה, אשר שימש בעבר כמעצב מערכות מוטמעות בתעשיית הרכב היפאנית. לפני כשנה, קויקה נקרא לסייע להוריו בשדות המלפפונים שגידלו. די מהר נדהם מהיקף העבודה הנדרש על מנת למיין מלפפונים לפי גודל, צורה, צבע ומאפיינים נוספים.

 

אביו של קויקה גאה במיוחד בסוג מסוים של מלפפון - המלפפון הקוצני - שעבורו הקדיש את חייו. מדובר במלפפון רענן ופריך, אשר על קליפתו עטורת "קוצים" המאפיינים אותן. מלפפונים ישרים ועבים, עם צבעים עזים וכמות נכבדה של קוצים, נחשבים למלפפונים איכותיים במיוחד, ולכן מניבים מחירים גבוהים יותר בשוק.

 

 

קויקה הבין מהר מאוד שמיון מלפפונים היא משימה תובענית ומתעתעת, לא פחות מגידולם. "לכל מלפפון צבע שונה, צורה שונה, איכות שונה ומידת טריות שונה", הוא מספר. ביפן, כל חוות גידולים קובעת בעצמה את תקן האיכות של תוצריה, ולא קיים תקן אחיד המקובל בתעשייה. בחווה של מקוטו, מיון המלפפונים מתבצע על פי תשעה סוגים, ואמו של קויקה מבצעת את המיון בעצמה, משימה האורכת לעתים עד שמונה שעות ביום בתקופת הקציר.

 

"עבודת המיון אינה משימה קלה ללימוד. על הממיין לבחון לא רק את הגודל והעובי של המלפפון, אלא גם את הצבע, המרקם, לבחון שריטות קטנות על המעטפת, האם המלפפון ישר או עקום והאם יש עליו קוצים. לוקח חודשים ללמוד את התהליך, ולא ניתן לשכור עובדים במשרה חלקית בתקופה הלחוצה ביותר. אני עצמי הגעתי רק לאחרונה לרמה טובה של מיון מלפפונים", מעיד קויקה. בשוק קיימות אמנם מכונות מיון אוטומטיות, אך להן מגבלות שונות, בעיקר מבחינת ביצועים ועלויות, ולכן החוות הקטנות אינן נוטות לעשות בהן שימוש.

 

קויקה האמין, כי פעולת המיון אינה משימה הכרחית עבור מגדלי המלפפונים. "החוואים צריכים להתמקד ולהשקיע את זמנם בגידול ירקות טעימים". על כן, החליט להפוך את התהליך לאוטומטי בהקדם האפשרי. הרעיון ליישום למידת מכונה בתהליך מיון המלפפונים צץ במוחו מכיוון אחר לגמרי: משחק ה-Go שבו התמודד שחקן אנושי מול מערכת AlphaGo של גוגל. "כאשר ראיתי את AlphaGo הבנתי שזה הסימן עבורי לעבוד על פיתוח מערכת למיון מלפפונים, מבוססת טכנולוגיית למידה עמוקה".

 

שימוש בלמידה עמוקה לטובת זיהוי תמונה מאפשר למחשב לאמן את עצמו באמצעות צפייה בתמונות, והבנת מידת החשיבות של אלמנטים מסוימים בהן. באמצעות שימוש בהיררכיה של כמות רבה של "נוירונים מלאכותיים", למידה עמוקה יכולה לקטלג באופן אוטומטי תמונות במידת זיהוי גבוהה יחסית. לכן, רשתות נוירונים יכולות לזהות מינים מסוימים של חתולים ודגמי מכוניות או מטוסים המצויים בתמונות. לעתים, רשתות נוירונים יכולות אפילו להציג ביצועים טובים יותר מהעין האנושית ביישומים מסוימים.

 

אך האם מחשבים באמת יכולים ללמוד את המיומנות שהפגינה אמא קויקה במיון מלפפונים? קויקה ביקש לבדוק האם הוא יכול להשתמש בטכנולוגיית למידה עמוקה למיון, באמצעות שימוש ב-TensorFlow, ספריית למידה חישובית בקוד פתוח, אשר פותחה באותה עת.

 

"התחלתי לנסות את הטכנולוגיה מול תמונות של המלפפונים מהחווה שלנו", מספר קויקה. "זו הייתה הפעם הראשונה בה ניסיתי טכנולוגיות של למידת מכונה או למידה עמוקה, ומיד בהתחלה הוצגו תוצאות באיכות זיהוי גבוהות משמעותית מאלו שציפיתי להן. העובדה הזו נטעה בי בטחון שזו הדרך לפתרון בעיית מיון המלפפונים בחווה של הוריי".

 

שימוש בTensorFlow אינו מצריך ידע נרחב במודלים המתמטיים המתקדמים והאלגוריתמים הדרושים ליישום של רשתות נוירונים באופן מעמיק. מספיק רק להוריד את דוגמית הקוד, לקרוא את המדריכים המצורפים, וניתן להתחיל באופן מידי. ספריית הקוד מנמיכה משמעותית את רף הכניסה לעולם למידת המכונה, מתכנתים רבים שאינם מגיעים מעולם למידת המכונה החלו לשחק עם הטכנולוגיה ולשלב אותה במערכי הנתונים והיישומים שלהם.

מכונת מיון המלפפונים של קויוקה מכונת מיון המלפפונים של קויוקה צילום מסך: Youtube

 

אחד האתגרים הקיימים בתחום הלמידה העמוקה הינה הדרישה המקדימה לזמינות של מסד נתונים גדול, על מנת לאמן את המערכת. קויקה בילה במשימה זו כשלושה חודשים, כשהוא מצלם כ-7,000 תמונות של מלפפונים שמוינו בידי אמו – אך אפילו היקף כזה אינו מספק.

"כאשר בחנתי את התוצאות שהפיקה המערכת בהתבסס על צילומי האימון, הגעתי לזיהוי של יותר מ-95%, אך אם מריצים את המערכת על מלפפונים ולא על תמונות, איכות הזיהוי יורדת לכ-70%. חשדתי שהסיבה לכך היא תופעה מוכרת בעולם רשתות הנוירונים, שבה המודל המורץ מאומן להתאים רק לבסיס נתונים קטן יחסית, מאחר שמספר התמונות שבהן השתמשתי אינו גדול מספיק".

 

האתגר הנוסף של למידה עמוקה, מצוי בכך שטכנולוגיה כזו דורשת כוח מחשוב עצום. הממיין האוטומטי שבנה קויקה משתמש במחשב נייח מבוסס חלונות על מנת לאמן את רשת הנוירונים שמזינה את המודל. למרות שהמחשב ממיר את תמונת המלפפון לתמונה ברזולוציה נמוכה (80 על 80 פיקסלים), עדיין נדרשים יומיים עד שלושה לאמן את המודל באמצעות 7,000 תמונות.

 

"שימוש בתמונות ברזולוציה נמוכה מאפשר למערכת לקטלג את המלפפון רק בהתבסס על צורתו, אורכו והדרך שבה הוא מתעקם. היא אינה יכולה לזהות צבע, מרקם, שריטות וקוצים", מסביר קויקה. "שיפור הרזולוציה של התמונות באמצעות צילום קרוב יותר של המלפפון יניב אמנם זיהוי באיכות טובה יותר, אך יגדיל משמעותית את זמן האימון". קויקה הבין כי הוא זקוק למערכת מחשוב חזקה, אשר תעשה בדיוק את זה, בלי להגדיל את זמן האימון.

 

במחקר של פירמת הייעוץ דלויט שיצא השנה, נמצא כי שמונים מתוך מאה חברות התוכנה הגדולות בעולם יימצאו בשנה הקרובה, וחלקן כבר נמצאות, בתהליכי אימוץ של מערכות תוכנה חכמות המבוססות על בינה מלאכותית וטכנולוגיות קוגניטיביות. עלייה של 25% לעומת שנת 2015. על פי המחקר, חברות אלו יעשו שימוש במערכות התוכנה החכמות המבוססות למידה עמוקה, לשם עיבוד שפה טבעית וזיהוי דיבור. עוד עולה, כי היקף המכירות בתחום הבינה המלאכותית, יגיע ל-43 מיליארד דולר עד שנת 2024.

 

לאור נתונים אלו, ברור כי נראה בו-זמנית קפיצה משמעותית בשימוש בפלטפורמת הענן כתשתית להרצת ניסויים ושיפור תהליך הלמידה העמוקה. זאת, ללא הצורך בתוספת שרתים שמשמעותה הוצאה כספית מהותית. ב-2017 נראה יותר ויותר מכשירים מחוברים לרשת אשר יחקו תהליכי חשיבה אנושיים. המטרה של השגת בינה מלאכותית המחקה תהליכים מורכבים המתרחשים במוח, כבר אינה נראית רחוקה כל כך.

 

הכותב הינו מנהל פעילות Google Cloud, מזה"ת ואפריקה

בטל שלח
    לכל התגובות
    x