מכונת להיטים: מטא השיקה כלי AI שיוצר מוזיקה מטקסט
מכונת להיטים: מטא השיקה כלי AI שיוצר מוזיקה מטקסט
הכלי המוזיקלי החכם, MusicGen, מאפשר ליצור קטעי מוזיקה באמצעות הקלדה של תיאורים כמו "שיר דאנס אלקטרוני קליל ומעודד עם תוספת תופים ורגשות חזקים" ולהתאימם ללחנים מפורסמים. אמנם זה לא מה שיסייע למטא להדביק את פער ה-AI, אבל עדיין, כיף לשמוע
מטא השיקה את הכלי MusicGen, שמסוגל לחולל/לייצר קטעי מוזיקה קצרים בהתבסס על טקסטים כתובים או להתאים קטעי מוזיקה ללחנים קיימים. בדומה לרוב מודלי השפה הקיימים היום, MusicGen מבוסס על מודל למידה טרנספורמר (Transformer model), וכך, בדיוק כפי שמודל שפה יכול לחזות מה תהיה האות הבאה במשפט, המודל חוזה את החלק הבא ביצירה מוזיקלית.
צוות החוקרים שפיתח את הכלי השתמש ב-20 אלף שעות של מוזיקה להכשרת המודל. הם הסתמכו בעיקר על מאגר מידע פנימי של 10 אלף שירים באיכות גבוהה וכן בנתוני מוזיקה משאטרסטוק ומ-Pond5. התיאור הכתוב קובע את הסגנון הבסיסי, אותו מתאימים למלודיה בקובץ האודיו. כך למשל, אפשר לשלב את התיאור של "שיר דאנס אלקטרוני קליל ומעודד עם תוספת תופים ורגשות חזקים" עם המלודיה טוקטה ופוגה ברה מינור המפורסמת של באך, ולייצר קטע מוזיקלי חדש.
מחברי המחקר ערכו בדיקות על שלוש גרסאות של המודל בגדלים שונים: פרמטרים של 300 מיליון, 1.5 מיליארד ו-3.3 מיליארד. הם מצאו שהמודלים הגדולים יותר מייצרים שמע באיכות גבוהה יותר, אבל המודל של ה-1.5 מיליארד זכה לדירוג הגבוה ביותר בקרב המשתמשים.