משרד הביטחון שם ברקס לעסקה ביטחונית רגישה של יוצאי רפאל

יובל אזולאי

"משקיע ריטייל שלומד לבד ומתעמק, יודע לא פחות מיועץ השקעות"

אלמוג עזר

הבטן הרכה של האויב: למה שלא נפציץ תשתיות נפט באיראן?

ניצן סדן

דרושים: 2,000 עובדים תוך שנה, שכר התחלתי של 16 אלף שקל, הכירו את ה-DPO

מעין מנלה

משרד הביטחון שם ברקס לעסקה ביטחונית רגישה של יוצאי רפאל

יובל אזולאי

המנהל המורשה בסלייס מגיש תביעה נוספת בפרשה: 107 מיליון שקל נגד מגייסת הכספים

אלמוג עזר

מוסדות התרבות נגד השר זוהר: "ביטול פרסי היצירה - פגיעה באמנים ובמערכת כולה"

מאיה נחום שחל

הנצפות ביותר בערוץ

הבטן הרכה של האויב: למה שלא נפציץ תשתיות נפט באיראן?

מאחורי הקלעים של חטיפת מדורו: כך כמעט נכשל המבצע

עם זינוק דמיוני של 1,000% בשנה - יצרנית הפלאש המיתולוגית חוזרת למרכז הבמה

סרטונים מומלצים

תותחי הלייזר של ישראל: מה הם לא יודעים לעשות?

מאחורי הקלעים של חטיפת מדורו: כך כמעט נכשל המבצע

יצירת מוזיקה ב-AI (צילום: DALL E-2)

מכונת להיטים: מטא השיקה כלי AI שיוצר מוזיקה מטקסט

הכלי המוזיקלי החכם, MusicGen, מאפשר ליצור קטעי מוזיקה באמצעות הקלדה של תיאורים כמו "שיר דאנס אלקטרוני קליל ומעודד עם תוספת תופים ורגשות חזקים" ולהתאימם ללחנים מפורסמים. אמנם זה לא מה שיסייע למטא להדביק את פער ה-AI, אבל עדיין, כיף לשמוע

חדשות חוץ

14:12, 12.06.23

מטא השיקה את הכלי MusicGen, שמסוגל לחולל/לייצר קטעי מוזיקה קצרים בהתבסס על טקסטים כתובים או להתאים קטעי מוזיקה ללחנים קיימים. בדומה לרוב מודלי השפה הקיימים היום, MusicGen מבוסס על מודל למידה טרנספורמר (Transformer model), וכך, בדיוק כפי שמודל שפה יכול לחזות מה תהיה האות הבאה במשפט, המודל חוזה את החלק הבא ביצירה מוזיקלית. 
צוות החוקרים שפיתח את הכלי השתמש ב-20 אלף שעות של מוזיקה להכשרת המודל. הם הסתמכו בעיקר על מאגר מידע פנימי של 10 אלף שירים באיכות גבוהה וכן בנתוני מוזיקה משאטרסטוק ומ-Pond5. התיאור הכתוב קובע את הסגנון הבסיסי, אותו מתאימים למלודיה בקובץ האודיו. כך למשל, אפשר לשלב את התיאור של "שיר דאנס אלקטרוני קליל ומעודד עם תוספת תופים ורגשות חזקים" עם המלודיה טוקטה ופוגה ברה מינור המפורסמת של באך, ולייצר קטע מוזיקלי חדש. 
מחברי המחקר ערכו בדיקות על שלוש גרסאות של המודל בגדלים שונים: פרמטרים של 300 מיליון, 1.5 מיליארד ו-3.3 מיליארד. הם מצאו שהמודלים הגדולים יותר מייצרים שמע באיכות גבוהה יותר, אבל המודל של ה-1.5 מיליארד זכה לדירוג הגבוה ביותר בקרב המשתמשים.

תגיות: