
تیم تحقیقاتی Audiocraft که بخشی از شرکت متا است، به تازگی مدل هوش مصنوعی متنبازی به نام MusicGen را منتشر کرده است. این مدل قادر است با استفاده از ورودیهای متنی، آهنگها تولید کند. در واقع، MusicGen شبیه به ChatGPT است، اما به جای تولید متن، آهنگها را خلق میکند. یکی از ویژگیهای جالب آن این است که میتوانید یک نمونه از آهنگی را به مدل بدهید و آن را بر اساس توصیف شما تغییر دهد.
به گزارش پایگاه خبری صنایع مدرن به نقل از انگجت، کاربران با استفاده از MusicGen، میتوانند سبک موسیقی مورد علاقه خود را توصیف کنندیا بخشی از یک آهنگ را به آن داده و تا آهنگ جدیدی که مطابق توصیف آنها است، ایجاد شود. این هوش مصنوعی سرعت خوبی دارد و میتواند در مدت زمان کوتاهی (به طور مثال 160 ثانیه)، آهنگ جدیدی را تولید یا بخش از ان را تغییر دهد.
این مدل هوش مصنوعی که در وبسایت Decoder گزارش شده است، در سایت Hugging Face فیسبوک نیز در دسترس است و شما میتوانید از دموی آن استفاده کنید.به عنوان مثال، میتوانید بگویید میخواهید آهنگی شبیه به موسیقی دهه ۱۹۸۰ با درامهای سنگین داشته باشید.
برای آموزش این مدل هوش مصنوعی، شرکت متا از حدود ۲۰ هزار ساعت موسیقی مجوزدار استفاده کرده است که شامل ۱۰ هزار قطعه آهنگ از پایگاه داده داخلی شرکت و دادههایی از سایتهایی مانند Shutterstock و Pond5 است. برای افزایش سرعت آموزش، از یک توکنساز صوتی به نام EnCodec با فرکانس نمونهبرداری ۳۲ کیلوهرتز استفاده شده است تا بتواند تکههای کوچکتری از آهنگ را به طور همزمان پردازش کند.
احسان خالق، یکی از مهندسان یادگیری ماشینی در Hugging Face، درباره MusicGen میگوید که این مدل نیازی به بازنمایی معنایی با نظارت بر خود ندارد و به طور خودکار فقط ۵۰ گام پیشرونده را برای هر ثانیه صدا ایجاد میکند.











