متا برای تبدیل متن به صدا، از هوش مصنوعی Voicebox رونمایی کرد

شرکت متا به تازگی یک مدل هوش مصنوعی به نام “Voicebox” را معرفی کرده است که می‌تواند متن را به صدا تبدیل کند. این مدل با بیش از 50 هزار ساعت صداهای فیتلر نشده آموزش دیده است و می‌تواند بر اساس زمینه و متن، صداها را تکمیل کند.

به گزارش پایگاه خبری صنایع مدرن به نقل از نیوز بایت، از جمله قابلیت‌های مهم Voicebox، انتقال سبک گفتار از یک زبان به زبان‌های خارجی است. با ارائه نمونه‌ای از صدای خود به همراه متن مربوطه، کاربران می‌توانند از Voicebox بخواهند تا متن را با زبان‌های مختلف بخواند.

توانایی Voicebox در ترجمه متن از یک زبان به زبان دیگر و حفظ شکل گفتار زبان مقصد نیز به عنوان ویژگی‌های مهم این مدل ذکر شده است. تنوع بالای داده‌های ورودی به این سیستم، باعث تولید صداهای طبیعی‌تر می‌شود. همچنین، صداهای تولید شده توسط Voicebox تنها با 1 درصد خطای تنزل روبه‌رو بوده است در حالی که این نرخ برای سایر سیستم‌های تبدیل متن به صدا بین 45 تا 70 درصد است.

مزایای دیگر این مدل شامل ویرایش صدا، حذف نویز در مکالمات و اصلاح کلمات اشتباه است. با استفاده از این هوش مصنوعی، کاربران می‌توانند بخش‌های دارای نویز در فایل صوتی را شناسایی و Voicebox را برای تولید مجدد آن بخش استفاده کنند.

روش آموزش جدید متا با نام “هماهنگ‌ساز جریان” (Flow Matching) برای Voicebox استفاده می‌شود که نیاز به حجم بالایی از داده‌های ورودی ندارد. نتایج بنچمارک‌ها نشان می‌دهد که Voicebox از نظر خطا بهتر از بهترین سیستم‌های تبدیل متن به صدا (1.9 درصد در مقابل 5.9 درصد) عمل می‌کند و همچنین سرعت آن تا 20 برابر سریع‌تر است.

متا برای تبدیل متن به صدا، از هوش مصنوعی Voicebox رونمایی کرد

تازه ها

آنتروپیک امروز یک طرح اشتراک جدید به نام “Max” را برای چت‌بات خود، Claude، معرفی کرد

رقابت بایدو با DeepSeek با مدل هوش مصنوعی جدید

آیا بازی‌های ویدیویی تولیدشده توسط هوش مصنوعی در راه‌اند؟

موج جدید هوش مصنوعی فرا رسیده است: عامل‌های هوش مصنوعی خودمختار —شگفت‌انگیز و ترسناک

اوپن‌ای‌آی ابزار جدیدی برای تحقیقات عمیق معرفی کرد که می‌تواند با تحلیلگران پژوهشی رقابت کند

آیا ربات‌های هوشمند می‌توانند جایگزین فضانوردان انسان در فضا شوند؟

گزارش‌ها از ناکامی GPT-5 شرکت OpenAI در برآورده‌سازی انتظارات

هوش مصنوعی عاملی چیست و چگونه کار را تغییر خواهد داد؟

مدل هوش مصنوعی پیش‌بینی آب‌و‌هوا از گوگل عملکرد فوق‌العاده‌ای دارد

کلاس درس هوش مصنوعی در حال حاضر اینجاست: آینده چه خواهد بود؟

تقریباً تمام کارکنان دانش نسل Z از هوش مصنوعی استفاده می‌کنند

متا مدیر بخش هوش مصنوعی Salesforce، کلارا شی، را برای رهبری گروه جدید هوش مصنوعی تجاری استخدام کرد

متا برای تبدیل متن به صدا، از هوش مصنوعی Voicebox رونمایی کرد

تازه ها

موضوعات

عناوین هوش مصنوعی

دسته‌ها