Web Analytics Made Easy - Statcounter

به گزارش خبرنگار خبرگزاری علم و فناوری آنا، شرکت متا از «ویس باکس» (Voicebox) مدل تبدیل متن به گفتار خود رونمایی کرد. این شرکت وعده می‌دهد برای تبدیل متن به گفتار همان کاری را انجام می‌دهد که «چت جی پی تی» (ChatGPT) و «دال ای» (Dall - E) برای تولید متن و تصویر انجام دادند.

مدل هوش مصنوعی «ویس باکس» مانند «جی پی تی» یا «دال ای» یک مولد متن به خروجی است، فقط به جای ایجاد متن یا تصاویر زیبا، کلیپ‌های صوتی را پخش می‌کند.

بیشتر بخوانید: اخباری که در وبسایت منتشر نمی‌شوند!

متا این سیستم را این گونه تعریف می‌کند: «یک مدل هماهنگ‌ساز جریان به‌صورت غیرخودکاهنده برای تکمیل صدا براساس زمینه و متن» که این مدل روی بیش از 50 هزار ساعت صدای فیتلرنشده تعلیم یافته و متا به‌طور خاص از صدای کتاب‌های صوتی به زبان‌های انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی استفاده کرده است. متا می‌گوید مدل آن‌ها عملاً می‌تواند هر متنی را از یک زبان به یک زبان دیگر ترجمه کند و شکل گفتاری زبان مقصد را حفظ کند.

 نتایج نشان می‌دهد که مدل‌های تشخیص گفتار آموزش دیده در گفتار مصنوعی تولید شده توسط «ویس باکس» (Voicebox) تقریبا به خوبی مدل‌های آموزش دیده در گفتار واقعی عمل می‌کنند. 

**«ویس باکس» چه قابلیت‌هایی دارد؟

محققان متا توضیح دادند: این سیستم ابتدا پیش بینی بخش‌های گفتار براساس محیط  اطراف آن‌ و  سپس متن به متن را آموزش داده شده است  این مدل پس از یادگیری  گفتار از متن، می‌تواند این کار را در وظایف تولید گفتار، از جمله تولید بخش‌هایی در وسط یک ضبط صوتی به کار گیرد. 

گفته می‌شود که «ویس باکس» همچنین قادر به ویرایش فعال کلیپ‌های صوتی، حذف نویز از گفتار و حتی جایگزینی کلمات نادرست است. به گفته محققان، یک فرد می‌تواند تشخیص دهد که کدام بخش  گفتار توسط نویز خراب شده است آن را برش بزند  و به مدل دستور دهد تا آن بخش را بازسازی کند.

بااین‌حال، مدل «ویس‌باکس» یا کد منبع آن در اختیار عموم قرار نمی‌گیرد. متا اذعان کرده است که با توجه به ریسک‌های احتمالی فعلاً قصدی برای عرضه عمومی این مدل ندارد.

آن‌ها درحال‌حاضرصرفاً مقاله تحقیقاتی مقدماتی این مدل را منتشر کرده‌اند، اما امیدوارند که در آینده بتوانند از این فناوری برای کمک به افرادی که تارهای صوتی‌شان دچار مشکل شده است، و یا به عنوان دستیارهای صوتی استفاده کنند.

انتهای پیام/

منبع: آنا

کلیدواژه: هوش مصنوعی گفتار مصنوعی متا

درخواست حذف خبر:

«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را به‌طور اتوماتیک از وبسایت ana.press دریافت کرده‌است، لذا منبع این خبر، وبسایت «آنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۸۰۰۱۷۱۷ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتی‌که در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.

با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.

خبر بعدی:

جدول پخش سریال‌های شبکه تماشا تغییر کرد

کنداکتور شبکه تماشا از امروز با تغییراتی در پخش سریال‌های شرقی تغییر می‌کند. - اخبار فرهنگی -

به گزارش خبرگزاری تسنیم، با فرا رسیدن فصل بهار و در پیش رو بودن تابستان و طولانی‌تر شدن روزها و به تبع آن، تلاش برای ایجاد فرصتی مناسب برای بهر‌مندی مخاطبان از سریال‌های مورد علاقه‌شان، ساعت پخش سریال‌های پرطرفدار شرقی از امروز دوشنبه دهم اردیبهشت‌ماه تغییر می‌کند.

بر این اساس باکس سریال‌های شرقی شبکه تماشا از ساعت 19 به ساعت 21 منتقل می‌شود.

به این ترتیب سریال پوآرو از فردا ساعت 19 در باکس پلیسی، جنایی روی آنتن می‌رود. پوآرو که یک کارآگاه مشهور بلژیکی است، به همراه همکارش کاپیتان هستینگز پرونده‌های اسرار آمیز را حل می‌کند.

این سریال در ساعات 7 صبح، 1 بامداد و 13 روز بعد بازپخش خواهد شد.

بدقولی کنداکتوری تلویزیون این بار با برنامه «هفت»

در باکس سریال‌های شرقی که همیشه مخاطبان خاص خودش را دارد، با اتمام سریال پرطرفدار جامیونگ گو، سریال داستان بروسلی از فردا ساعت 21 روی آنتن خواهد رفت.

 سریال افسانه بروس لی پیرامون زندگی ورزشی و هنری بروس لی  از زمان تحصیل در مدرسه تا زمان مرگ است...

بازپخش این سریال ساعات 3 بامداد، 9 صبح و 15 روز بعد خواهد بود.

انتهای پیام/

دیگر خبرها

  • خودروهای آلاینده صوتی در تبریز توقیف می شوند
  • سیستم‌های صوتی XTRIM VX | تجربه حضور در یک کنسرت اختصاصی
  • رویداد اپل در راه است | آی‌پد پرو با تراشه M4 عرضه می‌شود
  • چین از مدل هوش مصنوعی تبدیل متن به ویدئو رونمایی کرد
  • جدول پخش سریال‌های شبکه تماشا تغییر کرد
  • آی پد پرو جدید با تراشه M۴ عرضه می شود
  • تبدیل افکار خاموش ذهن به گفتار| ابزاری که اندیشه را واژه می‌کند!
  • پنجره ترمال بریک نسل جدید چیست؟
  • تبدیل شدن به شریک تجاری جدید نفتی با عرضه نفت به پالایشگاه های کوچک و سهامداری در پالایشگاه های فراسرزمینی
  • تبدیل شدن به شریک تجاری جدید نفتی با تکیه بر عرضه نفت به پالایشگاه های کوچک و سهامداری در پالایشگاه های فراسرزمینی