وبلاگ
هوش مصنوعی جدید انویدیا معرفی شد؛ تولید صدا از دستورات متنی + ویدیو

هوش مصنوعی جدید انویدیا معرفی شد؛ تولید صدا از دستورات متنی + ویدیو


انویدیا به‌تازگی مدل هوش مصنوعی جدیدی به نام Fugatto را معرفی کرده است که می‌تواند دستورات متنی کاربران را به صدا تبدیل یا با استفاده از این دستورها، فایل‌های صوتی را ویرایش کند.

انویدیا پادشاه مطلق بازار تراشه‌های هوش مصنوعی است، اما این شرکت در زمینه ساخت مدل‌های نرم‌افزاری هوش مصنوعی نیز ازجمله پیشگامان محسوب می‌شود. جدیدترین مدل هوش مصنوعی معرفی شده توسط انویدیا که این شرکت آن را «چاقوی سوئیسی برای صدا» توصیف می‌کند، می‌تواند ابزاری بسیار کاربردی برای تولیدکنندگان محتواهای ویدیویی باشد.

آخرین مطالب
ادامه مطلب
بهترین برنامه های آنفالویاب اینستاگرام در سال ۲۰۲۴ کدامند؟

Fugatto هنوز به‌صورت عمومی در دسترس کاربران قرار نگرفته است

به گفته انویدیا، مدل «Foundational Generative Audio Transformer Opus 1» یا به‌اختصار Fugatto می‌تواند دستوراتش را به‌صورت متنی از کاربران دریافت کرده و منطبق با این دستورات، فایل‌های صوتی بسازد. کاربران همچنین می‌توانند از Fugatto برای ویرایش فایل‌های صوتی ازپیش‌ساخته شده نیز استفاده کنند.

این مدل هوش مصنوعی توسط تیمی از متخصصان این حوزه در سراسر جهان ساخته شده. همچنین انویدیا می‌گوید که این موضوع باعث قوی‌تر شدن قابلیت‌های چندزبانی و چندلهجه‌ای Fugatto شده است.

«رافائل واله»، یکی از محققان این پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا، دراین‌باره می‌گوید قصد آن‌ها ساخت مدلی بوده که صدا را مانند انسان‌ها درک و تولید کند. انویدیا برخی از سناریوهای احتمالی برای استفاده از این مدل در دنیای واقعی را فهرست کرده که Fugatto می‌تواند برای آنها کاربردی باشد.

برای مثال، تولیدکنندگان موسیقی می‌توانند از این مدل هوش مصنوعی برای تولید نمونه‌های اولیه یک آهنگ استفاده کرده و سپس به‌راحتی آن را ویرایش کنند. مردم عادی، تولیدکنندگان محتوا و توسعه‌دهندگان بازی‌های ویدیویی نیز می‌توانند نهایت استفاده را از قابلیت‌های مدل Fugatto ببرند. البته Fugatto هنوز به‌صورت عمومی در دسترس کاربران قرار ندارد، و انویدیا نیز نگفته که چه زمانی دسترسی عمومی به آن فراهم می‌شود.

ادامه مطلب
ایکس درحال توسعه قابلیت‌های جدیدی برای هوش مصنوعی Grok است

شرکت‌های متا و گوگل نیز پیش‌ازاین مدل‌های هوش مصنوعی مشابهی را معرفی کرده بودند که می‌توانست دستورات متنی کاربران را به صدا تبدیل کند. مدل هوش مصنوعی گوگل MusicLM نام دارد و کاربران می‌توانند از طریق وب‌سایت AI Test Kitchen به آن دسترسی داشته باشند.

فهرست مطالب

دسته بندی ها

درباره ما

ما که هستیم

مجموعه فالو ارزانی از سال 1397 اغاز به کار کرد.شعار ما ارائه خدمات با کیفیت در گرو رفع نیاز کاربران وب و شبکه های اجتماعی می باشد.

خدمات اینستاگرام

آخرین مقالات