پرش به محتوای اصلی

تبدیل متن به ویدیو در متا با هوش مصنوعی

متا از یک هوش مصنوعی برای تبدیل متن به ویدیو رونمایی کرد

در سال اخیر سیستم‌های هوش مصنوعی مختص تبدیل متن به تصویر، بسیار بحث برانگیز شده است.

حالا در این میان، محققان هوش مصنوعی شاغل در شرکت متا، از یک سیستم هوشمند برای تبدیل متن به ویدیو رونمایی کرده‌اند.

این سیستم Make-A-Video نام دارد و با دریافت توصیفی از موضوع دلخواه، می‌تواند ویدیوی کوتاهی در رابطه با متن نوشته شده ایجاد کند.

مصنوعی بودن این ویدیو‌ها و تصاویر به وضوح مشخص است اما در هر صورت همین سیستم از پیشرفت فوق‌العاده در این حوزه خبر می‌دهد.

 

مارک زاکربرگ، مدیرعامل متا، در پست منتشر شده این سیستم را یک «پیشرفت حیرت‌انگیز» توصیف کرده و گفته:«تولید ویدیو توسط هوش مصنوعی بسیار سخت‌تر از تصاویر است زیرا در کنار خلق هر پیکسل، سیستم موردنظر باید روند تغییر پیکسل را هم پیش‌بینی کند.»

کلیپ‌ها طولانی‌تر از ۵ ثانیه نیستند و صدا ندارند ولی در کل طیف وسیعی از درخواست‌ها را در بر می‌گیرند.

در ادامه‌ی این مطلب می‌توانید تعدادی از ,ویدیو هایی که از طرف متا منتشر شده است را ببینید.

با توجه به اینکه خارج از متا هنوز کسی به این سیستم دسترسی ندارد، احتمالا بهترین کلیپ‌ها از طرف این شرکت انتخاب شده‌اند.

 

متا اعلام کرده :

” تحقیقات مولد هوش مصنوعی با دادن ابزارهایی به مردم برای ایجاد آسان و سریع محتوای جدید، بیان خلاقانه را به‌جلو پیش خواهد برد. فقط با ارائه‌ی چند کلمه یا یک‌خط متن به Make-A-Video، این ابزار می‌تواند تخیل را زنده کرده و ویدئوهای منحصربه‌فردی را با رنگ‌ها و مناظر مختلف تولید کند.”

متا در پست وبلاگی خود پس از معرفی Make-A-Video، خاطرنشان می‌کند که ابزارهای تولید ویدئو مبتنی‌ بر هوش مصنوعی می‌توانند برای تولید کنندگان محتوا و هنرمندان بسیار ارزشمند باشند.

محققان متا می گویند که محدودیت‌های فنی مدل هوش مصنوعی تبدیل متن به ویدئو آن‌ها بیشتر از مشکلات کنونی مثل انیمیشن‌های ناهمگون یا ایجاد کلیپ‌های مبهم است. به‌عنوان مثال، روش‌های آموزشی آن‌ها نمی‌تواند اطلاعاتی که یک انسان از تماشای ویدئو استنباط می‌کند را یاد بگیرد. از دیگر مشکلات این مدل می‌توان به محدودیت در تولید ویدئوهای طولانی‌تر از پنج ‌ثانیه با صحنه‌ها و رویدادهای متعدد و همچنین وضوح بالاتر اشاره کرد.

Make-A-Video درحال‌حاضر ۱۶ فریم ویدئو را با وضوح ۶۴ در ۶۴ پیکسل تولید می‌کند که سپس با استفاده از یک مدل هوش مصنوعی مجزا، ابعاد آن‌ها را به ۷۶۸ در ۷۶۸ پیکسل ارتقا می‌دهد.

 

منبع: The Verge

موضوعات دیگر : طراحی سایت اختصاصی در مشهد

 

 

 

ترک یک پاسخ

منو نزدیک

راه های ارتباطی

آدرس: مشهد، بلوار قرنی، چهارراه مجد، مجتمع ضامن آهو، طبقه 7+، واحد 702
شماره تماس: 9150060027 - 09931726431