اپلیکیشن و نرم افزارهنر و فناوری

تولید تصویر با وضوح بالا در چند ثانیه با هوش مصنوعی Sana

کانال تلگرام  رسانه فناوری هوشمند

محققان انویدیا، دانشگاه MIT و «دانشگاه چینهوا» چین مدل هوش مصنوعی جدیدی با نام Sana معرفی کرده‌اند که می‌تواند در چند ثانیه تصاویری با وضوح ۴۰۹۶ در ۴۰۹۶ پیکسل تولید کند.

محققان در صفحه گیت‌هاب Sana توضیح می‌دهند برخلاف مدل‌های هوش مصنوعی قدیمی که تصاویر را ۸ برابر فشرده می‌کنند، Sana می‌تواند تصاویر را ۳۲ برابر فشرده کند و تعداد توکن‌های موردنیاز را کاهش بدهد.

علاوه‌براین، این هوش مصنوعی از مدل زبانی Gemma به‌جای رمزگذار متن خود برای بهبود عملکرد درک و استنتاج سریع استفاده می‌کند. محققان همچنین برای کاهش مراحل نمونه‌گیری آن از مکانیزمی با نام «Flow-DPM-Solver» استفاده کرده‌اند که اساساً تعداد مراحل نمونه‌گیری را از ۲۸-۵۰ به ۱۴-۲۰ کاهش می‌دهد.

بیشتر بخوانید: مقابله با دره‌ی عجیب و غریب (uncanny valley) هوش مصنوعی مولد

تصاویر زیر با هوش مصنوعی سنا تولید شده‌اند:Previous

عملکرد Sana در برابر سایر مدل‌های هوش مصنوعی

آن‌ها ادعا کرده‌اند مدل Sana-0.6B می‌تواند با مدل‌های غول‌پیکر مدرن مانند Flux-12B رقابت کند و ۲۰ برابر کوچک‌تر و بیشتر از ۱۰۰ برابر در اندازه‌گیری سریع‌تر باشد. همچنین Sana-0.6B را می‌توان روی پردازشگر گرافیکی لپ‌تاپ ۱۶ گیگابایتی اجرا کرد.

نمودار زیر مدت تولید تصویر توسط مدل سنا را با سایر مدل‌ها مقایسه می‌کند. طبق این نمودار برای مثال مدل SANA-1.6B با ۱.۶ میلیارد پارامتر می‌تواند در ۱.۲ ثانیه تصویری با وضوح ۱۰۲۴ در ۱۰۲۴ پیکسل تولید کند.

نمودار زیر مدت تولید تصویر توسط مدل Sana را با سایر مدل‌ها مقایسه می‌کن

هم‌اکنون از طریق گیت‌هاب می‌توانید نسخه اولیه سنا را آزمایش کنید و محققان وعده داده‌اند کد منبع آن را به‌زودی منتشر می‌کنند.

منبع: دیجایتو

بیشتر بخوانید: بلاک‌چین و هوش مصنوعی مولد: تیم رویایی فناوری

  • تولید تصویر با وضوح بالا در چند ثانیه با هوش مصنوعی سنا
کانال تلگرام  رسانه فناوری هوشمند

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا