قابلیت جدید هوش مصنوعی برای تولید تصاویر بر اساس کپشن
پژوهشگران مؤسسهی هوش مصنوعی آلن، الگوریتمی را طراحی کردند که قادر است بر اساس توصیفی متنی، تصاویر مختلفی را تولید کند.
پژوهشگران مؤسسهی هوش مصنوعی آلن (AI2)، الگوریتم یادگیری ماشینی را طراحی کردند که قادر است تنها بر اساس کپشنهای متنی، تصاویری را تولید کند. نتایج کمی ترسناک هستند اما گامی مهم در جهت پژوهشهای هوش مصنوعی و پردازش تصویر به شمار میروند. بر خلاف الگوریتمهای دیگر یادگیری ماشین، این الگوریتم صرفا آزمایشی در جهت اثبات قابلیتهای هوش مصنوعی است. ایدهی اصلی ساخت مدل بینایی کامپیوتری بود که قادر است تصاویر را بر اساس آنچه در تصویر میبیند کپشنگذاری کند یا برعکس تصاویر را بر اساس کپشن آنها تولید کند.
مدل به دستآمده، محدودیتهای الگوریتمهای بینایی کامپیوتر را ثابت کرد. حتی یک کودک هم میتواند تصاویر را با کلمات توصیف کند یا با شنیدن کلمهای تصویر آن را در ذهن خود تجسم کند؛ اما پژوهشگران مؤسسهی آلن در پیادهسازی این فرآیند روی مدلی به نام LXMERT به نتایج خوبی نرسیدند. این سیستم با دریافت کپشن، خروجیهای عجیب و دور از واقعیتی را برگرداند.
پژوهشگران با اعمال تغییراتی در LXMERT مدلX-LXMERT را ساختند. با اینکه نتایج X-LXMERT کاملا منطبق با کپشن ورودی نبودند، حداقل تصاویر قابل درکی تولید کرد. با اینکه محدودیتها و نتایج X-LXMERT چندان الهام بخش تحولات AI نیستند، روش ماسکگذاری به کار رفته در این سیستم، اولین گام مهم در آموزش عمل «جای گذاری» به هوش مصنوعی است. یکی از پیامدهای مثبت پژوهش فوق، بهبود بینایی کامپیوتر و تشخیص چهره است. به بیان دیگر هرچقدر توانایی کامپیوتر در درک مفاهیم توصیفی یک تصویر یا ویرایش تصویر افزایش پیدا کند، قادر به اعمال وظایف پیچیدهتری روی تصاویر خواهد بود.
نظرات کاربران
نام کاربری
آموزش ایجاد طرح گرافیکی سایت در فتوشاپ ، تبدیل طرح گرافیکی به قالب وردپرسی و ووکامرسی آموزش ایجاد طرح گرافیکی سایت در فتوشاپ ، تبدیل طرح گرافیکی به قالب وردپرسی و ووکامرسی