قابلیت جدید هوش مصنوعی برای تولید تصاویر بر اساس کپشن

۱۲ مهر ۱۳۹۹ - ۰۹:۴۳


پژوهشگران مؤسسه‌ی هوش مصنوعی آلن، الگوریتمی را طراحی کردند که قادر است بر اساس توصیفی متنی، تصاویر مختلفی را تولید کند.


پژوهشگران مؤسسه‌ی هوش مصنوعی آلن (AI2)، الگوریتم یادگیری ماشینی را طراحی کردند که قادر است تنها بر اساس کپشن‌های متنی، تصاویری را تولید کند. نتایج کمی ترسناک هستند اما گامی مهم در جهت پژوهش‌های هوش مصنوعی و پردازش تصویر به شمار می‌روند. بر خلاف الگوریتم‌های دیگر یادگیری ماشین، این الگوریتم صرفا آزمایشی در جهت اثبات قابلیت‌های هوش مصنوعی است. ایده‌ی اصلی ساخت مدل بینایی کامپیوتری بود که قادر است تصاویر را بر اساس آنچه در تصویر می‌بیند کپشن‌گذاری کند یا برعکس تصاویر را بر اساس کپشن آن‌ها تولید کند.

مدل به دست‌آمده، محدودیت‌های الگوریتم‌های بینایی کامپیوتر را ثابت کرد. حتی یک کودک هم می‌تواند تصاویر را با کلمات توصیف کند یا با شنیدن کلمه‌ای تصویر آن را در ذهن خود تجسم کند؛ اما پژوهشگران مؤسسه‌ی آلن در پیاده‌سازی این فرآیند روی  مدلی به نام LXMERT به نتایج خوبی نرسیدند. این سیستم با دریافت کپشن، خروجی‌های عجیب و دور از واقعیتی را برگرداند.


پژوهشگران با اعمال تغییراتی در LXMERT مدلX-LXMERT را ساختند. با اینکه نتایج X-LXMERT کاملا منطبق با کپشن ورودی نبودند، حداقل تصاویر قابل درکی تولید کرد. با اینکه محدودیت‌ها و نتایج X-LXMERT چندان الهام بخش تحولات AI نیستند، روش ماسک‌گذاری به کار رفته در این سیستم، اولین گام مهم در آموزش عمل «جای گذاری» به هوش مصنوعی است. یکی از پیامدهای مثبت پژوهش فوق، بهبود بینایی کامپیوتر و تشخیص چهره است. به بیان دیگر هرچقدر توانایی کامپیوتر در درک مفاهیم توصیفی یک تصویر یا ویرایش تصویر افزایش پیدا کند، قادر به اعمال وظایف پیچیده‌تری روی تصاویر خواهد بود.

نظرات کاربران
  • نام کاربری

    آموزش ایجاد طرح گرافیکی سایت در فتوشاپ ، تبدیل طرح گرافیکی به قالب وردپرسی و ووکامرسی آموزش ایجاد طرح گرافیکی سایت در فتوشاپ ، تبدیل طرح گرافیکی به قالب وردپرسی و ووکامرسی

    • نام کاربری

      آموزش ایجاد طرح گرافیکی سایت در فتوشاپ ، تبدیل طرح گرافیکی به قالب وردپرسی و ووکامرسی آموزش ایجاد طرح گرافیکی سایت در فتوشاپ ، تبدیل طرح گرافیکی به قالب وردپرسی و ووکامرسی

نظر خود را با ما در میان بگذارید