ادینبرو، بریتانیا – پژوهشهای جدید نشان میدهد که علیرغم پیشرفتهای چشمگیر در زمینه هوش مصنوعی، بسیاری از سیستمهای پیشرفته هنوز در درک مفاهیم سادهای همچون خواندن ساعتهای آنالوگ و تفسیر تقویمها با مشکل مواجه هستند. این یافتهها در حالی منتشر میشود که همین مدلهای هوش مصنوعی قادر به انجام وظایف پیچیدهای مانند نوشتن مقالات و خلق آثار هنری هستند.
به گزارش ایتنا و به نقل از ساینسدیلی، تیمی از محققان دانشگاه ادینبرو دریافتهاند که مدلهای زبان بزرگ چندوجهی (MLLMs)، که توانایی پردازش همزمان متن و تصویر را دارند، نمیتوانند به درستی موقعیت عقربههای ساعت را تفسیر کرده یا به سوالات مربوط به تاریخها در تقویم پاسخ دقیق دهند.
دانشمندان معتقدند که برخلاف تشخیص ساده اشکال، درک ساعتهای آنالوگ و تقویمها نیازمند ترکیبی از مهارتهای فضایی، درک زمینه و ریاضیات پایه است؛ عناصری که همچنان به عنوان چالشهایی اساسی برای سیستمهای هوش مصنوعی مطرح هستند. رفع این چالشها میتواند راه را برای استفاده موثر از هوش مصنوعی در کاربردهای وابسته به زمان، از جمله دستیارهای زمانبندی، رباتهای خودکار و ابزارهای کمکی برای افراد دارای اختلال بینایی، هموار سازد.

در این پژوهش، محققان مدلهای MLLMs را در معرض تصاویری از ساعتهای مختلف (شامل ساعتهای با اعداد رومی، بدون عقربه ثانیهشمار و با صفحههای رنگی متنوع) و تقویمها قرار دادند و از آنها خواستند به سوالات مرتبط با زمان پاسخ دهند. نتایج آزمایشها نشان داد که این سیستمهای هوش مصنوعی در بهترین حالت، موقعیت عقربههای ساعت را کمتر از یکچهارم مواقع به درستی تشخیص دادهاند. این میزان دقت زمانی که ساعتها دارای اعداد رومی یا عقربههای تزئینی بودند، به مراتب کاهش یافت. حتی حذف عقربه ثانیهشمار نیز نتوانست عملکرد مدلها را بهبود بخشد، که به گفته تیم پژوهشی، نشاندهنده مشکلات بنیادین در تشخیص عقربهها و تفسیر زوایای آنها است.
در بخش دیگری از این تحقیق، از مدلهای هوش مصنوعی خواسته شد تا به سوالاتی در مورد تقویم پاسخ دهند، از جمله تشخیص تعطیلات یا محاسبه تاریخهای گذشته و آینده. نتایج این بخش نیز نشان داد که حتی پیشرفتهترین مدلها نیز در حدود یکپنجم موارد در محاسبه تاریخها دچار اشتباه شدهاند.
این یافتهها که در یک مقاله مورد داوری علمی قرار گرفته، منتشر شده و قرار است در کارگاه «استدلال و برنامهریزی برای مدلهای زبانی بزرگ» در کنفرانس بینالمللی بازنماییهای یادگیری (ICLR) در سنگاپور ارائه شود.
روهیت ساکسنا، رهبر این پژوهش از دانشگاه ادینبرو، میگوید: «اکثر مردم از سنین پایین قادر به خواندن ساعت و استفاده از تقویم هستند. یافتههای ما نشاندهنده یک شکاف قابل توجه در توانایی هوش مصنوعی برای انجام مهارتهایی است که برای انسانها بسیار ابتدایی محسوب میشوند. اگر قصد داریم این سیستمها را به طور موثر در کاربردهای واقعی و حساس به زمان ادغام کنیم، لازم است این کمبودها برطرف شوند.»
آریو جما، دیگر پژوهشگر این تیم، با تاکید بر اهمیت توجه به این چالشهای بنیادین میافزاید: «در حالی که تحقیقات کنونی در حوزه هوش مصنوعی اغلب بر وظایف پیچیده تمرکز دارد، به طرز جالبی بسیاری از سیستمها هنوز در انجام کارهای ساده و روزمره ناتوان هستند. یافتههای ما نشان میدهد که زمان آن رسیده است تا این خلأهای اساسی را جدی بگیریم، وگرنه ممکن است کاربردهای عملی هوش مصنوعی همواره در لحظه آخر با مشکل مواجه شوند.»
اخبار تکنولوژی را در هارپی تک بخوانید