**چالش چتباتها در حل مسائل ریاضی**
رباتهای چت مانند کلود و جمینای با وجود هوشمندی، در حل مسئلههای ریاضی ابتدایی نیز ناتوان هستند. دلیل اصلی این ضعف، فرایند رمزگذاری است که اطلاعات را به قطعات کوچکتر تقسیم میکند و باعث از بین رفتن روابط بین اعداد میشود.
علاوه بر این، هوش مصنوعی بهعنوان ماشینهای آماری، الگوهایی را از دادههای آموزشی یاد میگیرد. هنگامی که از چتباتی مانند ChatGPT خواسته میشود مسئلهای ضرب را حل کند، ممکن است بر اساس الگوهای اشتباهی که از قبل آموخته، به نتیجهای نادرست برسد.
به عنوان مثال، ChatGPT ممکن است بر اساس تجربه قبلی خود، تشخیص دهد که ضرب اعدادی که به 7 و 2 ختم میشوند، باید به 4 ختم شود. با این حال، در هنگام ضرب قسمتهای وسط اعداد، ممکن است دچار اشتباه شود و پاسخ اشتباهی ارائه دهد.
تحقیقاتی که توسط یونتین دینگ، استاد هوش مصنوعی در دانشگاه واترلو انجام شده، ضعف چتباتها در ضرب اعداد را بهطور گسترده بررسی کرده است. نتایج نشان میدهد که مدل GPT-4o در ضرب اعدادی با بیش از 4 رقم دچار مشکل میشود.
دینگ میگوید: «محاسبات ضرب برای مدلهای زبانی یک چالش است، زیرا هر اشتباه در هر مرحله میتواند به مراحل بعدی منتقل شود و منجر به نتیجه اشتباه نهایی شود.»
با این وجود، دینگ نسبت به آینده خوشبین است. مدل O1، که مدل استنتاجی OpenAI است، نتایج بهتری در ضرب اعداد نشان داده است. وی توضیح میدهد که این مدل ممکن است از روشهای متفاوتی برای حل ضرب استفاده کند که میتواند منجر به درک عمیقتری از نحوه تفکر مدلهای هوش مصنوعی شود.