در یک گردهمایی محرمانه علمی که در ماه مه گذشته در شهر برکلی ایالت کالیفرنیا برگزار شد، یک چتبات هوش مصنوعی توانست با حل مسائل دشوار ریاضی، ۳۰ نفر از برجستهترین ریاضیدانان جهان را شگفتزده کند و عملکردی فراتر از انتظار به نمایش بگذارد.
رقابت علمی با چتبات پیشرفته o4-mini
این رویداد که با نام پروژه FrontierMath شناخته میشود، شامل مجموعهای از ۳۰۰ سؤال پیچیده و بدون پاسخ در حوزههای مختلف ریاضی بود. در این رقابت، چتباتی به نام o4-mini که بر پایه مدلهای زبانی توسعهیافته توسط شرکت OpenAI طراحی شده، موفق شد حدود ۲۰ درصد از این پرسشها را حل کند؛ در حالی که مدلهای سنتی تنها قادر به پاسخگویی به کمتر از ۲ درصد آنها بودند.
این چتبات با بهرهگیری از دادههای تخصصی و بازخورد انسانی، توانایی استدلال و تحلیل مسائل سطح دانشگاهی تا تحقیقاتی را بهدست آورده و بهعنوان یکی از پیشرفتهترین نمونههای هوش مصنوعی در حوزه ریاضیات شناخته میشود.
واکنش متخصصان و چالش نهایی
در روز پایانی این گردهمایی، کن اونو، ریاضیدان برجسته دانشگاه ویرجینیا، یک مسئله باز در نظریه اعداد را مطرح کرد؛ مسئلهای که معمولاً در سطح دکترا مورد بررسی قرار میگیرد. چتبات o4-mini تنها در عرض ۱۰ دقیقه با تحلیل منابع مرتبط، سادهسازی مسئله و ارائه پاسخ دقیق، حضار را شگفتزده کرد.
اونو در واکنش به این عملکرد گفت: «برخی از همکارانم معتقدند که این مدلها در حال نزدیک شدن به سطح نبوغ ریاضی هستند.»
آینده ریاضیات در عصر هوش مصنوعی
در پایان این نشست علمی، شرکتکنندگان به بررسی تأثیر هوش مصنوعی بر آینده ریاضیات پرداختند. بسیاری از ریاضیدانان بر این باور بودند که نقش انسان در این حوزه ممکن است به سمت طراحی مسئله و همکاری با سامانههای استدلالی تغییر کند.

اونو همچنین تأکید کرد که برای حفظ جایگاه انسان در علم ریاضی، پرورش خلاقیت در آموزش عالی باید در اولویت قرار گیرد. این تحول میتواند آغازگر عصری جدید در پژوهشهای ریاضی باشد؛ عصری که در آن انسان و ماشین در کنار یکدیگر به کشف ناشناختهها میپردازند.

سینا علیپور
او دانشجوی رشته مهندسی کامپیوتر در مقطع کارشناسی است و فعالیت حرفهای خود را در عرصه رسانه از سال ۱۳۹۸ با یک بلاگ شخصی در حوزه فناوری آغاز کرده است. وی پس از مدتی به عنوان نویسنده آزاد در مجلههای آنلاین تکنولوژی فعالیت کرد و در حال حاضر، دبیر سرویس نقد و بررسی گجتهای هوشمند در یک مجله معتبر تکنولوژی است.