دو سال از تولد چت جی پی تی میگذرد؛ انقلابی که دنیای فناوری را متحول کرد. این ابزار هوشمند، از همان روزهای اولیه، کاربران عادی و متخصصان را به وجد آورد و امکان مکالمه با یک سیستم پیشرفته را برای هر کسی با دسترسی به اینترنت فراهم ساخت. پاسخهای چت جی پی تی، اگرچه همیشه دقیق نیستند، اما منسجم و ساختارمند هستند و بسیاری از کاربران، حس تعامل با یک انسان را تجربه میکنند.
اما امروزه، شور و شوق اولیه جای خود را به رقابت سنگین شرکتهای بزرگ داده است. مایکروسافت با سرمایهگذاری کلان در OpenAI، توسعهدهنده چت جی پی تی و DALL-E، گامهای بلندی برداشته است. گوگل نیز با ارائه مدلهای رقابتی، خود را در این رقابت حفظ کرده است.
گارتنر، این دوره را “مرحله فروکش هیجان” نامیده است؛ یعنی کاهش علاقه به دنبال انتظارات غیر واقعی و عدم تحقق فوری آنها. این، یک چرخه طبیعی در تکامل فناوری است و گارتنر پیشبینی میکند که با شیبی ملایمتر، علاقه دوباره افزایش خواهد یافت.
اما جهش بزرگ بعدی چه زمانی خواهد آمد؟ آندری کارپاتی، یکی از خالقان چت جی پی تی، به محدودیتهای نسخههای فعلی اشاره میکند؛ زیرا آموزش این مدلها بر اساس دادههای موجود در اینترنت انجام شده و استفاده از دادههای بیشتر، بهبود قابل توجهی به همراه نخواهد داشت.
آلوارو باربرو، از موسسه مهندسی دانش، اعتقاد دارد برای پیشرفت اساسی، نیاز به نوآوری در معماری الگوریتمی است، مانند آنچه در سال ۲۰۱۷ با توسعه ترانسفورماتورها اتفاق افتاد.
موضوع سودآوری نیز چالش بزرگی است. سرمایهگذاران در مورد بازگشت سرمایه در زمینه هوش مصنوعی مولد، تردید دارند. OpenAI با وجود دریافت سرمایههای هنگفت، هنوز به سودآوری نرسیده و عرضه نسخه چت جی پی تی 5 نیز با تاخیر مواجه شده است. پیشبینی میشود OpenAI تا سال ۲۰۲۹ به سوددهی نرسد، در حالی که هزینههای ماهانه آن به حدود پانصد میلیون دلار میرسد. هزینههای آموزش مدلها نیز تا پایان سال 2024 به 7 میلیارد دلار خواهد رسید.
به هر حال، چت جی پی تی تحولی شگرف در زمینه هوش مصنوعی ایجاد کرده است. این سیستم کاربردهای نوآورانهای در خلاصهسازی متن، ترجمه، و استخراج اطلاعات دارد، اما محدودیتهایی مانند اتکا به اطلاعات ناقص و نتیجهگیریهای غیردقیق نیز دارد. همچنین، استفاده از این فناوری در تولید تصویر و ویدیو، خطرات دیپفیک و حملههای سایبری پیچیده را به همراه دارد.
یکی از جدیدترین دستاوردها، سیستمهای چند وجهی هستند که متن، تصویر و صدا را ترکیب میکنند. نسخههای جدید چت جی پی تی یا Gemini میتوانند تصویری از یخچال شما را تجزیه و تحلیل کنند و پیشنهاد غذایی ارائه دهند. اما این خروجیها بر اساس پیشبینیهای شهودی و نه استدلال منطقی هستند.
گام بعدی، بررسی توانایی این مدلها در تعامل مستقل با دیگران است. آیا چت جی پی تی میتواند بلیط هواپیما یا هتل رزرو کند؟
کارشناسان معتقدند برای پیشرفت واقعی، به عناصر دیگری مانند دانش واقعی، منطق استنتاجی و در نهایت، عقل سلیم نیاز است. آقای آلتمن از هوش مصنوعی جامع (AGI) صحبت میکند که به توانایی انسان برابر یا فراتر است. اما رسیدن به این نقطه هنوز مدت زمان زیادی میطلبد.