چت‌بات‌ هوش مصنوعی پزشکان را در تشخیص بیماری شکست داد

در پژوهشی با همکاری دکتر رودمن، عملکرد پزشکان در تشخیص بیماری با استفاده از چت‌بات GPT-4 مورد بررسی قرار گرفت. نتایج شگفت‌آوری را نشان داد: هرچند پزشکان با بهره‌گیری از این هوش مصنوعی، تنها اندکی بهتر از گروهی که به آن دسترسی نداشتند عمل کردند، اما خود چت‌بات به تنهایی دقت بالاتری از پزشکان نشان داد.

چت‌بات GPT-4، محصول شرکت OpenAI، در تشخیص بیماری از گزارش‌های بالینی و ارائه توضیحات منطقی، میانگین نمره ۹۰ درصد را کسب کرد. در مقابل، پزشکان گروه آزمایش با استفاده از چت‌بات به طور متوسط ۷۶ درصد و گروه بدون دسترسی به آن ۷۴ درصد نمره کسب کردند.

این مطالعه نشان داد که پزشکان گاه با وجود وجود شواهد متضاد، به تشخیص اولیه خود پایبند می‌مانند. به نظر می‌رسد آشنایی پزشکان با ابزارهای هوش مصنوعی کافی نبوده و آنان نتوانسته‌اند از توانایی‌های چت‌بات برای حل پیچیدگی‌های تشخیصی و ارائه توضیحات دقیق استفاده کنند.

پنجاه پزشک متخصص از چندین بیمارستان بزرگ آمریکا در این پژوهش شرکت داشتند. نتایج این تحقیق ماه گذشته در مجله JAMA Network Open منتشر شد.

شرکت‌کنندگان شش گزارش موردی دریافت کردند و بر اساس توانایی تشخیص و استدلال خود ارزیابی شدند. نمره نهایی آن‌ها شامل صحت تشخیص نیز می‌شد.

ارزیابی‌ها توسط متخصصان پزشکی مستقل انجام شد. این متخصصان بدون اطلاع از گروه شرکت‌کنندگان (پزشک با چت‌بات، پزشک بدون چت‌بات یا خود چت‌بات) پاسخ‌ها را بررسی کردند.

گزارش‌های موردی، برگرفته از پرونده‌های واقعی بیماران و بخشی از مجموعه ۱۰۵ موردی بودند که از دهه ۱۹۹۰ توسط محققان جمع‌آوری و تاکنون منتشر نشده بودند. این امر تضمین می‌کرد که چت‌بات پیش‌تر با این موارد آموزش ندیده است.

به منظور شفاف‌سازی، محققان یکی از این موارد (مورد یک بیمار ۷۶ ساله پس از آنژیوپلاستی با درد شدید کمر، باسن و ساق پا) را به همراه پاسخ پزشکان با نمرات بالا و پایین منتشر کردند. این بیمار علائمی مانند تب، خستگی، کم‌خونی و افزایش مواد زائد نیتروژن در خون داشت. ده سال پیش نیز عمل بای‌پس قلب انجام داده بود. تشخیص صحیح، آمبولی کلسترول بود.

شرکت‌کنندگان می‌بایست سه تشخیص احتمالی با دلایل و شواهد، و همچنین یافته‌های مغایر با تشخیص ارائه می‌دادند. آن‌ها همچنین باید تشخیص نهایی و سه گام کلیدی فرآیند تشخیص خود را توضیح می‌دادند.

اگرچه موارد مورد مطالعه آسان نبودند، اما به قدری نادر نبودند که غیرممکن به نظر برسند. با این حال، عملکرد پزشکان به طور متوسط پایین‌تر از چت‌بات بود.

مجله تکنولوژی هارپی تک

سردبیر

سینا علیپور

او دانشجوی رشته مهندسی کامپیوتر در مقطع کارشناسی است و فعالیت حرفه‌ای خود را در عرصه رسانه از سال ۱۳۹۸ با یک بلاگ شخصی در حوزه فناوری آغاز کرده است. وی پس از مدتی به عنوان نویسنده آزاد در مجله‌های آنلاین تکنولوژی فعالیت کرد و در حال حاضر، دبیر سرویس نقد و بررسی گجت‌های هوشمند در یک مجله معتبر تکنولوژی است.

مطالب بیشتر

انقلاب هوش مصنوعی در دولت انگلیس؛ صرفه‌جویی ۴۰ میلیارد پوندی و تحول خدمات عمومی

گزارشی جدید از اتاق فکر سر تونی بلر و شرکت فناوری Faculty نشان می‌دهد که استفاده از هوش مصنوعی در دولت انگلیس می‌تواند طی ۵ سال آینده تا ۲۰۰ میلیارد پوند در هزینه‌های دولت صرفه‌جویی کند. این بدان معناست که به طور متوسط سالانه ۴۰ میلیارد پوند از هزینه‌های دولت…

معرفی جیتکس دبی 2024 | از شرکت‌های برتر تا سانس‌ها

**نمایشگاه جیتکس گلوبال: جایی که آینده فناوری شکل می گیرد** نمایشگاه جیتکس گلوبال در دبی، رویدادی برجسته در عرصه فناوری جهانی، برترین نوآوری ها را به نمایش می گذارد و تبادل دانش را در حوزه های مختلف فناوری تسهیل می کند. از سال 1981، جیتکس به یکی از معتبرترین و…

شایعه داغ: آیا گلکسی زد فولد ۷ سامسونگ از قلم S Pen محروم است؟

در آستانه‌ی رونمایی رسمی سامسونگ از جدیدترین پرچم‌دار تاشدنی خود، گلکسی زد فولد ۷، که قرار است فردا پرده‌برداری شود، یک شایعه مهم در فضای مجازی منتشر شده است. با وجود اینکه طی روزهای اخیر بسیاری از مشخصات سخت‌افزاری این گوشی فاش شده بود، به نظر می‌رسد هنوز هم اطلاعات…