در یک گام نوآورانه و تحولآفرین در عرصه هوش مصنوعی، مایکروسافت از مدل Fara-7B رونمایی کرده است. این عامل هوش مصنوعی نهتنها به دلیل اجرای مستقیم وظایف روی دستگاه کاربر (لوکال) مورد توجه قرار گرفته، بلکه با عملکردی فراتر از مدلهای قدرتمند ابری همچون GPT-4o، تضمینکننده حریم خصوصی و حاکمیت کامل دادهها محسوب میشود. معرفی Fara-7B، رویکردی تازه به تعامل انسان و رایانه ارائه میدهد که امنیت اطلاعات حساس را در اولویت قرار میدهد و دریچهای جدید به سوی کاربردهای هوش مصنوعی در صنایع با قوانین سختگیرانه میگشاید.
Fara-7B: عامل هوش مصنوعی لوکال با قابلیتهای انقلابی
Fara-7B، یک مدل ۷ میلیارد پارامتری، بهعنوان یک «عامل هوش مصنوعی کاربرکامپیوتر» (Computer Use Agent) طراحی شده است. این مدل برخلاف بسیاری از هوشهای مصنوعی رایج که پردازش اطلاعات را در سرورهای ابری انجام میدهند، وظایف پیچیده را مستقیماً روی رایانه شخصی کاربر اجرا میکند. این رویکرد لوکال، به دادههای حساس اجازه نمیدهد که دستگاه را ترک کنند و بدین ترتیب، امنیت و کنترل بیسابقهای بر اطلاعات فراهم میآورد.

مکانیزم تعامل Fara-7B با رابط کاربری کاملاً منحصر به فرد است. این مدل، با شبیهسازی رفتار انسان، از ماوس و کیبورد برای اجرای دستورات استفاده میکند. اما نکته کلیدی در نحوه "دیدن" صفحه است: Fara-7B با تحلیل بصری اسکرینشاتها و تمرکز بر دادههای گرافیکی پیکسلها، مختصات دقیق کلیکها، تایپها و اسکرولها را پیشبینی میکند. این تمایز بزرگ آن را از سیستمهای وابسته به "accessibility trees" جدا میکند و امکان عملکرد بینقص حتی در پیچیدهترین وبسایتها و اپلیکیشنها را فراهم میسازد.
Fara-7B، پیشگام در حریم خصوصی دادهها با معماری لوکال
یکی از برجستهترین ویژگیهای هوش مصنوعی لوکال Fara-7B، تضمین حاکمیت کامل دادهها یا "pixel sovereignty" است. این رویکرد به معنای آن است که اطلاعات حساس، اعم از دادههای شرکتی یا جزئیات حسابهای داخلی، هرگز دستگاه کاربر را ترک نمیکنند. این سطح از امنیت برای صنایعی که تحت قوانین سختگیرانه حفاظت از دادهها فعالیت میکنند، نظیر HIPAA (قوانین حریم خصوصی سلامت) و GLBA (قوانین گرام-لیچ-بلایلی برای خدمات مالی)، ایدهآل است.
با اجرای لوکال، Fara-7B به سازمانها این امکان را میدهد که بدون نگرانی از نشت دادهها یا قرار گرفتن در معرض خطرات ابری، از پتانسیل هوش مصنوعی بهرهمند شوند. این مدل با فشردهسازی دادههای تعاملی تولیدشده توسط سیستمهای چندعاملی Magentic-One و WebSurfer آموزش دیده است و از مدل پایه Qwen2.5-VL-7B بهره میبرد که پنجره متنی بلند و توانایی بالایی در ارتباط دادن دستورات متنی با عناصر تصویری صفحه دارد.
عملکرد خیرهکننده Fara-7B در رقابت با غولهای هوش مصنوعی
در آزمونهای معتبر و معیارهای سنجش عملکرد، Fara-7B مایکروسافت توانسته است بر رقبای قدرتمندی همچون GPT-4o پیشی گیرد که نشاندهنده پتانسیل بالای این هوش مصنوعی لوکال است. در آزمایشهای معیار WebVoyager، نتایج چشمگیری به دست آمد:
Fara-7B: نرخ موفقیت ۷۳.۵٪
GPT-4o: نرخ موفقیت ۶۵.۱٪
UI-TARS-1.5-7B: نرخ موفقیت ۶۶.۴٪
این آمار نه تنها برتری Fara-7B را در انجام وظایف با دقت بالاتر نشان میدهد، بلکه در زمینه کارایی نیز این مدل عملکرد بهینهتری ارائه کرده است. Fara-7B وظایف را با میانگین ۱۶ مرحله انجام میدهد، در حالی که مدل UI-TARS به طور متوسط به ۴۱ مرحله نیاز دارد. این کارایی، سرعت و دقت بالاتر را در کنار حفظ حریم خصوصی دادهها، به ارمغان میآورد.
محدودیتها و چشمانداز آینده هوش مصنوعی لوکال Fara-7B
همانند هر فناوری نوظهور دیگری، هوش مصنوعی Fara-7B نیز با محدودیتهایی همراه است. مایکروسافت اذعان دارد که این مدل ممکن است در برابر دستورات بسیار پیچیده خطا کند یا دچار "توهمزایی" (hallucination) شود؛ پدیدهای که در آن هوش مصنوعی اطلاعات نادرست یا بیربط تولید میکند. برای مقابله با این ریسکها، سیستمی برای شناسایی "نقاط بحرانی" (Critical Points) توسعه یافته است. در این نقاط، برای انجام اقداماتی که نیاز به دادههای شخصی یا رضایت صریح کاربر دارند (مانند ارسال ایمیل یا تراکنش مالی)، حتماً از کاربر اجازه گرفته میشود.
مایکروسافت این مدل را با مجوز MIT در پلتفرمهایی مانند Hugging Face و Microsoft Foundry منتشر کرده است، اما تأکید میکند که Fara-7B در حال حاضر بیشتر برای پروژههای تحقیقاتی و نمونهسازی مناسب است و هنوز برای استفاده در محیطهای حیاتی و پرریسک آماده نیست. با این وجود، Fara-7B نویدبخش آیندهای روشن برای هوش مصنوعی لوکال است؛ آیندهای که در آن تعامل هوش مصنوعی با رایانههای شخصی هم امنتر، هم کارآمدتر و هم با حریم خصوصی بیشتر همراه خواهد بود.
مطالب مرتبط
- نوکیا با سرمایهگذاری چهار میلیارد دلاری، توسعه شبکههای مبتنی بر هوش مصنوعی را در آمریکا شتاب میبخشد
- مایکروسافت با عرضه Copilot برای کروم، هوش مصنوعی را به مرورگر محبوب کاربران میآورد
- مدل هوش مصنوعی GraphCast گوگل، پیشبینی آبوهوا را با سرعتی بیسابقه و دقتی فراتر از ابررایانهها متحول کرد
- مایکروسافت با عرضه Copilot برای کروم، هوش مصنوعی را به مرورگر محبوب کاربران میآورد

سینا علیپور
او دانشجوی رشته مهندسی کامپیوتر در مقطع کارشناسی است و فعالیت حرفهای خود را در عرصه رسانه از سال ۱۳۹۸ با یک بلاگ شخصی در حوزه فناوری آغاز کرده است. وی پس از مدتی به عنوان نویسنده آزاد در مجلههای آنلاین تکنولوژی فعالیت کرد و در حال حاضر، دبیر سرویس نقد و بررسی گجتهای هوشمند در یک مجله معتبر تکنولوژی است.