微软首款专为电脑操作设计的开源智能体小模型 Fara-7B 发布:支持 Win11 端侧运行,性能达同级最强
最新 11 月 25 日消息,当地时间 11 月 24 日,微软宣布推出全新的开源小型语言模型 Fara-7B,定位为专门用于计算机操作的“Agentic”模型,可通过鼠标和键盘执行网页任务。
作为微软首个面向电脑使用场景的小模型(SLM),Fara-7B 由 70 亿参数构成,在同级体量中达到领先性能,并能在设备端本地运行,实现更低延迟及更好的隐私保护。

据介绍,Fara-7B 不像传统聊天模型依赖文本交互,而是通过视觉解析网页截图,并在屏幕上执行点击、输入、滚动等动作,不需要依赖额外的可访问性树(Accessibility Tree)或多个大模型协作。

微软为此构建了一条全新的合成数据生成流程,用以模拟复杂多步骤的网页任务,来源包括真实用户需求和真实网页。该流程依托 Magentic-One 框架,涵盖任务生成、任务求解及轨迹验证三个阶段,最终用于训练模型的包括 14.5 万条任务轨迹、100 万步骤,并包含定位、描述与视觉问答等辅助任务数据。

最新从微软官方获悉,该模型基于 Qwen2.5-VL-7B 底座,支持最长 128k 上下文。在执行任务时,Fara-7B 会在预测动作前输出推理内容,并调用 Playwright 的标准操作(例如 click (x,y) 和 type ())及网页宏操作(如 web_search ())。训练方式以监督微调为主,并未使用强化学习。

在测试中,Fara-7B 在多项公开基准(WebVoyager、Online-Mind2Web、Deepshop)以及微软新公布的 WebTailBench 中表现亮眼,在部分任务中领先同级模型 UI-TARS-1.5-7B,并可与更大规模、通过复杂提示方式驱动的系统(如使用 Set-Of-Marks 的 GPT-4o)竞争。
另外,微软第三方合作机构 Browserbase 还采用了人工验证的方式对 Fara-7B 进行评测,最终发现该模型在 WebVoyager 上取得 62% 的通过率(包含重试)。

微软强调 Fara-7B 仍为实验性发布,特别是在复杂任务的准确性、指令遵循和降低幻觉方面仍存在局限,未来会持续改进。
鉴于电脑使用智能体模型的特殊风险,微软在模型中加入了多项安全措施,包括要求模型在涉及敏感操作(如提交个人数据或不可逆行为)时停在“关键点”(Critical Point)并征求用户同意;所有操作均会被记录;模型需在沙盒环境运行;并在训练中加入拒绝执行不当任务的示例。Fara-7B 在 WebTailBench-Refusals 的 111 个红队测试任务中拒绝率达到 82%。
目前,Fara-7B 已在 Microsoft Foundry 与 Hugging Face 以 MIT 许可发布并开源,同时整合进 Magentic-UI 研究原型。
微软还宣布将提供量化与面向 Copilot+ PC 的优化版本,可通过 VSCode 的 AI Toolkit 下载并在 Windows 11 本地运行,支持 NPU 加速。微软表示,未来更强的端侧 CUA 模型仍有提升空间,包括依赖更优底座模型与在真实及沙盒环境中使用强化学习。
《微软首款专为电脑操作设计的开源智能体小模型 Fara-7B 发布:支持 Win11 端侧运行,性能达同级最强》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
保时捷设计推 C-Seed 折叠电视,售价超三台 911
保时捷设计工作室联合研发的C-Seed折叠电视亮相,它更像一件科幻雕塑艺术品。闲置时如未来柜体,一键启动后屏幕自动旋转,五块Micro LED面板依次展开,支持室内外两用。但价格令人咋舌:约40万美元,超三台保时捷911 Carrera总价。#天价电视# #保时捷设计#... -
三星高管:不追噱头,专注打造“真正有用且不唐突”的 AI
三星欧洲区CEO Simon Sung表示,其AI战略核心是打造“真正有用且不唐突”的人工智能,聚焦日常实用价值而非新奇噱头。三星高斯大模型并未像ChatGPT那样独立推出,而是以Galaxy AI为核心深度集成于手机,并布局于家电等多条产品线。公司内部正推动AI能力渗透各部门,构建统一的智能环境。#三星AI# #GalaxyAI#... -
英伟达黄仁勋谈 AI 对职场影响:只替你干杂活,岗位核心还得靠人
英伟达CEO黄仁勋在播客中分享了对AI与就业的见解:AI自动化的是工作中的具体任务,而非岗位的核心价值。他以放射科为例,尽管AI已能读取影像,但放射科医生人数和收入却创下新高,因为其核心价值在于诊断与治疗决策。这一逻辑同样适用于律师、软件工程师等职业。#AI与就业# #黄仁勋谈AI#... -
谷歌重申暂无在 Gemini 中投放广告计划,聚焦搜索广告
谷歌全球广告副总裁丹·泰勒表示,目前没有在Gemini应用中投放广告的计划,广告团队正将重心放在AI搜索广告上。他指出,AI助手与搜索定位不同,商业化需谨慎,过早插入广告可能引发用户反感。目前谷歌AI概览月活已超20亿,广告点击率与传统搜索持平。#谷歌Gemini##AI广告商业化#... -
波士顿动力 CEO:Atlas 人形机器人从零件分拣起步,5-10 年或进入家庭
波士顿动力CEO透露,其全电动人形机器人阿特拉斯计划2028年投入工厂应用,将从汽车零部件分拣等简单任务起步。机器人面部设计灵感源自皮克斯小台灯,旨在传递友好信号。CEO认为机器人将创造新岗位,与人类形成共生关系,而非简单取代。#人形机器人##波士顿动力#...

















