超越Gemini3、GPT5.1!阿里千问登顶空间推理全球冠军
快科技11月26日消息,今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。
SpatialBench榜单显示,Qwen3-VL-235B和Qwen2.5-VL-72B分别斩获13.5和12.9分,领先于Gemini 3.0 Pro Preview(9.6) 、GPT-5.1(7.5)、Claude Sonnet 4.5等海外顶尖模型。

然而,AI大模型的整体表现距离人类仍有差距,人类基准线约为80分左右,可专业处理电路分析、CAD 工程和分子生物学等复杂空间推理任务,目前大模型还无法完全自动化完成此类工作。
据悉,Qwen2.5-VL于2024年开源,Qwen3-VL是阿里在2025年开源的新一代视觉理解模型。
Qwen3-VL在视觉感知和多模态推理方面实现重大突破,在32项核心能力测评中超过Gemini2.5-Pro和GPT-5,不但可调用抠图、搜索等工具完成“带图推理”,也可以凭借一张设计草图或一段小游戏视频直接“视觉编程”。

同时,Qwen3-VL专门增强了3D检测能力,可以更好地感知空间,基于Qwen3-VL,机器人更好地判断物体方位、视角变化和遮挡关系,实现远处苹果的精准抓取。
目前,Qwen3-VL已开源不同版本,包括2B、4B、8B、32B等密集模型以及30B-A3B、235B-A22B等MoE模型,每个模型都有指令版和推理版两款,是当下最受企业和开发者欢迎的开源视觉理解模型。同时,Qwen3-VL模型也已上线千问APP,用户可免费体验。
据了解,SpatialBench是一项近年来兴起的第三方空间推理基准测试榜单,主要聚焦多模态模型在空间、结构、路径等方面的综合推理能力,被AI社区视为是衡量“具身智能”进展的新兴测试标准之一。
SpatialBench不仅测试模型已知的知识,还测试模型在二维和三维空间中“感知”和操控抽象概念的能力,这对具身智能的落地尤为关键。
《超越Gemini3、GPT5.1!阿里千问登顶空间推理全球冠军》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
跑赢A股98%的公司!海尔智家连续5年两位数增长
在 A 股市场分化加剧、企业盈利承压的大环境下,海尔智家交出了一份亮眼的 “五年答卷”。截至 2025 年三季度末,公司已连续 5 年实现归母净利润两位数增长,增速分别达 57.68%、17.2... -
新风黑科技排位赛!2025新风空调排名推荐 全场景适配不踩坑
新风空调的核心价值,在于“鲜氧+净化+舒适”的完美结合,而排名靠前的优质新风空调产品,必然能精准匹配不同家庭场景的多样化需求。无论是浅眠者对静音的需求、多口之家的全屋守护,... -
2025投影品牌排行榜出炉 大眼橙以技术普惠引领行业变革
随着投影技术的不断发展,如今越来越多人开始选择使用投影仪——从居家客厅的家庭影院、卧室的私密观影,到户外露营的星空放映、租房族的空间改造,投影仪凭借“小机身+大屏幕&r... -
智诊科技与腾讯云达成战略合作 共同推动智慧医疗落地与普惠应用
近日,杭州智诊科技有限公司(以下简称“智诊科技”)与腾讯云在2025腾讯云城市峰会无锡峰会期间正式签署战略合作协议。双方将在“AI+医疗健康”领域展开深度合作,凭借智诊... -
全国教师代表走进泉州鲤城机关幼儿园 观摩AI赋能幼儿园创新实践
近日,福建泉州举办了“中国教育发展战略学会教育教学创新专委会学术年会暨第二届人工智能通识教育教学交流展示活动”,泉州市鲤城机关幼儿园作为此次活动分会场,来自全国人工智能教...

















