神秘模型 Grok 4.20 AI 炒股夺冠:只有它赚钱,吊打 Gemini 3 和 GPT-5.1
就在昨天,金融圈和 AI 圈同时炸了锅。在 nof1.ai 举办的 Alpha Arena 1.5 赛季中,那个代号为「Mystery Model」(神秘模型)的幽灵选手终于揭开了面纱。

它是来自 xAI 的 Grok 4.20。在为期两周的比赛里,它把手里 1 万美元的本金变成了 12193 美元,结算成绩时综合回报率 12.11%。

这听起来似乎不多?但在同样的市场环境下,那些被吹上天的 GPT-5.1、Gemini 3.0 Pro 和 Claude Sonnet 4.5,全部亏损。
这是真金白银的华尔街大逃杀。Grok 4.20 不仅赢了,还把对手的脸按在地上摩擦。
赛博斗兽场:Alpha Arena
这是由 nof1 实验室打造的一个「全自动金融角斗场」。规则很简单:给每个顶尖大模型 1 万美元真钱,扔进残酷的美国股市,不准人类插手,让它们自己决定买什么、卖什么,甚至何时加杠杆。
在这个 1.5 赛季,战场从狂野的加密货币转移到了更为老练的美股市场。为了增加难度,主办方还设计了四种变态模式,包括不仅要赚钱还要极度克制的「苦行僧模式」,以及允许查看对手底牌的「情境感知模式」。
一场单方面的屠杀
比赛结果出来时,数据尴尬得让人想替其他大厂找个地缝钻进去。当 OpenAI 的 GPT-5.1 还在犹豫不决(剩下 9737 美元)时;当谷歌的 Gemini 3.0 Pro 因为操作失误巨亏近 30%(剩下 7382 美元)时;Grok 4.20 却像个老练的华尔街赌徒,冷静地收割着利润。
最讽刺的是上一代 Grok 4 也参赛了,结果垫底,亏得只剩 4610 美元。这恰恰证明了 xAI 在版本迭代上的惊人飞跃 —— 从「韭菜」进化成「镰刀」,马斯克只用了一个版本号。
它凭什么赢?
Grok 4.20 的胜出,或许早已注定。有分析指出,与其他只能通过普通联网搜索新闻的模型不同,Grok 拥有一个核武器级别的优势:它可以实时访问 X 的完整数据流。
在股市里,情绪就是金钱。当其他 AI 还在啃枯燥的财报时,Grok 可能已经通过分析推特上的数百万条推文,嗅到了散户对 Palantir (PLTR) 公司股票的狂热。
事实也证明了这一点。在比赛的「苦行僧模式」中,Grok 4.20 极其嚣张地对 PLTR 开了 10 倍杠杆。理由?它捕捉到了「AI 叙事」的宏观利好。这笔交易直接为它带来了 465 美元的浮盈。
而在另一个战场,它稳稳拿住了微软 (MSFT) 和代号 XYZ100 的仓位,即使市场震荡也纹丝不动,展现出了惊人的定力。
更可怕的是在「情境感知模式」下,Grok 4.20 一度拿下了近 50% 的收益。这个模式允许选手看到对手的持仓。Grok 不仅读懂了市场,还读懂了对手。它预判了 GPT 的预判,这才是最令人细思极恐的地方。
马斯克揭晓谜底
胜利之后,马斯克自然不会放过这个炫耀的机会。他在 X 上得意地确认了 Grok 4.20 的身份。

如果一个 4.20 版本已经能把其他顶尖 AI 杀得片甲不留,那么那个传说中的 Grok 5 会是什么?一个能操纵市场的超级怪兽?
Alpha Arena 的这场比赛给所有人都上了一课。对于华尔街的基金经理们来说,那个曾经被轻视的 AI,现在正盯着他们的饭碗。它不需要睡觉,没有恐惧,而且它比任何人都更早知道你在 X 上骂了哪家公司。当算法学会了贪婪,它收割世界的方式,甚至不需要流一滴血。
参考资料:
https://x.com/MarioNawfal/status/1997476276639264932
本文来自微信公众号:新智元(ID:AI_era)
《神秘模型 Grok 4.20 AI 炒股夺冠:只有它赚钱,吊打 Gemini 3 和 GPT-5.1》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
保时捷设计推 C-Seed 折叠电视,售价超三台 911
保时捷设计工作室联合研发的C-Seed折叠电视亮相,它更像一件科幻雕塑艺术品。闲置时如未来柜体,一键启动后屏幕自动旋转,五块Micro LED面板依次展开,支持室内外两用。但价格令人咋舌:约40万美元,超三台保时捷911 Carrera总价。#天价电视# #保时捷设计#... -
三星高管:不追噱头,专注打造“真正有用且不唐突”的 AI
三星欧洲区CEO Simon Sung表示,其AI战略核心是打造“真正有用且不唐突”的人工智能,聚焦日常实用价值而非新奇噱头。三星高斯大模型并未像ChatGPT那样独立推出,而是以Galaxy AI为核心深度集成于手机,并布局于家电等多条产品线。公司内部正推动AI能力渗透各部门,构建统一的智能环境。#三星AI# #GalaxyAI#... -
英伟达黄仁勋谈 AI 对职场影响:只替你干杂活,岗位核心还得靠人
英伟达CEO黄仁勋在播客中分享了对AI与就业的见解:AI自动化的是工作中的具体任务,而非岗位的核心价值。他以放射科为例,尽管AI已能读取影像,但放射科医生人数和收入却创下新高,因为其核心价值在于诊断与治疗决策。这一逻辑同样适用于律师、软件工程师等职业。#AI与就业# #黄仁勋谈AI#... -
谷歌重申暂无在 Gemini 中投放广告计划,聚焦搜索广告
谷歌全球广告副总裁丹·泰勒表示,目前没有在Gemini应用中投放广告的计划,广告团队正将重心放在AI搜索广告上。他指出,AI助手与搜索定位不同,商业化需谨慎,过早插入广告可能引发用户反感。目前谷歌AI概览月活已超20亿,广告点击率与传统搜索持平。#谷歌Gemini##AI广告商业化#... -
波士顿动力 CEO:Atlas 人形机器人从零件分拣起步,5-10 年或进入家庭
波士顿动力CEO透露,其全电动人形机器人阿特拉斯计划2028年投入工厂应用,将从汽车零部件分拣等简单任务起步。机器人面部设计灵感源自皮克斯小台灯,旨在传递友好信号。CEO认为机器人将创造新岗位,与人类形成共生关系,而非简单取代。#人形机器人##波士顿动力#...

















