首页 > 人工智能>挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

IT之家人工智能2025-11-25 20:42:31

AMD 公司昨日（11 月 24 日）发布公告，宣布携手 IBM 和 AI 初创公司 Zyphra，历时 1 年多时间，成功使用 AMD 硬件训练出首个大型混合专家（MoE）基础模型 ZAYA1。...

最新 11 月 25 日消息，AMD 公司昨日（11 月 24 日）发布公告，宣布携手 IBM 和 AI 初创公司 Zyphra，历时 1 年多时间，成功使用 AMD 硬件训练出首个大型混合专家（MoE）基础模型 ZAYA1。

最新援引博文介绍，该模型是首个完全基于 AMD 硬件生态系统构建的大型混合专家（MoE）模型，其训练过程完全在 IBM 云上进行，使用了 AMD Instinct MI300X GPU、Pensando 网络技术和 ROCm 软件平台，其详细技术报告已在 arXiv 上发布。

挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

三方为训练 ZAYA1 模型，共同搭建了一个大规模、高可靠性的专用训练集群。该集群由 128 个节点组成，每个节点配备 8 块 AMD MI300X GPU，总计 1024 块 GPU，通过 AMD InfinityFabric 高速互联。

挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

整个集群的实际训练性能超过 750 PFLOPs（每秒 75 亿亿次浮点运算），同时 Zyphra 为确保了训练过程的稳定与高效，还开发了一套针对 AMD 平台高度优化的训练框架。

ZAYA1 基础模型在预训练阶段使用了高达 14 万亿（14T）tokens 的数据，并采用了分阶段的课程学习策略：从初期的非结构化网络数据，逐步过渡到结构更清晰、信息密度更高的数学、代码和推理数据。

挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

基准测试结果显示，ZAYA1 的综合性能与业界领先的 Qwen3 系列模型不相上下，同时优于 SmolLM3、Phi4 等主流开源模型。特别是在未经特定指令微调的情况下，其推理版本在数学和 STEM 等复杂推理任务上已接近 Qwen3 的专业版本。

挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

ZAYA1 的优异性能还得益于其在模型架构上的两项关键创新。首先，它采用了新颖的 CCA 注意力机制（Compressive Convolutional Attention），通过在注意力模块内部引入卷积操作，显著降低了计算量和显存占用。

其次，该模型改进了混合专家模型（MoE）中常用的线性路由（linear router），设计了新的路由结构，提升了模型的表达能力和专家模块的专业化程度。这些创新共同解决了 Transformer 架构中的计算与内存瓶颈。

Zyphra 表示，ZAYA1 的成功发布只是第一步。目前公布的仅为基础模型预览，未来团队将发布经过完整后训练（post-trained）的模型版本，并提供更详尽的性能评测和训练经验分享。

挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

《挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场》转载自互联网，如有侵权，联系我们删除，QQ：369-8522。

本文网址：https://keji.jxzy.wang/2025/11/467.html

相关图文

第五届OceanBase数据库大赛收官：北邮「编程高手」赛队夺冠，探索AI原生数据库

1月18日下午，2025年全国大学生计算机系统能力大赛暨第五届OceanBase数据库大赛在北京科技大学落幕。本届赛事吸引全国高校的1223支队伍、2620名学生参赛。经过两个多月比拼，北邮「编程高手」队...

人工智能 2026-01-19 1
保时捷设计推 C-Seed 折叠电视，售价超三台 911

保时捷设计工作室联合研发的C-Seed折叠电视亮相，它更像一件科幻雕塑艺术品。闲置时如未来柜体，一键启动后屏幕自动旋转，五块Micro LED面板依次展开，支持室内外两用。但价格令人咋舌：约40万美元，超三台保时捷911 Carrera总价。#天价电视# #保时捷设计#...

人工智能 2026-01-19 1
三星高管：不追噱头，专注打造“真正有用且不唐突”的 AI

三星欧洲区CEO Simon Sung表示，其AI战略核心是打造“真正有用且不唐突”的人工智能，聚焦日常实用价值而非新奇噱头。三星高斯大模型并未像ChatGPT那样独立推出，而是以Galaxy AI为核心深度集成于手机，并布局于家电等多条产品线。公司内部正推动AI能力渗透各部门，构建统一的智能环境。#三星AI# #GalaxyAI#...

人工智能 2026-01-19 1
英伟达黄仁勋谈 AI 对职场影响：只替你干杂活，岗位核心还得靠人

英伟达CEO黄仁勋在播客中分享了对AI与就业的见解：AI自动化的是工作中的具体任务，而非岗位的核心价值。他以放射科为例，尽管AI已能读取影像，但放射科医生人数和收入却创下新高，因为其核心价值在于诊断与治疗决策。这一逻辑同样适用于律师、软件工程师等职业。#AI与就业# #黄仁勋谈AI#...

人工智能 2026-01-19 1
谷歌重申暂无在 Gemini 中投放广告计划，聚焦搜索广告

谷歌全球广告副总裁丹·泰勒表示，目前没有在Gemini应用中投放广告的计划，广告团队正将重心放在AI搜索广告上。他指出，AI助手与搜索定位不同，商业化需谨慎，过早插入广告可能引发用户反感。目前谷歌AI概览月活已超20亿，广告点击率与传统搜索持平。#谷歌Gemini##AI广告商业化#...

人工智能 2026-01-19 1
波士顿动力 CEO：Atlas 人形机器人从零件分拣起步，5-10 年或进入家庭

波士顿动力CEO透露，其全电动人形机器人阿特拉斯计划2028年投入工厂应用，将从汽车零部件分拣等简单任务起步。机器人面部设计灵感源自皮克斯小台灯，旨在传递友好信号。CEO认为机器人将创造新岗位，与人类形成共生关系，而非简单取代。#人形机器人##波士顿动力#...

人工智能 2026-01-19 1