依托鲲鹏处理器矩阵算力 中科大陈俊仕团队破解稀疏计算效率难题
从电路模拟的复杂推演到量子化学的微观分析,大规模稀疏线性方程组的高效求解是科学计算领域的核心需求。但传统稀疏直接求解器因数据非零元分布稀疏且不规则,导致运算低效、算力浪费等问题。近日,中国科学技术大学计算机科学与技术学院特任副研究员陈俊仕团队,在鲲鹏昇腾科教创新卓越中心的算力支持下,创新研发出面向鲲鹏处理器矩阵算力基于密集kernel的LU直接求解器,以密集运算方式实现了稀疏计算的高效求解,成功突破传统运算瓶颈。
![[MD:Title]](/d/file/p/2025/12-01/0bba229d45d53ad57ba2d2aab21a1073.jpg)
该研究创新构建了一种面向稀疏矩阵计算的密集计算范式,系统化解构了传统稀疏直接求解器的性能瓶颈。团队通过将分散的非零元整合为更加规整的密集数据块,将不规则稀疏矩阵映射为统一稠密的大块结构,进而采用基于稠密矩阵运算的数值分解算法,取代传统稀疏运算中聚合非零小分块的碎片化计算模式,显著降低了由不规则内存访问引发的计算与调度开销,最终实现了计算效率与硬件利用率的协同优化。
该方案的顺利落地,深度依赖于鲲鹏平台的计算特性。硬件层面,鲲鹏920新型号集成专用矩阵运算单元,原生具备高密度数值分解运算的高效承载能力,可精准匹配密集数据块的集中化处理需求;其多核架构为大规模密集数据块的并行运算提供了坚实基础,避免算力闲置或过载。软件层面,鲲鹏 KML 数学库针对密集型矩阵运算进行深度优化,通过底层算法与硬件架构的协同,进一步放大了密集运算模式的性能潜力。经 70 余个跨领域测试集验证,该方案性能较SuperLU 求解器平均加速32.2倍,在基础硬件配置下实现了平均 9.6 倍性能加速,大幅压缩了科学计算的时间成本。
目前,相关研究成果已发表于 CCF B 类国际会议 Euro-Par 2025,其核心技术已申请中国发明专利并获得授权。此次成果是鲲鹏平台在科学计算领域的典型实践,该方法对于现代高性能处理器上稀疏计算问题的高效求解、充分地发挥处理器上的矩阵运算单元具有很好的应用价值。未来,随着鲲鹏生态的持续完善,其在高性能计算领域的赋能作用将进一步凸显,助力更多科研团队突破技术难关,推动科研成果加速落地转化。
《依托鲲鹏处理器矩阵算力 中科大陈俊仕团队破解稀疏计算效率难题》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
苹果与英特尔有望再携手 由英特尔代工部分M系列芯片
快科技11月30日消息,据报道,在2020年全球开发者大会上,苹果宣布将推出基于Arm架构的自研Mac芯片,并于同年11月发布首款M1芯片,正式启动从英特尔平台向自研芯片的过渡。随着后续M1 Pro、M1... -
依托鲲鹏处理器矩阵算力 中科大陈俊仕团队破解稀疏计算效率难题
从电路模拟的复杂推演到量子化学的微观分析,大规模稀疏线性方程组的高效求解是科学计算领域的核心需求。但传统稀疏直接求解器因数据非零元分布稀疏且不规则,导致运算低效、算力浪费等问题。近... -
“淮河能源”鸿蒙版全新升级 打造数智办公新范式
淮河能源控股集团以煤起家,自1897年开发建设,走过128年壮阔历程,逐步发展成为煤、电、气等多产业协同发展的国家新型综合能源企业。作为百年企业,淮河能源在主业方面受到社会瞩目,更在数智升... -
服务1.2亿人 支付宝就业数智化方案亮相全国人力资源服务业发展大会
11月28-29日,第三届全国人力资源服务业发展大会在武汉举行,本届大会主题为“塑造现代化人力资源 促进高质量充分就业”,并设置多个专项活动。支付宝就业数智化解决方案亮相大... -
灵宝CASBOT亮相ICA论坛:具身智能正成为铜矿智能化升级的关键变量
11月25日,灵宝CASBOT携全尺寸双足人形机器人CASBOT 02与轮式具身智能机器人CASBOT W1出席国际铜业协会(ICA)在上海举办的“绿色创新,铜绘未来”专题论坛,并围绕《机器人在矿山中的...

















