Arm Lumex CSS 平台发布:性能提升超两位数,AI 更智能更高效

姜唯 | 2025-09-12 10:49

近几年,Arm 一直会在 5 月份公布新一代处理器架构,但今年的节奏明显不同。

今年早些时候,Arm 首次对外强调了一个重大举措:从单纯的核心 IP 供应商,向完整的计算平台公司转变。

为此,Arm 做了三件事:一、推出面向基础设施、移动终端、车用等细分市场的 Compute Subsystem(CSS,计算子系统);二、保留 Mali 作为 GPU 品牌,并将其纳入 CSS 平台架构;三是简化 IP 命名体系,使之与平台代系对齐,并通过 Ultra、Premium、Pro、Nano 等标签区分性能层级。

而这三项转变,在9 月 10 日举办的 Arm Unlocked AI技术峰会上海站上迎来了首次落地 —— 面向移动终端市场的 Arm Lumex CSS 平台正式发布。

全新平台的核心组件构成及优势

Arm Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能 Arm CPU、GPU 及系统 IP,不仅能助力生态伙伴更快将 AI 设备推向市场,还可支持桌面级移动游戏、实时翻译、智能助手及个性化应用等多样的丰富体验。

而这次最关键的升级,其实是 SME2 技术的集成。它让 CPU 自己就能高效处理矩阵计算,不需要总是把数据丢给 NPU 或 GPU。这样一来,端侧处理语音识别能快上几倍,生成音频更顺滑,大模型聊天的响应时间也缩短了约 40%。

(现场展出的 SME2 应用案例)

至于全新 Arm Lumex 的核心组件,可参考如下表格:

其中,Arm C1-Ultra CPU 相较上代 Cortex-X925 性能提升 25%,Arm C1-Pro 相较 Cortex-A725 性能提升 12%,全新的 Arm C1-Premium 相较于 Ultra 缩小 35% 面积,但相对 Pro 能有 35% 单线程性能提升。

AI 方面,得益于 SME2 的加入,Arm CPU 的 AI 性能提升高达 5 倍,语音类工作负载延迟降低 4.7 倍,音频生成速度提升 2.8 倍,让实时的端侧 AI 推理成为现实。而对于大语言模型(LLM),在支付宝、vivo 等第三方合作下,交互响应时间也能缩短高达 40%。

GPU 部分,Mali G1-Ultra 较 Immortalis-G925 在AI 与机器学习网络上的推理速度提升 20%、能效提升 9%,还支持新一代光线追踪技术,性能相比前代提升 2 倍,图形基准测试性能提升 20%,可以流畅运行《暗区突围:无限》、《堡垒之夜》、《原神》等主流游戏。而 Mali G1-Premium 和 Mali G1-Pro 都有不同程度的 AI 算力和游戏图形处理性能的提升。

生态合作与产业落地

SoC 厂商可以直接用 Arm 提供的平台方案,也可以根据需求去定制。首批落地的产品预估应该就是联发科即将在月底发布的天玑 9500,考虑到今年天玑旗舰芯片又大幅缩短了交付时间,这其中是否有 Arm Lumex CSS 的参与,得留到联发科发布会上揭晓。

此外,vivo 与 Arm 联合实验室的最新成果在此次的发布会上正式对外亮相,双方围绕 Arm 新一代高性能计算技术开展联合共研与验证,深入微架构层级,实现 SME2 创新特性在智能手机上率先落地。vivo 高级副总裁、首席技术官施玉坚明确表示,大家很快就能在 vivo 即将发布的全新 X 系列旗舰产品上,体验到这项技术进步带来的惊喜。

总结与未来展望

Arm 全新的 Lumex CSS 平台集成搭载 SME2 技术的 Armv9.3 CPU 集群(含 C1-Ultra、C1-Pro 等型号)、Mali G1-Ultra GPU 及系统 IP,实现高达五倍的 AI 性能提升。Arm 高级副总裁兼终端事业部总经理 Chris Bergey 表示:「AI 已不再仅仅是一项技术功能,它已成为下一代移动与消费技术的支撑底座。Arm 正依托 Arm Lumex 平台,持续提升端侧 AI 体验,以满足用户日益增长的需求与期待。」

在这样的背景下,Arm 推出的 Lumex 平台不仅是一次单纯的硬件更新,更是对手机 AI 生态发展方向的一次回应。目前 Arm Lumex CSS 平台已获阿里巴巴、支付宝、三星、腾讯、vivo 等生态伙伴采用,可驱动旗舰级智能手机、下一代 PC 等消费电子设备实现「更智能、更高效、更个性化」的端侧 AI 体验。

喜欢数码科技资讯的你,就记得点击订阅啦。
关注「锋潮评测室」微信公众号【微信号:fengchaopingceshi】,还会送上更多你想要的哦~

相关标签: arm arm unlocked lumex
92