芯东西(公众号:aichip001)股票股指配资
作者 | ZeR0
编辑 | 漠影
桌面级别的视觉效果,已经可以在移动设备上实现了!
芯东西8月13日报道,今日,Arm在国际图形顶级会议SIGGRAPH 2025上发布Arm神经技术(Arm Neural Technology),并将专用神经加速器引入2026年推出的Arm GPU。
Arm神经技术是业界首创在Arm GPU上增添专用神经加速器的技术,首次在移动设备上实现PC级别的AI图形性能,可将GPU图形渲染性能提升至更高水平,降低多达50%的GPU工作负载,并为未来实现更多端侧AI创新奠定基础。
Arm神经超级采样(Arm NSS)是Arm神经技术的首款应用,可将桌面级别的视觉效果引入手游。该AI图形优化升级技术能够以每帧4毫秒的速度,将分辨率从540p优化升级至1080p,即实现2倍的分辨率提升,且画质几乎与原生质量无异。
“Arm神经技术不仅适用于游戏领域,还将对神经摄像头工作负载等应用产生切实影响,为开发者在从画质优化升级到路径追踪等端侧用例中,提供大规模实现图形技术的强大工具。”Arm人工智能和开发者平台技术院士Geraint North说。
同时,Arm推出了全球首个全面开放的神经图形开发套件,以便开发者不用等硬件面世,现在就能着手开发。
Arm终端事业部产品管理总监Steve Steele与芯东西等媒体进行了深入交流。他相信随着神经技术引入Arm GPU中,Arm生态系统的移动端图形性能将会实现突破。Arm与其它厂商最大的区别是拥有很多工具、软件及模型开源,在设备上市前就能为其生态伙伴带来技术赋能和价值。
一、4毫秒实现分辨率翻倍,画质精度接近英伟达DLSS2级别如今手游体验的期望越来越高,例如画面更清晰、操作更流畅、电池续航更长等等,手游开发者要在配置受限的移动设备上兼顾这些需求,压力重重。传统优化升级方法不够灵活,实时AI渲染又很吃硬件性能和耗电。
Arm神经技术的首款应用Arm神经超级采样(Arm NSS),则能直接应对上述挑战。
Arm NSS专为在搭载Arm神经技术的未来移动设备上实现实时性能而设计,但其具体的延迟表现还取决于GPU的配置、分辨率、用例等因素。
在Arm的“魔法城堡”演示中,对比传统的全帧渲染方法,通过使用Arm NSS,GPU工作负载可降低50%,且在持续性能的设定下,当模型以540p分辨率渲染时,能在4毫秒就可优化升级至1080p。
从中节省出来的资源,既可用于降低游戏的整体功耗,也可用于提升帧率或增强视觉效果。
Arm NSS技术还能让开发者利用AI来保留表面细节、光照和运动清晰度,从而能够根据游戏需求灵活平衡视觉保真度和能耗。
Arm内部测试结果显示,Arm NSS已接近NVIDIA DLSS2级别的画质精度,但所使用的模型更小,且针对移动设备进行了优化。
其团队对Arm ASR、DLSS2以及AMD的超级分辨率锐画技术2(FSR2)进行了对比测试,收集了包括峰值信噪比(PSNR)、结构相似性指数(SSIM)、空域-时域降参考熵差(STRRED)等多项指标,结果验证了Arm NSS的高水平表现。
二、用神经超级采样取代启发式方法,优化抗锯齿和时域稳定性Arm战略与生态部主任工程师Sergio Alapont认为,Arm NSS标志着移动端图形技术的重要创新,实现了实时超级分辨率,将时域一致性与感知质量相结合,带来远胜于传统技术的出色表现。
Arm NSS建立在Arm精锐超级分辨率技术(Arm Accuracy Super Resolution, Arm ASR)的基础之上。Arm ASR是一款面向移动设备,实现时域优化升级的开源解决方案,已被《堡垒之夜》、《无限暖暖》等游戏工作室采用。
Arm NSS引入了一种由机器学习驱动的时域超级采样方法,用经过学习的滤波器和稳定性提示取代了人工调优的启发式方法,并能够在移动端硬件的实时性限制内运行。
过去十年中,常用的抗锯齿技术时域超级采样(TSS)面临一些挑战。例如,TSS中常用的人工设计的启发式方法难以扩展,并且需要在不同内容中不断调整,鬼影、去遮挡伪影、时域不稳定性等问题依然存在,在与图像优化升级技术结合时变得更加棘手。
而Arm NSS通过一套从数据中学习且经过训练的神经模型,用非静态规则来克服这些限制。它可以跨条件和内容类型进行泛化,更有效地适应运动动力和识别锯齿模式。
Arm NSS使用以每像素一个样本渲染的540p帧序列进行训练。每帧与以每像素16个样本渲染的1080p真实标签(Ground Truth)图像配对。序列大约包含100帧,以帮助模型理解图像内容如何随时间变化。
模型采用递归式训练,在每次执行反向传播之前,会先对多帧序列进行前向传播。这使得网络能够随时间传播梯度,并学习如何累积信息。该网络采用时空损失函数进行训练,能对空域保真度和时域一致性方面的误差进行惩罚。
空域保真度用于确保单帧图像清晰、细节丰富且视觉准确,有助于保留边缘、纹理和精细结构。时域稳定性则抑制了连续帧之间可能出现的闪烁、抖动或其他形式的时域噪声。
Arm NSS网络采用具有跳跃连接的四层级UNet主干架构,通过三个编码器和解码器模块对输入数据进行下采样和上采样处理。
针对时域不稳定性问题,Arm NSS引入了两种关键反馈机制:一是将先前帧的隐藏特征前向传递,使网络能够学习变化与持续的部分;二是通过计算亮度导数来检测闪烁的细微特征,从而突显指示不稳定的时域差异。
Arm NSS在典型的管线中包含三个步骤:
预处理:将输入数据(颜色、运动向量、深度)整理为张量格式; 神经推理:通过使用Vulkan ML扩展在神经加速器上运行; 后处理:利用模型输出重建最终图像。与Arm ASR等依赖手动调优的启发式方法不同,Arm NSS等机器学习方法具有三重优势:
能估计动态内核滤波器和参数,以逐像素粒度解决锯齿问题; 通过利用采集多帧历史状态的时域反馈,实现更出色的时域稳定性; 可针对新游戏内容进行调优,使开发者能进一步针对其特定游戏优化图像质量。最终,Arm NSS能够逐步扩展性能,利用更少的资源处理较高的分辨率,非常适合应用在硬件受限的移动设备上。
在540p到1080p的比较中,Arm NSS提升了稳定性和细节保留性能,并且在快速运动、部分遮挡物体和细微几何体场景中表现出色。与Arm ASR或AMD FSR2等非神经方法不同,Arm NSS无需反应掩码,即可处理粒子效果。
早期模拟数据显示,Arm NSS在1.5倍优化升级(平衡模式)下的运行时间约为Arm ASR的 75%,而在两倍优化升级(平衡模式)下则预计性能会优于Arm ASR。这一效率提升得益于用简化的推理过程取代了复杂的启发式方法。
对于未搭载神经加速器的移动设备,Arm ASR仍是经高度优化的可选方案。
Arm推出了全球首个全面开放的神经图形开发套件,旨在将AI渲染集成到现有的工作流程中,使得开发者能够在硬件面世前一年就能使用神经图形开发套件,着手集成AI图形技术。
该开发套件专为手游打造,涵盖集成和定制AI视觉效果所需的各项资源,其中包含虚幻引擎插件、基于PC的Vulkan模拟、更新的分析工具,以及GitHub和Hugging Face上的开放模型和面向Vulkan的Arm机器学习(ML)扩展。
套件中的所有Arm神经技术都将全面开放,包括游戏工作室重新训练模型所需的模型架构、权重和工具。
该开发套件已得到Enduring Games、Epic Games(虚幻引擎)、网易游戏、Sumo Digital、腾讯游戏、Traverse Research等合作伙伴的支持。
虚幻引擎5插件实现了将Arm NSS集成到虚幻引擎中,使开发者能够快速将优化升级技术增加到他们的项目中,并预览在新一代移动设备上运行的游戏效果。该插件还与虚幻引擎的神经网络引擎(Neural Network Engine, NNE)框架结合,用于管理ML资源并与渲染图同步调度推理任务。
虚幻引擎5插件中运行的ML推理使用的是软件模拟。其性能并不能完全反映实际芯片上的预期表现。该插件的主要目标是支持实验和集成。
搭载Arm神经技术的2026年移动设备将能原生支持Vulkan ML扩展。
面向Vulkan的开放Arm ML扩展能让开发者将AI直接引入熟悉的渲染管线。传统Vulkan支持图形管线(Graphics Pipeline)和计算管线(Compute Pipeline),而Arm ML扩展还引入了第三种管线——专为神经网络推理而打造的图管线(Graph Pipeline)。因此,开发者能更轻易地将AI作为图形管线的原生部分整合到移动端渲染。
开发者可启用模拟层并使用扩展Vulkan头文件来运行使用了Vulkan ML扩展的内容。NNERuntimeRDGVulkanML就是很好的一个例证,它可通过虚幻引擎5插件来使用,并且它通过使用Vulkan ML扩展的原生后端,扩展了NNE框架。
对于构建神经渲染解决方案的ML工程师来说,Arm NSS是一个可部署、结构良好,且运行于图形管线内的推理示例。
结语:路线图持续扩展,预告明年全新神经技术应用Arm预计在2026年进一步扩展其神经技术应用路线图,推出利用AI实现帧率翻番而无需加倍渲染负载的神经帧率提升(Neural Frame Rate Upscaling),以及采用AI在移动设备上实现实时路径追踪,且每个像素只需发射更少光线的神经超级采样与降噪(Neural Super Sampling and Denoising)。这两项应用都将在硬件面世前推向市场。
Arm为开发者提供统一的开放平台股票股指配资,以帮助开发者更轻松地在Arm计算平台上跨各类端侧体验部署AI。通过这些新技术的开发,Arm正在实现能针对实际性能具备开放、可获取且优化提升的神经图形技术。
道正网提示:文章来自网络,不代表本站观点。