解读|Arm机器学习处理器的独特之处

 新闻资讯     |      2024-01-19 07:22
本文摘要:的功能与少见的神经框架紧密结合,增加了网络部署成本,从而减缓了上市时间。

南宫ng28

的功能与少见的神经框架紧密结合,增加了网络部署成本,从而减缓了上市时间。【 图片来源:Arm Community 所有者:Arm Community 】我们再行来看一下这款处理器的参数:效能:CPUs, GPUs, DSPs 获取极大提高力,多达 5 TOPs/W 的加速器;网络反对:处置各种风行的神经网络,还包括卷积层(CNNs)和迭代(RNNs),用作分类、物体观测、图像增强、语音辨识以及自然语言解读;安全性:用于 Arm TrustZone 体系结构的基础,以大于攻击面继续执行;可扩展性:通过多核拓展,单个集群中最少有 8 个 NPUs 和 32 个 TOPs,网格配备中最少有 64 个NPUs;神经框架反对:与现有框架密切构建:TensorFlow , TensorFlow Lite , Caffe , Caffe 2 以及其他通过 ONNX 构建的框架;Winograd 卷积:与其他 NPUs 比起,普通过滤器的速度提升了 225%,需要在更加小的区域内取得更高的性能;内存传输:通过各种传输技术,将系统内存比特率最小化;异构 ML 计算出来:优化用于 Arm Cortex-A CPUs 和 Arm Mali GPUs;开源软件功能:通过 Arm NN 的反对去增加成本和防止瞄准;面向开发人员和未来为了让开发人员精彩一些,这个 ML 处理器有一个构建的网络掌控单元和 DMA(Direct Memory Access,必要内存读取),这个 DMA 需要管理整个网络的继续执行和迭代,还能在后台将数据迁移和移入主内存。

同时,板载存储器容许中央存储权重和特征图,增加了外部储存器的通信,缩短了电池的寿命,这是对消费者所希望的标准用户体验的又一次接纳。至关重要的是,这个 ML 处理器充足灵活性,可以反对具备更高市场需求的用例,运营更加多且更大的所发特性:在单个集群中可配备 8 个内核,超过 32 TOP/s 的性能;或是在网格配备中超过 64 NPUs。

最后,这个 ML 处理器强化了性能,提升了效率,增加了网络部署成本,并且,通过相同功能和可编程引擎的密切耦合,让固件随着新功能的研发而改版,从而使得这个设计会过时。总而言之,通过能力、效率、灵活性三者的融合,这个 ML 处理器在边缘定义了 ML 推理小说的未来,让开发者在创立今天最佳用户体验的同时,符合未来的用例市场需求。


本文关键词:解读,Arm,机器,学习,南宫ng28,处理器,的,独特,之处,的

本文来源:南宫ng28-www.extremesuccessgroup.com