Arm更新Neoverse路线图,公布V1和N2平台

2021-04-29来源: EEWORLD关键字:Arm  Neoverse  服务器  云计算

随着更多云厂商越来越需要进行针对系统的专门优化,定制化的芯片设计开始变成普遍流行,基础设施芯片市场变得越来越有趣,玩家越来越多。今年以来,包括印度电子和信息技术部MeitY,法国芯片初创企业 SiPearl,韩国电子通信研究所 ETRI,都宣布开发基于Neoverse V1的产品。


国内厂商奋起直追


包括腾讯和阿里在内的一批国内系统厂商,正在加速构建基于Arm的服务器的芯片。


腾讯专项测试技术中心总监黄闻欣(Victor Huang)表示:“2020年,腾讯和Arm正式签署了一份合作协议,希望通过合作加速Arm Neoverse技术的测评和适配。后面我们通过TencentBench测试框架发现,得益于更多可扩展的CPU核心数,Arm服务器比传统的服务器性能表现更强劲。非常值得一提的是,其在AI推理和图片处理领域优势非常明显。”


阿里巴巴首席工程师周经森(Kingsum Chow)提到:“Arm的CPU资源的话,在我们现有的软件里会有两个考虑的点,一个是我们有些软件是需要重新编译的,另外一种不需要重新编译,只需要我们把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在这方面,一年之前,我们就跟Arm的员工一起合作,把JVM的性能提高。过去一年里,我们从JDK8到JDK11,通过OpenJDK, 通过阿里巴巴 Dragonwell(OpenJDK的一个发行版),就把我们现有一些Java应用的一些性能提高了50%。”


Arm基础设施事业部高级副总裁兼总经理Chris Bergey表示:“腾讯在针对基于Arm硬件测试和软件支持方面持续投入,他们的硬件测试在性能方面展现了出色的结果,在每瓦性能方面也有非凡的表现。在软件的部份,他们既支持已编译和解译的代码库,也支持为这些代码库提供支撑的微服务框架。”


而针对阿里巴巴的合作,Bergey说道:“Java 对于阿里巴巴来说是一项至关重要的工作负载,他们的工程师已经编写了超过十亿行的 Java 代码。阿里巴巴和 Arm正在Java 的工作负载分析和调试方面持续合作。”


解密全新Neoverse路线图


正因为众多客户已经开始进行基于Neoverse产品的开发,Arm开始越来越快地公布其产品详细路线图。


日前,在Arm年度技术日上,Arm详细介绍了Arm Neoverse V1 和 Neoverse N2 平台。以及Arm Neoverse CMN-700 mesh 互连技术。


image.png

Neoverse路线图


CMN-700互联技术


image.png

Bergey表示,Arm CMN-700互联技术是构建V1和N2的关键要素。基于CMN-600而打造,从内核的数量和缓存的大小,到附加内存和IO设备的数量和类型都锁有所提升。支持DDR5和HBM。此外,增加了CXL功能,可为内存扩展和智能一致性加速。另外则是增加了诸多对于多芯片的支持功能,针对传统多插槽设计和新的芯片集或多芯片集成提高性能和优化功能。“多芯片集成将为突破传统的硅掩模版限制提供新的机遇,并为紧密耦合的异构计算提供更大的灵活性。”Bergey说道。


Neoverse V1:增加SVE功能


Bergey表示:“Neoverse V1 的设计理念是性能至上,因此我们加宽了微架构,并增加了缓冲区和队列的深度,以便在运行中容纳更多指令。”


与N1相比,Neoverse V1带来了 50% 的性能提升、1.8倍的矢量工作负载优化、以及4倍的机器学习工作负载优化,同时,Neoverse V1也是Arm强调性能优先的新型计算系列的第一个平台。Neoverse N1使芯片合作伙伴能灵活地为高度依赖CPU性能和带宽的应用构建计算能力,并为其提供 SoC 设计的灵活性。


秉持性能至上的思维,Neoverse V1 的设计理念创造了Arm迄今为止设计过的最宽微架构,以便容纳更多运行中的指令,支持高性能和百万兆级计算等市场应用。Neoverse V1宽而深的架构,加上 SVE功能将使其在单核性能和通过SVE延长代码存活期等方面占据领先优势,并为芯片设计人员提供可实现的灵活性。Bergey解释道:“Arm 现有的 SIMD 指令集 NEON 难以对某些代码进行矢量化处理,而 SVE 可以直接取用相同的代码,并很好地对其进行自动矢量化,相比于 NEON,可提速将近 3.5 倍。”


Neoverse N2:采用Arm V9架构


Neoverse N2平台是第一个基于Armv9架构的平台,在安全性、能耗以及性能方面都有全面的提升,正在为基础设施核心铺平道路。“N2 效率配置能够在单插槽线程上具有更大的竞争力,同时提供专属的内核,而非共享线程。”Bergey说道。


相比于N1,Neoverse N2在保持相同水平的功率和面积效率的基础上,单线程性能提升了40%。Neoverse N2 具备良好的可扩展性,可以横跨从高吞吐量计算到功率与尺寸受限的边缘和5G应用场景,并在这些应用中带来优于N1的表现,例如,在云端上提升 1.3 倍的NGINX,在 5G 和边缘应用上提升 1.2 倍的DPDK 数据包处理。


Neoverse N2平台提供了优异的单线程性能和业界领先且能为用户减少TCO的每瓦性能表现。Neoverse N2是第一个具备SVE2功能的平台,该功能可为云到边缘的性能效率带来巨大的提升。在诸如机器学习、数字信号处理、多媒体和5G等广泛应用场景中,SVE2除了带来大幅性能提升外,还带来了SVE 具备的编程简易性及可移植性等优势。


Bergey表示:“SVE2 将 SVE 相关的性能、编程简易性及可移植性等优势,应用到更广的领域和场景。SVE 意在加速 HPC,而 SVE2 则是将其扩展到 ML、DSP、多媒体和 5G 等应用场景。它融合了 NEON 丰富的数据操作、逻辑和算术指令集,以及 SVE 的自动矢量化和可扩展 性等功能。”


image.png

Neoverse与友商的性能对比


Bergey总结道:“V1 平台将成为 HPC 的一场变革,而N2将成为云端到边缘应用场景的最佳解决方案。”


关键字:Arm  Neoverse  服务器  云计算 编辑:冀凯 引用地址:http://news.eeworld.com.cn/qrs/ic534335.html

上一篇:Cadence 推出全新 DSP面向高端应用和始终在线应用
下一篇:NeuReality推出其NR1-P面向对象的硬件体系结构

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

基于嵌入式ARM9的USB通信设计与实现
引 言USB(Universal Serial Bus)是通用串行总线的缩写,因其具有方便易用,动态分配带宽,容错性优越和高性价比等特点,现已成为计算机的主流接口。随着嵌入式系统的广泛应用,各种小型终端需要开发出与外界联系的USB接口。目前,常用的技术有两种。基于单片机的USB接口,特点是需要外置芯片,电路复杂,留下的 CPU资源不多;基于ARM的USB接口,特点是资源丰富,但ARM系列产品较多,如果选型不当,还需要搭接较多的外围电路,且不能很好地发挥CPU性能。该设计采用三星公司ARM9核的S3C2440A芯片作为CPU,因为该芯片内部集成了控制USB的所有部件,外围电路简单,易于实现。1 S3C2440A特点S3C2440A
发表于 2021-05-18
基于嵌入式<font color='red'>ARM</font>9的USB通信设计与实现
基于多核ARM的数控系统的设计
1 绪论随着嵌入式技术的发展,嵌入式处理器 ARM 广泛应用于数控系统。ARM 是英国剑桥从事基于 RISC(Reduced Instruction SetComputer)技术芯片设计开发,作为知识产权供应商 ARM 公司设计的芯片。根据各自不同的应用需要,在芯片外适当添加外围电路,从而形成更具特色的 ARM 处理器。ARM 芯片具有RISC 体系的一般特点,如:具有大量的寄存器。绝大多数操作都在寄存器中进行,通过 Load/Store 的体系结构在内存和寄存器之间传递数据。寻址方式简单。采用固定长度的指令格式。目前的 ARM 内核有ARM7、ARM9、ARM9E、ARM10E、ARM11、SecurCore 等多种类型。以最
发表于 2021-05-18
基于多核<font color='red'>ARM</font>的数控系统的设计
基于ARM+μC/OS-Ⅱ的斜井防跑车控制器设计
发挥作用的关键;现有的斜井跑车防护装置中有机械联锁原理的、PLC作为控制器的,电子电路作为控制器的,存在着寿命短、维修量大、算法不灵活、抗干扰能力差等缺陷。本设计提出了一种基于32位ARM 7微处理器LPC2119和实时操作系统μC/OS-Ⅱ的斜井防跑车装置控制器实现方法。2 系统硬件设计2.1 装置组成该防护装置是一种常闭型装置,由控制器、执行结构、挡车装置和测速与到位传感器构成。如图1所示。传感器A,B完成矿车速度测定及方向识别,传感器C完成机车下行时发出放下挡车装置信号或机车上行时发出提起挡车装置信号,传感器E,F分别用于检测挡车装置提升和下放到位信号。当矿车以正常速度行车时,挡车装置自动开启让矿车通过,然后自动关闭挡车装置。当发生
发表于 2021-05-18
基于<font color='red'>ARM</font>+μC/OS-Ⅱ的斜井防跑车控制器设计
基于ARM嵌入式系统的ISP设计
应用程序的固化是嵌入式产品开发和生产过程中一个重要环节。基于ARM的嵌入式系统常用的程序固化方法是,用仿真器通过JTAG口将程序烧录到Flash里,在产品的开发阶段,使用仿真器几乎是必然的;然而到了产品的生产阶段,进行应用程序烧录或升级操作的往往是生产线上的工人,他们不易掌握仿真器的使用方法,而且在生产阶段也需要把JTAG调试口封住以防软件被窥视。笔者在使用意法半导体的STR730开发产品的过程中,设计了一种通过串口进行ISP(InSystemProgramming,在系统编程)的方案。该方案成本低,生产线使用起来也很方便,而且即使升级过程中发生掉电之类的意外也不会影响下一次升级,安全而可靠。1 硬件连接ISP方案的硬件连接如图
发表于 2021-05-18
基于<font color='red'>ARM</font>嵌入式系统的ISP设计
ARM7 lpc2148之单路LED控制实验
说明:力天电子的此款开发板,跟周立功的LPC2131不同,周立功的开发板上可以用跳线棒来选择是否用595驱动,周立功课本上进行GPIO输出实验——单路LED控制实验时,直接把LED接到了arm2131处理器上,如下图所示:而力天电子的流水灯跟驱动是直接连在一起的必须使用595驱动,如下图所示:#include <NXP/iolpc2148.h>#define SCLK 0x01<<24#define MISO 0x01<<5#define MOSI 0x01<<6#define RCK 0x01<<7void Delayn(unsigned long n);void
发表于 2021-05-17
<font color='red'>ARM</font>7 lpc2148之单路LED控制实验
基于ARM的振动信号采集及文件存储系统
。1 系统功能结构针对信息化管理程度,该系统设计成既可作为一个独立系统单独运行,又可作为功能模块无缝整合接入基于ARM的信息管理系统。该系统功能结构如图1所示。信号调理模块:通过加速度传感器采集微弱振动信号,进而经过信号调理电路(包括程控调节增益)送到LPC1768的A/D转换模块进行采集。PC机通信模块:通过USB接口与PC机通信,可实现文件数据的增加、删除、新建等功能。SD卡存储模块:基于FatFs文件系统的存储设计,通过SPI总线与主芯片通信,可完成数据的任何格式(如Wav)的写入,也可对SD卡内的数据进行读取。语音播报模块:在测试过程中实时语音提醒用户当前的操作状态,语音命令预存储在SD卡内,可通过SPI总线通信进行
发表于 2021-05-17
基于<font color='red'>ARM</font>的振动信号采集及文件存储系统
小广播
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2021 EEWORLD.com.cn, Inc. All rights reserved