【原创】史上最强FPGA来了!7nm工艺性能逆天

》。

图3 赛灵思发布Virtex UltraScale+ VU19P

图3 赛灵思发布Virtex UltraScale+ VU19P

2019年11月,英特尔(Altera)推出了超过千万逻辑门拥有433亿晶体管的全球最大的FPGA --看来FPGA老大老二在FPGA大小方面掐上了。但实际上这是英特尔利用EMIB技术把两个高密度Stratix 10 GX FPGA核心逻辑芯片(每颗芯片容量为510万个逻辑单元)以及相应的I/O单元融合而成的怪物级FPGA,在架构上毫无亮点,而且如此大容量的FPGA配了一个17.4Gbps的收发器,这样的比大小我看意义不大。

图4  英特尔的Stratix 10 GX FPGA配置

图4  英特尔的Stratix 10 GX FPGA配置

这就好比20世纪初期各国海军强国攀比自己战列舰的口径大小,当时日本造了全球口径最大的战列舰大和号,该舰装备有3座三联装94式45倍径460毫米口径舰炮以及各种副炮和对空机关炮,全舰覆盖大量装甲,舰身的重要部位都能经受460毫米大炮的轰击,其烟囱也在开口处和侧面装上了蜂窝状钢板和防护装甲,堪称攻击和防护都巨牛的战舰,结果,它被美国航母舰载机击沉了!

图5   大和号1945年在冲绳战役中被舰载机击沉

图5   大和号1945年在冲绳战役中被舰载机击沉

所以,我看这样的比大小没有多少实际意义,因为新的计算需求和范式需要新的处理器架构需要高速的通信带宽,仅仅提升逻辑单元没有意义,FPGA需要综合的强悍性能。

Versal™ Premium的性能一览

那么Versal™ Premium的性能如何呢?今天,赛灵思的三位发言人给我们做了详细的介绍。

图6  赛灵思的三位发言人

图6  赛灵思的三位发言人

赛灵思产品线营销与管理高级总监Sumit Shah介绍说来自多元化应用与工作负载的数据爆炸性增长驱动网络转型,赛灵思估计子核心网方面,随着5G商用,核心网复合增长率是 313%!而在安全则需要最高等级,在计算与带宽方面,端口速度增长超过摩尔定律。

图7图8   数据爆炸性增长驱动网络转型图7图8   数据爆炸性增长驱动网络转型

图7图8   数据爆炸性增长驱动网络转型

而赛灵思的Versal™ Premium可以助力实现实现速度最快、最安全的网络它把带宽提升了3倍,计算密度提升了2倍,并集成了大量的硬IP。 

图9     Versal™ Premiume构成

图9     Versal™ Premiume构成

赛灵思高端 ACAP 和 FPGA 产品线高级经理Mike Thompson介绍说Versal™ Premium采用的是台积电7nm 工艺制程,作为Versal ACAP 的最新产品系列, Versal Premium 系列可提供比当前FPGA高达三倍的吞吐量,且内置以太网、Interlaken 和加密引擎以打造快速、安全的网络。

图10 Versal™ Premiume 有112Gbps收发器

图10 Versal™ Premiume 有112Gbps收发器

据介绍,Versal™ Premium有 112Gbps PAM4 收发器、数百 GbE (千兆位以太网)和 Interlaken 连接、高速加密以及内置 DMA、同时支持CCIX 和 CXL 支持的 PCIe® Gen5等,可以实现单芯片 400G 和 800G 解决方案

图11  Versal Premium集成的IP非常多

图11  Versal Premium集成的IP非常多

Mike表示Versal™ Premium集成的 IP (主要是各类存储控制器、接口等)等效于22个16nm工艺 FPGA 的逻辑密度!集成如此多IP的目的是让开发者能够专注于差异化(相对于分散精力在设计基础架构与连接上)。他举例要在Virtex® UltraScale+TM VU9P开发这些资源需要20万个LUT ,而现在,需要的数量是0!

图12 Versal™ Premiume集成 IP优势对比

图12 Versal™ Premiume集成 IP优势对比

在应用开发上,Mike表示Versal™ Premium是面向各种开发者的软硬件集成平台,硬件开发者、软件开发者以及数据科学家都可以利用这个平台开发应用。配合 Vitis™ 统一软件平台与 Vivado® 设计套件,Versal™ Premium可为软件与硬件开发者提供完整的解决方案堆栈,尤其是针对人工智能应用,ACAP有专门的引擎可以加速AI运算。

图13 Versal™ Premiume是面向各种开发者的软硬件集成平台

图13 Versal™ Premiume是面向各种开发者的软硬件集成平台

这是Versal™ Premium和特斯拉上GPU性能对比。在图像检测上是GPU的2.3倍,在对象检测上最高提高了7.7倍,自异常检测(随机森林算法)上是英特尔至强CPU的65倍!

图14 Versal™ Premiume性能对比

图14 Versal™ Premiume性能对比

在片上存储器带宽与容量方面,Versal™ Premium与GPU对比最高可以提升25倍!

图15  片上存储器带宽与容量对比

图15  片上存储器带宽与容量对比

与ASIC、ASSP在吞吐量上对比,Versal™ Premium也远远胜出。

图16  Versal™ Premium和ASSP的吞吐量对比

图16  Versal™ Premium和ASSP的吞吐量对比

Versal™ Premium 在提升性能的同时,功耗降低一半以上,可以在低于 100 瓦功耗下提供单芯片 800G DCI (数据中心互联)吞吐量!

图17  Versal™ Premium的功耗降低很多

图17  Versal™ Premium的功耗降低很多

Mike表示随着 5G 网络投入运营,网络流量大幅增长,导致现有空间和功耗范围内功耗优化吞吐量与计算密度的需求不断提高。为支持业界应对这一挑战,Versal Premium 系列提供了高达 9Tb/s 的可扩展、自适应串行带宽。具体方法是将 112G PAM4 收发器与集成的网络功能模块用于核心网、城域网和数据中心互联( DCI )基础设施,将每端口带宽密度提高两倍,并降低时延高达 50%。 

图18  Versal Premium 系列提供了高达 9Tb/s 带宽

图18  Versal Premium 系列提供了高达 9Tb/s 带宽

另外,这种预制连接可实现安全的多太位以太网( multi-terabit Ethernet ),灵活支持各种数据速率与协议。通道化以太网硬核能够以最小占板空间提供高达 5Tb/s 的吞吐量,同时高速加密引擎可提供高达 1.6Tb/s 的加密线路速率吞吐量,并支持 AES-GCM-256/128、MACsec 和 IPsec 。 

图19  Versal Premium 系列可实现安全的多太位以太网

图19  Versal Premium 系列可实现安全的多太位以太网

Mike表示Versal Premium 系列AI方面也有一些独特优势,例如在网络异常检测AI上,支持入侵检测、恶意软件识别,它有应对新兴威胁的自适应 AI 算法,而赛灵思随机森林算法(Random Forest)IP 现已供货。在配置与网络性能 AI上,可以自动检测与性能瓶颈纠正,还能自动配置,最大限度延长正常运行时间 (MLP)。

图20  Versal Premium 系列AI方面也有一些独特优势

图20  Versal Premium 系列AI方面也有一些独特优势

供货情况

据介绍,Versal Premium 系列旨在帮助超大规模数据中心用户为多元化的数据中心工作负载实现最高加速水平。将超过 120TB/s 的片上存储器带宽与可定制存储器层级相结合,能够减少数据移动从而消除相应的关键瓶颈,与此同时,还支持以嵌入式方式将预制连接与硬核集成到现有云基础设施中。从基因组学、数据分析和视频转码,到针对语音和图像识别的 AI 推断。

Versal Premium 有VP1102、VP1202VP1402VP1502VP1552VP1702VP11802 七个系列,在系统逻辑单元,IP核的配置上有所差异。

图21  Versal Premium产品系列组合

图21  Versal Premium产品系列组合

据悉,Versal Premium系列将于 2021 年上半年开始为早期用户提供样品。目前已提供文档,客户可立即使用 Versal Prime 评估套件开始原型设计。Versal Prime 器件与 Versal Premium 器件拥有众多相同的架构模块,支持引脚迁移至 Versal Premium。

图22  Versal Premium供应情况

图22  Versal Premium供应情况

注:本文为原创文章,转载请注明作者及来源

明仕彩票app相关的文章

Digi-Key