如今要是没有自动驾驶,都不好意思叫自己是新能源汽车。
相对于电力的应用,如今不少新能源汽车都更强调科技感——原本的自动泊车已经远远不能满足大众的需求,L2甚至L3级别的自动驾驶才是当下应用的重点。借助于强大的算力和神经网络技术,许多新能源汽车都可以在本地对驾驶状况进行计算;当然为了了应对复杂状况,这些汽车也都提供了对于5G网络的支持,这样可以保证随时随地都能实现高效的数据传输。
这也可以看作的是5G与AI应用的巧妙结合,即我们现在经常提到的AI-on-5G。其实如今的智能化社会下,许多行业都面临着前所未有的转型,这种转型的显著特征就是实现了算力与智能化的融合,比如在基因工程、工业制造、科研探索等多个领域都是如此,比如加州大学就在研究如何利用GPU和深度学习技术展示新冠病毒的感染全过程。从这个角度来说,越来越多的企业都在实现高性能计算与AI的融合,而这种融合正在成为一种全新的趋势。
这也正是算力应用的多元化。以往,许多计算应用必须借助于X86平台才能实现,但是在GPU出现之后,我们慢慢发现如今许多AI算力都可以借助于GPU来完成,而在这一过程中CPU所扮演的角色越来越趋于辅助性,甚至如今的绝大部分AI应用中,GPU完全成为了计算主力,而是将系统协调工作交付给了CPU。
这就是业界所说的“高性能计算革命”,从传统数据中心到边缘计算,从私有云、公有云到混合云,如今这种趋势已经越来越明显,多样化算力也成为了行业发展的必然趋势。甚至在号称“计算桂冠上明珠”的高性能计算TOP500榜单中,使用ARM架构处理器的日本超级计算机富岳一骑绝尘,成为了世界排名第一的超级计算机,这更是证明了ARM应用已经是大势所趋。
因此,在日前召开的ISC世界超算大会上,NVIDIA 首席执行官黄仁勋旗帜鲜明的表示:“我们正处在行业高性能计算革命的开端。我们相信,将 ARM 模型应用到高性能计算的时机已经到来”,他补充说,“NVIDIA 可以快速启动ARM 高性能计算生态系统”。
事实也正是如此,继日本的富岳之后,SiPearl将称为欧洲百亿亿级 (Exascale) 超算系统的CPU、亚马逊的Amazon Graviton也表示将使用ARM、甚至包括我们前面提到的5G 基站也在使用Marvell提供的ARM芯片……这一切都说明,ARM应用与数据中心、建立强大的高性能计算生态系统已经势不可挡。这同时也表示着,在拿下移动和嵌入式市场之后,ARM同样也适合企业级市场。
英伟达恰恰是这个市场的积极布局者。应该说在最近这5-6年时间里,乘着AI应用的春风,英伟达GPU已经成为了智能化的代名词,而在ARM处理器生态和市场的积极布局,更让人对数据中心市场充满了期待。按计划,英伟达已经立了丰富的高性能计算生态系统,未来如何加上与ARM的携手,则可以彻底引领高性能计算生态的发展,同时对于整个生态也会带来全新的、彻底的“大洗牌”。
许多人或许还记得英伟达在今年GTC大会上宣布的DPU平台,这也是其践行“高性能计算 + 加速计算 + 深度学习”趋势的一部分。对于这个趋势,黄仁勋信心满满,他更认为“行业面临的问题不再是计算机能够做什么,而是谁率先利用它来推动行业的革新。”很显然,在这个“后摩尔定律”时代,英伟达敏锐把握到了算力多样化的时代、把握了全球对于数字化、智能化转型的强烈需求,也通过努力实现了“高性能计算 + 加速计算 + 深度学习”的行业格局,奠定了全新时代的基础。
在满足了大众算力与应用的需求之外,英伟达更是积极布局互联需求。也是在这次ISC大会上,英伟达推出了面向AI与高性能计算领域推出了最新的NVIDIA HGX 加速服务器平台,将强大核心算力NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand网络系统,以及NVIDIA Magnum IO GPUDirect Storage软件融入其中,推动更多行业充分利用高性能计算的力量。
据悉,这次发布的全新NVIDIA A100 80GB PCIe GPU实现了运行内存容量的倍增,同时GPU内存带宽增加了25%,达到了惊人2TB/s。大容量和高速带宽为大规模神经网络的运算提供了充足空间,最大限度降低了节点之间通信和能耗所带来的性能损失;巨大内存容量再加上高内存带宽,可以将更多数据和网络保存在内存中,最大限度地减少节点间通信和能耗。凭借其更快的内存带宽,研究人员能够获得更高的吞吐量和更快的结果,实现IT投资价值的最大化。
从传统的高性能计算到全新的AI计算,英伟达的身影一直都在,并通过加速为用户提供更强的算力、更快的传输和更好的解决方案。通过这次TOP500榜单我们也看到全新的变化——
有139刷系统采用了英伟达的GPU加速器,大约占据了整个榜单份额的27.8%;
有169刷系统采用了英伟达的InfiniBand网路,超过了榜单份额的三分之一,并且其中有76刷采用的都是HDR网络,接近了上榜系统的近一半;
微软Azure集群Pioneer-EUS 占据了榜单24到27的4个名额,Amazon EC2 实例集群也在榜单排名第41位;
这说明越来越多的AI应用正在崛起。其实除了微软和亚马逊这种代表性企业之外,包括剑桥大学CSD3 云原生超级计算机、再比如美国国家能源研究科学计算中心 (NERSC) 的超级计算机Perlmutter,这些设备都在不同程度上采用了英伟达的产品和解决方案,比如A100 Tensor Core GPU、HDR 200G InfiniBand网路和BlueField DPU等等,这都证明了英伟达在高性能计算领域的不可替代性。
伴随着智能化应用的进一步发展,伴随着我们对于算力、网络和加速等应用的进一步需求,伴随着AI计算应用的大面积普及,无论是在5G、自动驾驶、工程制造、生物医疗等任何领域,我们都将看到越来越多看到英伟达的身影,也将加速整个社会的数字化步伐。