kaiyun开云电竞-英伟达将量子与人工智能集成为高性能计算中心

发布时间:2023-04-10 16:33

1764574218445256.png

英伟达今年大部分时间都在推出新产品和合作伙伴关系,旨在确保其在仍是人工智能市场的狂野西部中保持领先地位,同时确立其在新兴量子计算领域的地位,联合创始人兼首席执行官黄仁森认为英伟达将成为关键的基础设施提供商和加速器。

最近,英伟达在十月底于华盛顿特区举办的GTC大会上,发布了公司一贯的大量公告,黄和英伟达高管发布了新产品,如NVQLink——一种开放的高速互联系统,将量子处理器与超级计算机中的GPU连接起来,打造公司所称的“加速量子超级计算机”;BlueField-4,一款数字处理单元(DPU),结合了64核“Grace”处理器和ConnectX-9,创造了800 Gb/sec 平台,支持超级级人工智能工厂,以及开放的人工智能模型和数据。

在本周于圣路易斯举行的SC25超级计算大会上,英伟达的重点将是展示围绕这些技术形成的合作伙伴关系和客户成果,展示其在行业中的影响力以及其技术似乎无处不在的特性。例如,公司宣布过去一年全球推出了80多套由Nvidia驱动的新科学系统,累计实现了4500亿亿次人工智能(即机器最低精度)的性能。

1764574039518757.jpg

在与记者的简报会上,英伟达高性能计算与人工智能基础设施高级总监Dion Harris谈到了公司2016年推出的DGX-1,这是一款高度集成的硬件和软件系统,用于人工智能和加速工作负载,这在以GPU闻名的厂商中是首次实现这一举措。

1764574083330784.jpg

哈里斯说:“我们开发DGX1是因为我们知道仅仅在芯片层面创新不足以满足即将到来的人工智能浪潮的需求。”“仅仅在系统架构层面创新是不够的。我们需要在浮点作、计算、内存、系统架构等领域创新,同时也要在可扩展的网络、可扩展的网络,当然还有软件方面进行创新。英伟达的平台加速计算涵盖CPU、GPU、内存、可扩展网络、可扩展网络、机架级架构以及软件。我们优化了从芯片到系统、网络、软件到应用的整个技术栈,并且持续优化软件,实现产品生命周期内多个X因素的性能提升。”

在上个月的GTC活动上,黄炳哲介绍了NVQLink,并补充说,将量子系统与经典超级计算机连接,将通过利用超级计算机中的GPU解决量子系统纠错这一棘手问题。加入 Nvidia 的量子经典计算平台 CUDA-Q,将使用户超越纠错,协调量子设备和人工智能超级计算机来运行量子 GPU 计算。

1764574119848618.jpg

NVQLink 在 FP4 精度下提供 40 petaflops 的 AI 性能,GPU 与 QPU 吞吐量为 400 Gb/sec,延迟不到 4 微秒。

当时,该供应商指出,美国有九个国家实验室和研究中心——包括洛斯阿拉莫斯国家实验室、橡树岭国家实验室、麻省理工学院、劳伦斯伯克利国家实验室和费米国家加速器实验室——正在采用NVQLink。在SC25大会上,英伟达宣布,来自亚洲和欧洲的十多个超级计算中心和国家研究机构也正在拥抱该技术,将量子与经典系统整合起来。

在亚洲,包括日本量子人工智能技术全球研究开发中心、韩国科学信息研究院以及台湾国家高性能计算中心。欧洲和中东的中心包括德国的Jülich超级计算中心、波兰的波兹南超级计算与网络中心,以及阿联酋的技术创新研究所。

量子经典的未来

哈里斯说:“未来,每台超级计算机都将依赖量子处理器来扩展其可计算的问题,而每个量子处理器都将依赖超级计算机来正常运行。”“原因是电脑不是单独工作的。它们依赖强大的经典处理器来管理、稳定和解释量子作。GPU充当大脑,协调量子硬件,执行量子处理器无法完成的繁重计算。”

他补充说,量子处理器与GPU超级计算机之间的集成极为艰巨。“执行量子纠错等任务需要量子GPU互联,其延迟和吞吐量均达到数百吉比特每秒。”

哈里斯还指出,除了超级计算和研究中心外,其他量子公司也在采用NVQLink。他提到了Quantinuum,该公司正在将互联纳入未来量子系统的路线图,并用其新款Helios芯片演示实时纠错。

1764574605832516.png

他说:“这项演示采用了极低延迟的算法,实现了由NVQLink和CUDA-Q实现的可扩展量子纠错码。”“这些进步为Quantinuum提供了可扩展的GPU超级计算访问权,其量子处理器的总往返时间为67微秒,完全符合其系统扩展所需的限制。”

英伟达还宣布,日本研究中心理研将其技术应用于两台新超级计算机,一台运行人工智能科学工作负载,另一台专为量子计算设计。第一个系统将包含1600块Nvidia Blackwell GPU,采用GB200 NVL4平台,这是一种液冷系统,面向高性能计算和人工智能应用,集成两颗Grace CPU和四颗Blackwell GPU,集成在单节点上。超级计算机将在生命科学、材料科学、气候与天气预报以及制造业等领域开展研究工作。

1764574322998970.jpg

该量子计算系统将包括540个Blackwell,并采用GB200 NVL4平台,所有平台均与英伟达的Quantum-x800 InfiniBand网络互联。它将用于量子算法、混合仿真和量子-经典计算方法的研究。

SC25的发布发布距离理研在东京FugakuNEXT国际倡议发布仪式上表示计划与富士通和英伟达合作,共同设计继Fugaku之后的下一代超级计算机FugakuNEXT仅两个月。

在另一项合作中,Arm宣布基于其Neoverse设计的CPU将通过Nvidia的NVLink Fusion与AI芯片集成,该Fusion是其NVLink高速结构的扩展,允许合作伙伴通过将自有CPU、ASIC及其他组件与Nvidia GPU集成,构建定制和半定制的AI基础设施。

这对谷歌、亚马逊和Microsoft等正在打造基于Arm的云服务芯片的超大规模企业来说是个好消息,现在他们还能将其与Nvidia GPU集成。

此外,英伟达宣布,德克萨斯先进计算中心(TACC)、亚马逊云服务的Lambda无服务器计算服务以及AI云计算公司CoreWeave将整合其于四月推出的Quantum-X Photonics InfiniBand COP网络交换机,以节省能源消耗和运营成本。

与此同时,HPC存储厂商DDN、VAST Data和WEKA正在采用BlueField-4 DPU应用于多种工作,从下一代AI工厂到通过智能数据流动改进AI流水线,再到WEKA推出的NeuralMesh AI软件定义存储产品。

kaiyun开云电竞-