创新的并行计算设计采用国内硬件,突显了北京更广泛的战略,以降低关键技术中的“瓶颈”风险。

中国的计算机研究人员使用国产图形处理器,在性能上实现了接近十倍的提升,超过了依赖于英伟达尖端硬件的强大美国超级计算机,这一成果来自于一项经过同行评审的研究。该成就指出了华盛顿日益升级的技术制裁可能带来的意想不到后果,同时挑战了长期以来被视为先进科学研究必不可少的美国制造芯片的主导地位。

研究人员表示,创新的软件优化技术使他们能够提高由中国设计的图形处理单元(GPU)驱动的计算机的效率,从而在某些科学计算中超越美国超级计算机。尽管怀疑者警告称,仅靠软件调整无法无限期弥补硬件差距,但这一进展凸显了北京在关键技术领域减轻“瓶颈”风险的更广泛战略。

科学家们通常依赖模拟来模拟现实世界的情况,例如设计防洪或城市内涝的方案。但这种复制,尤其是大规模、高分辨率的模拟,需要大量的时间和计算资源,从而限制了这种方法的更广泛应用。

对于中国科学家来说,挑战更加艰巨。在硬件方面,高级GPU如A100和H100的生产被外国制造商主导。在软件方面,总部位于美国的英伟达限制其CUDA软件生态系统在第三方硬件上运行,从而阻碍了独立算法的发展。

为了寻求突破,南京河海大学水文水资源与水利工程国家重点实验室的南同超教授开始探索基于国产CPU和GPU的“多节点、多GPU”并行计算方法。他们的研究成果于1月3日发表在《水利工程学报》上。

成功的并行计算的关键在于多个节点之间高效的数据传输和任务协调,从而最小化性能损失。


在2021年,美国橡树岭国家实验室的马里奥·莫拉莱斯-埃尔南德斯及其研究团队引入了一种名为TRITON的“多节点、多GPU”洪水预测模型,使用了Summit超级计算机。然而,尽管使用了64个节点,“加速比”——即处理速度的提升——仅约为六倍。

Nan提出了一种新架构,将多个GPU组合成一个节点,以补偿国内CPU和GPU的性能限制。同时,他在软件层面改善了节点之间的数据交换,以减少它们之间的通信开销。

根据论文,该模型在一个国内通用的x86计算平台上建立。使用的CPU是国内的Hygon处理器,型号7185——具有32个核心、64个线程和2.5 GHz的时钟速度。GPU也是国内生产,配备了128GB的内存和200 Gb/s的网络带宽。

新模型仅使用七个节点就达到了六倍的加速比——比TRITON使用的节点数量减少了约89%。

为了验证模型的有效性并评估其计算效率,Nan的团队选择了位于中国东部山东省枣庄的庄里水库作为模拟对象。

使用200个计算节点和800个GPU,该模型在短短三分钟内模拟了洪水演变过程,达到了超过160倍的加速比——远远超过了TRITON模型的表现。

“在短短几分钟内模拟流域规模的洪水意味着现在可以更快、更详细地进行洪水演变和各种降雨-径流场景的实时模拟。这可以增强洪水控制和灾害预防工作,改善实时水库管理,最终减少生命和财产损失,”Nan在论文中说道。

该研究的代码可以在一个开源网站上获得。Nan补充说,这些发现不仅可以应用于洪水建模,还可以应用于水文气象、沉积和地表水-地下水相互作用等领域的复杂系统模拟。

“未来的工作将扩展其应用,并进一步测试其在工程实践中的稳定性,”他补充道。


原文链接: https://www.scmp.com/news/china/science/article/3298226/chinese-gpus-outdo-nvidia-chips-nearly-tenfold-supercomputer-simulation-study?module=top_story&pgtype=homepage

点赞(0) 打赏

评论列表 共有 0 条评论

评论功能已关闭
立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部