0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大家都在争相超过A100,无人对标的Grace Hopper性能几何?

E4Life 来源:电子发烧友网 作者:周凯扬 2023-09-06 01:10 次阅读

电子发烧友网报道(文/周凯扬)作为英伟达CPUGPU技术开发上的集大成之作,Grace Hopper很大程度上象征着复杂计算领军产品。尽管英伟达竭尽所能地去堆这一“超级芯片”的性能,但英伟达还是选择将Grace Hopper(GH200)描述成了世界上最万能的计算平台,这也得益于它同时在AI计算和HPC计算领域展现的可怕性能。

AI计算性能

相信绝大多数人已经从市场疯抢A100、H100的现状,对Hopper GPU(H100)的性能有了大致的了解,但Grace Hopper作为一个异构计算平台,在与传统的x86 CPU与H100对比上,也有着不小的性能差距。

首要区别自然就是连接Grace CPU和Hopper GPU的NVLink-C2C,这一高带宽低延迟的互联技术可谓是目前唯一能发挥H100近乎全部实力的方案。支持最高144TB内存的同时,提供900GB/s的带宽。

英伟达官方也对部分AI计算负载进行了测试,在终端应用上对比x86+Hopper与Grace Hopper的一体化方案有何异同。其性能差距可以说是巨大的,就拿最常见的大语言模型推理来说,GH200可以做到x86平台的4.5倍性能表现,而DLRM(深度学习推荐模型)训练与图神经网络(GNN)训练的性能也可以分别达到3.5倍和1.9倍。

其实这里的差异还是体现在互联方案的带宽上,例如x86+Hopper的方案还是在使用PCIe方案,该方案在batch size较小时性能落后还不算明显,一旦到了更大的batch size,PCIe的带宽就成了瓶颈,而不断以高带宽输送数据给H100的NVLink-C2C则可以实现比PCIe高出数倍的性能。

HPC计算性能

Grace Hopper的另一大应用领域自然就是HPC了。HPC主要集中在一些科学、工程的复杂计算上,比如天气预测、生命科学、流体力学等。然而与此同时,不少商业相关的HPC计算也在进一步推动HPC的发展,甚至更早用上最新芯片技术,比如油藏模拟等。

著名油藏模拟软件ECHELON的开发商Stone Ridge,在最近获得了早期访问权,对英伟达的H100-PCIe、H100-NVL和Grace-Hopper来了场性能测试。早在Volta和Ampere架构时,Stone Ridge就对不同架构的GPU进行了测试,而如今的H100相较这些旧GPU已经在CUDA核心、内存容量和内存带宽上有了数倍的提升。

这些还只是表面上的变化,英伟达还引入了诸多架构改进,提高了ML和HPC应用程序的性能。而Grace Hopper相较传统的x86+GPU方案就更具优势了,首先Grace本身就是一个强大的CPU,每个内核都有四个128位适量单元,超高的内存带宽以及超大的L2+L3缓存。其次,NVLink的存在大大减少了CPU和GPU之间的通信时间。

wKgaomT2_uKAdLA8AAFQ5Yki0Qg725.png
不同架构不同版本的英伟达GPU在ECHELON模型上的性能对比 / Stone Ridge


Stone Ridge选择了不同细胞规模的模型,从83000个细胞到670万个细胞,其中Grace Hopper都展现出了不俗的性能,最高可达Volta架构的V100的5.7倍。值得一提的是,由于CPU采用了新的Arm架构,所以ECHELON必须重新编译才能在系统上运行,不过对于ECHELON来说,重新编译并不要花太多力气,他们在不修改代码的情况就成功重编译在GH200上正常运行。如果对代码进行进一步优化的话,还有机会获得更高的性能表现。如此高的性能提升,意味着油藏勘探模拟的时间可以被大幅缩短,从而加快油藏评估的速度。

结语

可以说无论是A100还是H100,都只是英伟达在AI与HPC战线扩大战果的第一步棋,明年Q2交付到各大系统中的GH200才是最大的杀手锏,也很可能会成为更抢手的数据中心与超算中心硬件产品。这也恰好证明了英伟达给它的定位,世界上最万能的计算平台。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    评论

    相关推荐

    Arm Neoverse NVIDIA Grace CPU 超级芯片:为人工智能的未来设定步伐

    性能飞跃,例如训练具有超过一万亿个参数的 NLP 模型,同时显着提高每瓦性能。NVIDIA Grace CPU Superchip 将包含两个 Grace CPU,总共多达 144 个
    发表于 03-29 14:40

    NVIDIA推出了基于A100的DGX A100

    A100 80GB加速卡之后,NVIDIA也更新了自家的DGX A100产品线,最多可达640GB HBM2e显存了。此外,还有全新的DGX Station A100工作站,配备了4个A100 80GB显存,还上了压缩机制冷。
    的头像 发表于 11-17 10:26 3586次阅读

    NVIDIA发布最新Hopper架构的H100系列GPU和Grace CPU超级芯片

    Hopper架构的H100系列GPU和Grace CPU超级芯片!
    的头像 发表于 03-26 09:07 2027次阅读

    NVIDIA Grace Hopper超级芯片赋能推荐系统

    Grace Hopper 超级芯片,有助于用户个性化互联网的大规模 AI 模型的性能更加准确。
    的头像 发表于 09-23 11:32 899次阅读

    通往AGI之路:揭秘英伟达A100A800、H800、V100在高性能计算与大模型训练中的霸主地位

    Grace Hopper 芯片和 144TB 的共享内存连接成一个单元。除此之外,英伟达A100A800、H100、V100也在大模型训练中广受欢迎。
    的头像 发表于 06-29 11:23 1.5w次阅读
    通往AGI之路:揭秘英伟达<b>A100</b>、<b>A</b>800、H800、V<b>100</b>在高<b>性能</b>计算与大模型训练中的霸主地位

    NVIDIA Grace Hoppper所带来的性能突破

    Grace Hopper 超级芯片架构
    的头像 发表于 07-05 16:30 117次阅读

    英伟达a100和h100哪个强?

    a100和h100哪个强? 英伟达A100比H100更强。英伟达A100在处理大型模型和数据集时可能比V100表现更优秀。 H100 是一款针对大模型专门优化过的芯片,使用台积电 5nm 定制
    的头像 发表于 08-07 17:32 4373次阅读

    英伟达a100a800的区别

    性能为19.5 TFLOPS,而A800为10.6 TFLOPS。 3. 存储容量不同:A100的显存最大为80 GB,而A800为48 GB。 4. AI加速器不同:A100配备Tensor
    的头像 发表于 08-07 17:57 1.3w次阅读

    英伟达A100和4090的区别

    A100和4090的区别 英伟达A100和4090都是英伟达的高性能计算卡型号。它们之间的主要区别在于: 1. 架构:英伟达A100采用的是Ampere架构,而4090采用的是Volta架构
    的头像 发表于 08-08 11:59 5496次阅读

    英伟达A100是什么系列?

    A100是什么系列? 全球都在关注生成式人工智能;特别是OpenAI发布ChatGPT以来,生成式人工智能技术一下就被拔高。在大模型训练中,A100是非常强大的GPU。英伟达的AI芯片这个时候
    的头像 发表于 08-08 15:13 589次阅读

    英伟达A100的简介

    A100的简介 A100都是非常强大的GPU。英伟达A100A800、H100、V100也在大模型训练中广受欢迎。特别是OpenAI发布ChatGPT以来,全球都在关注生成式人工智能。 英伟
    的头像 发表于 08-08 15:17 4337次阅读

    英伟达A100的优势分析

    A100是一款高性能的GPU,其主要优势如下: 1. 支持高效的AI计算:A100采用了新一代的Tensor Core技术,能够在AI计算方面提供卓越的性能,为AI模型的训练和推理
    的头像 发表于 08-08 15:25 1613次阅读

    英伟达A100的算力是多少?

    性能和156 TFLOPS的深度学习性能。 英伟达a100显卡采用了7nm制程工艺+Ampere架构; 英伟达a100拥有540亿个晶体管,超过6912个CUDA核心,是
    的头像 发表于 08-08 15:28 5049次阅读

    英伟达a100和h100哪个强?英伟达A100和H100的区别

    a100和h100哪个强? 就A100和H100这两个产品来说,它们虽然都是英伟达公司的高性能计算产品,但是面向的市场和应用场景不同,所以不能简单地说哪个更强。 NVIDIA A100是一款
    的头像 发表于 08-09 17:31 1.1w次阅读

    英伟达v100A100的差距有哪些?

    100A100的差距有哪些? 在当今人工智能和深度学习技术日益发展的时代,高性能计算机显卡已成为支持这些技术发展的关键。英伟达是高性能计算机显卡领域的领导者之一,其v100A100显卡
    的头像 发表于 08-22 16:46 2985次阅读