当前位置: 首页 > 资讯 > 电脑数码 > 电脑配件 > 显卡 >文章详情

加速器加速还是卡(加速卡是什么)

NVIDIA今晚如期举行了GTC 2022发布会,CEO黄仁勋拿出了三款加速卡/加速系统,H100、GH100和DCX H100,代号“Hopper”core。

NVIDIA 发布 H100、GH100和DCX H100 加速卡/系统

这三个平台和领域针对的是不同的场景。最低定位是H100,也就是单核。GH100是高性能HPC计算和高端AI人工智能的平台,而DGX H100是专门用于高端AI计算的平台。它有H100的八个通道,性能更强大,但不是最强大的。往下看。

NVIDIA 发布 H100、GH100和DCX H100 加速卡/系统

H100的规格与之前传言的不同。它使用TSMC的4纳米而不是5纳米,这是一个深度定制的过程。它采用CoWoS 2.5D晶圆级封装,内部集成了多达800亿个晶体管。它被认为是世界上最先进的芯片。

核心没有透露。之前传闻完整版有8组GPC(图形处理器集群),72组TPC(纹理处理器集群),144组SM(流式多处理器单元),而每组SM有128个FP32 CUDA核心,共计1843个。此外,张量张量核来到第四代,共有576个,另一个60MB的L2缓存。

显存方面,包含六个HBM3或HBM2e,单通道512位宽,总位宽6144位,是传统GDRR6X无法比拟的。所以HBM这种超带宽显存还是很有用的。希望以后能再次部署在游戏显卡中。

该卡支持PCIe 5.0和第四代NVLink,带宽提升至900GB/s,是PCIe 5.0的7倍,是A100的一半。

性能方面,FP64/FP32 60TFlops(每秒60万亿次)、FP16 2000TFlops(每秒2000万亿次)、TF32 1000TFlops(每秒1000万亿次)都比A100高3倍,FP8 4000TFlops(每秒4000万亿次)比A100高6倍。

NVIDIA 发布 H100、GH100和DCX H100 加速卡/系统

H100计算卡有SXM和PCIe 5.0两种形式,其中后者功耗高达300W,远高于A100。对了,AMD刚发布的M210也是300W。

H100拥有132组SM计算单元,共有16,896个CUDA核心、528个张量核心和50MB L2缓存。显存方面,搭载了五颗最新一代的HBM3,总容量80GB,位宽5120位,总带宽3TB/s,比A100多了一半。

NVIDIA 发布 H100、GH100和DCX H100 加速卡/系统

DGH100系统集成了八个H100芯片和两个PCIe 5.0 CPU处理器(英特尔蓝宝石Rapids IV可扩展至强?),共有6400亿个晶体管,640GB HBM3显存,24TB/s显存带宽。

NVIDIA 发布 H100、GH100和DCX H100 加速卡/系统

性能方面,AI计算能力为32PFlops(每秒3.2亿次),浮点计算能力为FP64 480TFlops(每秒480万亿次),FP16 1.6PFlops(每秒16万亿次),FP8 3.2PFlops(每秒3200亿次),分别是上一代DGX A100的3倍、3倍、6倍,新增。

同时搭载Connect TX-7网络互联芯片,TSMC 7nm工艺,800亿晶体管,400G GPU直接吞吐,400G加密加速,4.05亿/s信息速率。

NVIDIA 发布 H100、GH100和DCX H100 加速卡/系统

实际上,DGX H100是最小的计算单元。为了扩展,这次NVIDIA还设计了新的VNLink Swtich互联系统,最多可以连接32个节点,也就是可以扩展256个H100芯片。整个系统被称为“DGX吊舱”。

显存方面,该系统总显存高达20.5TB HBM3,总带宽768TB/s,AI性能高达颠覆性的1 eFLOPS(每秒100亿次),实现百亿亿次计算。

NVIDIA 发布 H100、GH100和DCX H100 加速卡/系统

最后是“H100 CNX”,除了集成的H100 GPU核心外,还有CX-7 SmartNIC网络芯片。GPU直接连接到网络,消除了系统带宽。该卡支持PCIe 5.0,最多可并发7个多GPU实例。

H100 CNX

H100 CNX

NVIDIA将从Q3开始供应OEM,包括Atos、思科、戴尔、富士通、技嘉、新华三、汇和、浪潮、联想、宁昌、魏超等将采用H100、GH100和DGX100推出新系统。

延伸阅读

NVIDIA 发布 H100、GH100和DCX H100 加速卡/系统

NVIDIA 发布 Grace 系列处理器,还有双芯版,性能无对手,专为加速系统平台除了全新“Hopper”架构H100核心的加速卡和加速系统,NVIDIA还带来了加速平台专用CPU——Grace。NVIDIAGrace拥有多达144个核心,支持最高内存带宽可达1TB/s,功耗500W,官方表示性能上没有对手。NVIDIAGrace家族还有一个版本,叫GraceCPUSuperch玩家直呼内行| 赞1 评论0 收藏0查看详情未经授权,不得转载
淘宝领券网资讯中心,全景关注各行业的发展风向,集中报道新品发布、业界动态和海淘情报,致力于呈现时效性和价值性俱佳的精选资讯。
已赞+1 已有人赞过
评论

  • 最新