BetVictor Sports(伟德体育)国际官网(访问: hash.cyou 领取999USDT)
我们可以根据英伟达的命名规则,来大致推测其一款GPU芯片的主要应用方向。一般来说。名称前缀带GeForce的即主要应用于游戏等消费领域;名称中没有GeForce但有RTX、Quadro的,主要应用于专业设计领域,其中RTX表明GPU具备光追功能;名称中没有前述所有字样,但直接以GPU架构开头字母命名的,如A100(Ampere)、H100(Hopper)、L4(Ada Lovelace)、B200(Blackwell)则主要应用于数据中心。
从GPU性能对比来看,2023年底AMD发布的MI300X,在浮点运算能力方面曾短暂超过英伟达当时的最新产品H200。但在2024年英伟达Blackwell架构下的B200发布后,B200的低精度运算能力又反超AMD。在终端需求,由于大模型的训练、推理往往以低精度运算为主,因此英伟达的最新GPU依然相较AMD有明显优势。此外,英伟达耗时十余年打造的CUDA软件生态,也让英伟达在软件层面建立了独特的护城河,大大提高了市场对其GPU产品的认可度。
以GB200 NVL72为例,目前英伟达使用了定制化的铜缆实现机柜内9个NV Switch和18个计算节点的NVLink连接。英伟达介绍NVIDIA GB200 NVL72可以在一个NVLink domain内连接576个GPU,总带宽超过1PB/S和240TB的闪存。而最大的变化是NV Switch从服务器PCB板载芯片的形式调整为机柜内的9台交换机,连接能力提升至72个GPU,这就需要使用铜缆实现机柜内的NVLink连接。
人工智能的快速发展带来了大量的算力和机柜需求。但受限于数据中心建设面积及环保要求,传统风冷越来越难以满足散热需求,需要液冷的不断升级弥补。在(1)芯片单点冷却方面:芯片功率密度的不断提升直接影响着芯片的散热和可靠性,逼近风冷散热上限800W左右,而液冷能有效满足芯片的散热需求;(2)机柜整体冷却方面:芯片功率的增加也导致整机柜功率的增长,采用传统风冷的数据中心通常可以解决12kW以内的机柜制冷。随着服务器单位功耗增大,同样尺寸的普通服务器机柜可容纳的服务器功率往往超过15kW,相对于现有的风冷数据中心,已逼近空气对流散热能力天花板,液冷或将成为最佳选择。
HASHKFK