5月 AGI技术月报下篇

2024年9月10日修改

NVIDIA AI 芯片演进解读与推演

https://mp.weixin.qq.com/s/PQL1popiYarfXpiALlhHcw

NVIDIA 的 GB200 超级芯片采用双 Die 设计，具备 20 PFLOPS 的 FP4 算力，与前代 H100 相比，晶体管数量增加了一倍，算力提升了 5 倍。GB200 通过 NVLink、InfiniBand 和 Ethernet 三种网络技术实现互联，其中 NVLink 作为专有技术，演进速度最快，适用于 GPU 直连互联。GB200 NVL72 系统采用背板电缆互联，实现了高效的算力扩展，但面临高功耗和散热挑战。未来 AI 芯片发展可能面临的挑战包括算力提升受限于工艺演进、存储技术的发展与 GPU 演进同步问题，以及机框间互联技术成本和功耗的挑战。SuperPOD 超级节点的商业化需要降低 Rack-to-Rack 互联成本。NVLink、InfiniBand 和 Ethernet 三种网络技术在未来不太可能融合，各自在特定应用场景中具有不同的优势和发展方向。

50%

附件不支持打印

加载失败，

50%

5月 AGI技术月报 下篇​

5月 AGI技术月报下篇