资讯
IT之家 8 月 30 日音尘,微软公司出席 Hot Chip 2024 大会,共享了 Maia 100 芯片的规格信息。Maia 100 是台积电 5nm 节点上制造的最大处理器之一,成心为部署在 Azure 中的大规模 AI 责任负载而缱绻。
IT之家附上 Maia 100 芯片规格如下
芯片尺寸:820 深广毫米
封装:遴荐 COWOS-S 夹层时刻的 TSMC N5 工艺
HBM BW/Cap;1.8TB/s @ 64GB HBM2E
峰值密集 Tensor POPS: 6bit: 3,9bit: 1.5, BF16: 0.8
L1/L2:500MB
后端网罗 BW:600GB/s(12X400gbe)
主机 BW(PCIe):32GB/s PCIe Gen5X8
缱绻 TDP:700W
Provision TDP:500W
Microsoft Maia 100 系统遴荐垂直集成形势,以优化老本和性能。它还遴荐定制劳动器板,配备成心缱绻的机架和软件堆栈,以普及性能。
Maia 100 架构高速 Tensor 单位可为施行和推理提供高速处理,同期相沿多种数据类型,单位遴荐 16xRx16 结构。
矢量处理器是一个松散耦合的超标量引擎,遴荐定制领导集架构(ISA),相沿包括 FP32 和 BF16 在内的多种数据类型。
径直内存探询(DMA)引擎相沿不同的张量分片决议。
硬件 semaphores 相沿 Maia 系统的异步编程。
为普及数据欺诈率和能效,大型 L1 和 L2 scratch pads 交由软件惩处。
Maia 100 遴荐基于以太网的互联时刻和访佛 RoCE 的定制合同,可齐备超高带宽意料。它相沿高达 4800 Gbps 的 all-gather 和 scatter-reduced 带宽,以及 1200 Gbps 的 all-to-all 带宽。
在软件方面,Maia 软件竖立器具包(SDK)允许任何东谈主快速将其 PyTorch 和 Triton 模子移植到 Maia。Maia SDK 为竖立东谈主员提供了多个组件,使他们偶然爽气地将模子部署到 Azure OpenAI 劳动。