本篇报告是 AI 洞察系列深度第三篇,研究视角聚焦在组网结构,更多从集群组网变化来分析硬件架构的技术演进趋势以及对算力产业链投资机会影响。
AI 组网走向更大规模集群,单节点和节点间网络性能要求持续提升。AI 网络由服务器—交换机——光/铜连接硬件构成,Scaling Laws 驱动算力集群规模快速增长,为迎合更大 AI 集群变化,在单网络节点追求带宽提升,即 Scale up;在网络整体规模上追求更大承载力,即 Scale out,成为确定性趋势。
Scale up:满足分布式训练通信要求,提升节点带宽,带动节点内部互联需求提升。大模型训练主要采用分布式训练架构,对应张量并行、流水线并行及数据并行的混合并行策略,其中张量并行对通信的要求最高,常常发生在服务器(超节点)内部,做大超节点规模,内部互联带宽提升优先级更高,升级压力更大。英伟达目前通过 GB200 形态+NVLINK 协议进行超节点规模迭代并采用铜互连方案,推动铜互联新市场需求爆发。短期铜有望主导 Scale up互连,长期来看伴随带宽升级,铜互连传输距离限制或推动光互联方案替代。
Scale out:做大 AI 集群规模,除了单节点带宽提升,节点之间的互联要求也将提升,AI 集群组网规模已正式步入 10 万卡阶段,集群规模提升带来的带宽提升将推动交换机、光模块迭代,缩短产品周期并巩固行业竞争格局。
1)交换机环节:单卡容量升级,模块化设计增加交换机端口数,快速提升网络承载能力。单交换机芯片容量升级加快(当前主流方案为 51.2T,博通预计下一代 102.4T 容量交换芯片有望在 2025 年发布),为满足更快速的带宽提升要求,交换机厂商开始布局模块化方案,通过提高交换机端口数来快速满足组网需要,有望提升交换机的价值量。
2)光模块环节:总需求高增长,硅光有望加速。总需求增长仍跟 AI 算力增长成正比关系,产品快速迭代巩固当前竞争格局;在技术迭代上,硅光有望在国内光模块龙头推动下,大幅提升 1.6T 阶段渗透率,并有望逐步推动 CPO形态产品的量产。
投资建议:Scaling Laws 驱动 AI 算力集群规模快速提升,超节点内部带宽升级优先级更高,机柜内部硬件核心受益,节点间互联带宽亦快速增长,交换机模块化,光模块硅光渗透率提升趋势确定。光模块、铜互连、以太网交换机核心受益。重点推荐:新易盛、中际旭创、天孚通信、鼎通科技等;建议关注:光迅科技、华工科技、盛科通信、紫光股份、锐捷网络、源杰科技等。
风险提示:以太网交换机在 AI 市场进展不及预期,AI 应用进度不及预期,竞争加剧。
目 录
1、 Scale up:带宽升级压力更大,铜连接等核心受益.......... - 4 -
1.1、超节点内部:Scale Up 带动带宽持续提升..........- 4 -
1.2、超节点规模:由 GPU 或者云厂商设计决定.......... - 7 -
1.3、带宽提升驱动内部互联密度提升.......... - 9 -
2、Scale out:集群规模升级,以太网和硅光化加速..........- 11 -
2.1、AI 集群规模走向 10 万卡阶段.......... - 11 -
2.2、以太网组网落地加速..........- 12 -
2.3、博通和英伟达方案提供互联技术基础.......... - 14 -
2.4、交换机模块化,推动 Scale out 规模提升.......... - 17 -
2.5、光模块:总需求保持向上,硅光是趋势.......... - 19 -
3、投资逻辑及标的推荐..........- 22 -
4、风险提示..........- 23 -

因篇幅限制,仅展示部分,更多重要内容、核心观点,请下载报告。