9 月 12 日,OpenAI 正式发布 o1 模型,测试表明在数据分析、编码和数学领域中,o1 的受欢迎程度远远高于 GPT-4o。相较于 GPT-4、GPT-4o 等传统 LLM,我们认为 o1 有四大关键变化值得关注。
(1)LLM 的思考分析能力再次得到强化,数理、代码能力显著得到加强。根据 OpenAI 的测试,在国际数学奥林匹克(IMO)资格考试中,GPT-4o 仅正确解决了 13%的问题,而 o1 得分为 83%;o1 在Codeforces 比赛中位居 89%分位;此外,在绝大多数推理需求较强的任务中,o1 的表现明显优于 GPT-4o。o1 在回答问题时会进行思考,将复杂问题分解为若干简单问题,并尝试不同解题路径,该过程可以极大提升模型推理能力。在 OpenAI 给出的解码问题实例中,o1 会通过自问自答的方式将问题拆解为诸多细分问题,并相继给予解答或否定。
(2)o1 能力提升的背后是强化学习的结果。根据 OpenAI 官网,o1模型花更多时间思考问题,然后再做出反应,类似于人类;通过训练,o1 能够学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。我们认为,数理、编程等问题通常具有更加具体、确定性强的答案,因此非常适合用作强化学习训练。
(3)尺度定律(Scaling Law)再次被证实,意味着训练/推理算力需求或进一步增加。OpenAI 在其研究博客中表示,随着强化学习的增加(以训练时间计算)和思考时间的增加(以测试时间计算),o1 的性能会持续提高。因此,尺度定律目前由训练侧延伸至推理侧,我们看好未来随着用户对模型性能的持续提升带来的推理算力需求提升。
(4)LLM 变得更加安全。OpenAI 在开发这些新模型的过程中提出了一种新的安全训练方法,利用模型的推理能力,使其遵守安全和协调准则。在 OpenAI 最严格的“越狱”测试之一中,GPT-4o 得分为 22(百分制),而 o1-preview 模型得分为 84,表明 o1 的高级推理能力提高了安全性,因为 o1 可以根据上下文适应安全规则,并更有效地应用这些规则,从而使模型更能抵御有害内容的生成。
投资建议。o1 模型代表的是真正的“智能“,人类 AGI 之路又迈进一步,o1 的发布标志着模型能力上限再次被提升,推理尺度定律拉动算力需求进一步上行,2025、2026 年可能远非算力投资的顶峰,算力需求中长线逻辑再次确立。继续推荐新易盛、天孚通信。
风险提示。AI 基础设施建设不及预期的风险;AI 应用发展不及预期的风险;AI 领域的进出口政策变化的风险;国际合作减少的风险。
目录索引
一、核心观点 .......... 4
二、本周行情回顾 .......... 6
三、行业数据更新 .......... 9
四、本周要闻回顾 .......... 12
五、风险提示 .......... 16

因篇幅限制,仅展示部分,更多重要内容、核心观点,请下载报告。