信息技术-计算机深度研究：AI Agent：通往AGI的核心基础(附40页报告下载) - 行业研究

报告摘要

LLM 推动 AI Agent 进入新阶段，AI 应用商业化或加速

AI Agent 是一种能够感知环境、进行决策和执行动作的智能实体，从发展历程看，经历了用逻辑规则和符号封装知识、快速响应环境、基于强化学习等发展阶段。随着大语褀模型（LLM）的快速发展，AI Agent 在感知、记忆、规划、行动等模块方面的能力均得到了进一步的提升。我们认为 LLM 推动 AI Agent 进入了新阶段，与 LLM 结合的 AI Agent 在智能化程度、自主性方面有进一步提升的潜力，通过与终端的进一步结合，有望推动 AI 应用商业化加速。

AI Agent 能力提升：感知/规划/记忆模块强化或工程化优化从 AI Agent 的研究看， AI Agent 的要素基本上可以分为感知、定义、记忆、规划、行动五类模块。从 AI Agent 的能力提升路径看，主要包括：1）单个模块的持续强化：感知模块的模态持续丰富、记忆模块增长上下文或提供更加丰富的数据来源、规划模块中通过 CoT 或 ReAct 等方式提升推理能力、行动模块补充第三方插件；2）系统性方式优化：如通过将 AI 各个模块作为整体发挥作用，利用不同环境之间交互获取的跨模态数据，在物理和虚拟世界中运行等。综上，在底层模型升级+工程化方法改进的共同推进下 AI Agent的性能有望持续提升。

Agent 自动解决固定范式的问题，关注 Agent Workflow 基于 LLM 的 Agent 实践已经取得一定的成果，从 AutoGPT、GPTs、Devin等案例中可以看出，当前 Agent 将 LLM 应用于信息检索、工具学习、任务分解、垂直知识学习、人机交互等场景，实现了能力的突破。一方面 LLM相比传统 NLP 在处理文本信息中的效率有所提升，另一方面特定数据训练赋予 LLM 较好的解决垂类问题的能力，基于此当前 LLM 对于固定范式下解决问题已经能够实现较好的自动化。我们认为通过 Agent Workflow 的方式，能够更好的实现 AI Agent 与具体任务的结合，或将推动 LLM 技术在更复杂的应用场景中进一步提升效率。

Agent 改变人机交互方式，关注软硬件产业机遇

AI+终端实现了安全性与个性化的结合，为 Agent 落地打下良好基础。AI Agent 有望改变人机交互的方式，落地方式包括 AIPC、AI 手机等。终端掌握了重要的交互入口，据 Apple WWDC，Siri 用户每天发出的语音请求数量高达 15 亿次，大量的交互为 Agent 提供了丰富的场景载体；此外通过压缩模型到适合端侧大小的模型，使用优化算法加速推理，实现在端侧落地。对比 Agent 的技术架构，往往也需要基础模型和小模型的共同支撑，我们认为端侧模型技术的发展（模型压缩等技术）有助于 Agent 落地于终端。

相关公司梳理从 AI Agent 的进展看，在理论研究中发现通过 CoT（思维链）、ReAct（推理+行动）等方式能够完成部分的任务规划，且长期看通过 AI Agent 或有望进一步走向整体智能；在实践中，通过将 AI 助手嵌入工作流也已打造出基于特定数据、场景的 Agent 产品雏形，我们认为随着：1）底层大模型能力的提升；2）Agent+工作流的工程化实践深入，AI Agent 能力有望进一步提升，或将推动 AI 商业化进程加速。重点关注公司：1）协同办公厂商：包括金山办公、泛微网络、福昕软件等；2）垂直应用厂商：包括用友网络、鼎捷软件、同花顺、中控技术、宝信软件等；3）终端厂商：中科创达等。

风险提示：模型能力进步不及预期；安全性风险；本研报中涉及到未上市公司和未覆盖个股内容，均系对齐客观公开信息的整理，并不代表本研究团队对该公司、该股票的推荐或覆盖。

正文目录

核心观点.......... 5

与市场观点的不同之处 .......... 5

AI Agent：通过 AGI 的核心基础 .......... 6

AI Agent：LLM 推动 AI Agent 进入新阶段 .......... 8

智能助手到 Agent：由搜索匹配走向规划与交互式决策.......... 8

分模块持续突破+系统性优化推动 AI Agent 能力提升 .......... 11

感知：模型端原生多模态推进，Agent 多模态感知能力可期.......... 11

记忆：模型端上下文长度持续突破，向量外部存储与检索强化长期记忆 .......... 12

规划：关注 LLM 对于任务分解算法及反思提炼能力的改变 .......... 13

行动：工具使用能力为关键，具身智能为新方向 .......... 13

多路径共同提升 Agent 整体智能化水平，有望逐步通向整体智能 .......... 14

路径一：模态丰富+具身智能+多 Agent 协同 .......... 15

路径二：通过提升整体性或利用工作流解决复杂问题 .......... 16

AI Agent 技术逐步落地，智能性仍有提升空间 .......... 18

AutoGPT：利用 LLM 逐步拆解任务，外挂插件提升能力 .......... 18

卡耐基梅隆 Agent：利用 LLM 强化信息获取及工具使用 .......... 20

Devin：利用 AI 实现自主编程 .......... 21

AI Agent：智能性仍有提升空间，关注 Agent Workflow .......... 22

模型&MaaS 厂商：凭丰富工具&实践经验把握发展机遇 .......... 24

MaaS 厂商侧重 2B 业务场景：2B 提供落地工具+2D 提供开发框架 .......... 24

2B：基于业务卡位，提供落地工具 .......... 24

2D：提供开发框架，卡位开发者场景 .......... 27

模型厂商落地：GPTs 通过配置实现定制化，打造 LLM 垂直领域助手 .......... 27

应用厂商：具备垂直数据与工程化优势，关注工作流卡位 .......... 29

与工作流结合，推动 Agent 落地——以 Servicenow 为例 .......... 29

基于私有数据，打造智能应用——以 Salesforce 为例 .......... 30

终端厂商：推动人机交互升级，率先实现 Agent 落地 .......... 32

总结：从 AI Agent 有望逐步通向 AGI .......... 34

相关公司梳理 .......... 35

风险提示.......... 35

图表目录

图表 1： AI Native（AI 原生应用） .......... 6

图表 2： AI Agent：改变人机交互方式 .......... 6

图表 3： GPT-4o 已初步具备 Agent 能力 .......... 6
因篇幅限制，仅展示部分，更多重要内容、核心观点，请下载报告。
信息技术-计算机深度研究：AI Agent：通往AGI的核心基础

报告摘要

相关报告

热门标签

热门报告

热门洞察