LLM 推动 AI Agent 进入新阶段,AI 应用商业化或加速
AI Agent 是一种能够感知环境、进行决策和执行动作的智能实体,从发展历程看,经历了用逻辑规则和符号封装知识、快速响应环境、基于强化学习等发展阶段。随着大语褀模型(LLM)的快速发展,AI Agent 在感知、记忆、规划、行动等模块方面的能力均得到了进一步的提升。我们认为 LLM 推动 AI Agent 进入了新阶段,与 LLM 结合的 AI Agent 在智能化程度、自主性方面有进一步提升的潜力,通过与终端的进一步结合,有望推动 AI 应用商业化加速。
AI Agent 能力提升:感知/规划/记忆模块强化或工程化优化从 AI Agent 的研究看, AI Agent 的要素基本上可以分为感知、定义、记忆、规划、行动五类模块。从 AI Agent 的能力提升路径看,主要包括:1)单个模块的持续强化:感知模块的模态持续丰富、记忆模块增长上下文或提供更加丰富的数据来源、规划模块中通过 CoT 或 ReAct 等方式提升推理能力、行动模块补充第三方插件;2)系统性方式优化:如通过将 AI 各个模块作为整体发挥作用,利用不同环境之间交互获取的跨模态数据,在物理和虚拟世界中运行等。综上,在底层模型升级+工程化方法改进的共同推进下 AI Agent的性能有望持续提升。
Agent 自动解决固定范式的问题,关注 Agent Workflow 基于 LLM 的 Agent 实践已经取得一定的成果,从 AutoGPT、GPTs、Devin等案例中可以看出,当前 Agent 将 LLM 应用于信息检索、工具学习、任务分解、垂直知识学习、人机交互等场景,实现了能力的突破。一方面 LLM相比传统 NLP 在处理文本信息中的效率有所提升,另一方面特定数据训练赋予 LLM 较好的解决垂类问题的能力,基于此当前 LLM 对于固定范式下解决问题已经能够实现较好的自动化。我们认为通过 Agent Workflow 的方式,能够更好的实现 AI Agent 与具体任务的结合,或将推动 LLM 技术在更复杂的应用场景中进一步提升效率。
Agent 改变人机交互方式,关注软硬件产业机遇
AI+终端实现了安全性与个性化的结合,为 Agent 落地打下良好基础。AI Agent 有望改变人机交互的方式,落地方式包括 AIPC、AI 手机等。终端掌握了重要的交互入口,据 Apple WWDC,Siri 用户每天发出的语音请求数量高达 15 亿次,大量的交互为 Agent 提供了丰富的场景载体;此外通过压缩模型到适合端侧大小的模型,使用优化算法加速推理,实现在端侧落地。对比 Agent 的技术架构,往往也需要基础模型和小模型的共同支撑,我们认为端侧模型技术的发展(模型压缩等技术)有助于 Agent 落地于终端。
相关公司梳理从 AI Agent 的进展看,在理论研究中发现通过 CoT(思维链)、ReAct(推理+行动)等方式能够完成部分的任务规划,且长期看通过 AI Agent 或有望进一步走向整体智能;在实践中,通过将 AI 助手嵌入工作流也已打造出基于特定数据、场景的 Agent 产品雏形,我们认为随着:1)底层大模型能力的提升;2)Agent+工作流的工程化实践深入,AI Agent 能力有望进一步提升,或将推动 AI 商业化进程加速。重点关注公司:1)协同办公厂商:包括金山办公、泛微网络、福昕软件等;2)垂直应用厂商:包括用友网络、鼎捷软件、同花顺、中控技术、宝信软件等;3)终端厂商:中科创达等。
风险提示:模型能力进步不及预期;安全性风险;本研报中涉及到未上市公司和未覆盖个股内容,均系对齐客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。
正文目录
核心观点.......... 5
与市场观点的不同之处 .......... 5
AI Agent:通过 AGI 的核心基础 .......... 6
AI Agent:LLM 推动 AI Agent 进入新阶段 .......... 8
智能助手到 Agent:由搜索匹配走向规划与交互式决策.......... 8
分模块持续突破+系统性优化推动 AI Agent 能力提升 .......... 11
感知:模型端原生多模态推进,Agent 多模态感知能力可期.......... 11
记忆:模型端上下文长度持续突破,向量外部存储与检索强化长期记忆 .......... 12
规划:关注 LLM 对于任务分解算法及反思提炼能力的改变 .......... 13
行动:工具使用能力为关键,具身智能为新方向 .......... 13
多路径共同提升 Agent 整体智能化水平,有望逐步通向整体智能 .......... 14
路径一:模态丰富+具身智能+多 Agent 协同 .......... 15
路径二:通过提升整体性或利用工作流解决复杂问题 .......... 16
AI Agent 技术逐步落地,智能性仍有提升空间 .......... 18
AutoGPT:利用 LLM 逐步拆解任务,外挂插件提升能力 .......... 18
卡耐基梅隆 Agent:利用 LLM 强化信息获取及工具使用 .......... 20
Devin:利用 AI 实现自主编程 .......... 21
AI Agent:智能性仍有提升空间,关注 Agent Workflow .......... 22
模型&MaaS 厂商:凭丰富工具&实践经验把握发展机遇 .......... 24
MaaS 厂商侧重 2B 业务场景:2B 提供落地工具+2D 提供开发框架 .......... 24
2B:基于业务卡位,提供落地工具 .......... 24
2D:提供开发框架,卡位开发者场景 .......... 27
模型厂商落地:GPTs 通过配置实现定制化,打造 LLM 垂直领域助手 .......... 27
应用厂商:具备垂直数据与工程化优势,关注工作流卡位 .......... 29
与工作流结合,推动 Agent 落地——以 Servicenow 为例 .......... 29
基于私有数据,打造智能应用——以 Salesforce 为例 .......... 30
终端厂商:推动人机交互升级,率先实现 Agent 落地 .......... 32
总结:从 AI Agent 有望逐步通向 AGI .......... 34
相关公司梳理 .......... 35
风险提示.......... 35
图表目录
图表 1: AI Native(AI 原生应用) .......... 6
图表 2: AI Agent:改变人机交互方式 .......... 6
图表 3: GPT-4o 已初步具备 Agent 能力 .......... 6

因篇幅限制,仅展示部分,更多重要内容、核心观点,请下载报告。