德邦证券发布了一份深度解析特斯拉FSD自动驾驶方案的报告,共53页。该报告详细介绍了特斯拉FSD架构的细节,包括规划、神经网络、训练数据、训练基础设施、AI编译与推理等方面,并对FSD V12的未来展望进行了分析。更多重要内容、核心观点,请参考报告原文。
报告核心内容解读
1. 特斯拉FSD架构详解
FSD是一套包含感知/规控/执行的全链路自动驾驶软硬件架构。
* 自动驾驶规划(Planning)——采用混合规划系统,提供最优规控解决方案。基于Vector Space的FSD路径规划,能够快速产生最优解。
* 神经网络(Neural Networks)——算法经历多次迭代,BEV+Transformer+Occupancy为当前架构。升级至Occupancy能够有效优化障碍物识别问题。HydraNets(九头蛇网络)为视觉感知网络的基础结构。通过端到端的感知训练模型,从数据输入到空间向量输出。基于3D Occupancy迭代车道线及障碍物感知模型。
* 训练数据(Training Data)——由2D手工标注逐步升级为4D自动标注,数据闭环趋于完善。为什么要采用4D自动标注?——大幅提升标注效率。如何进行4D自动标注?—采集Clips通过机器算法生成Labels。4D自动标注的几个关键步骤。为什么要做仿真模拟?—泛化Corner Case,赋能模型迭代。如何进行仿真模拟?——五大步骤。自成闭环的数据引擎能够更好地优化神经网络。
* 训练基础设施(Training Infra)——Dojo何以为道?——化繁为简,以少为多的集群架构。Dojo助力加速自动标注、Occupancy Networks。不止于此,Dojo的更大野心。
* AI编译与推理(AI compiler & inference)——对端到端延迟进行严格控制+部署更先进的调度代码。目标:将所有操作在计算机上运行。如何做?——将得到的One-Hot编码通过矩阵乘法运算实现。效果如何?—运行7500万个参数的模型延迟不到10ms,消耗功率8W。
2. FSD V12展望
* FSD V12或将完全转向端到端自动驾驶技术方案。
* 端到端方案中神经网络是关键,有望实现全局最优解。
* 感知端率先落地,BEV本质上是一种端到端感知解决方案。
报告节选
因篇幅限制,仅展示部分,更多重要内容、核心观点,请参考报告原文或底部相关报告。