时间:2024-04-03 00:04:27来源:界面新闻
正在进行研发的毫末则采取了将端到端大模型进行拆分的方式来降低训练难度:一个阶段解决感知问题,即让模型看懂世界,一个阶段解决认知问题,即做出驾驶决策。这样做的好处一是可以先独立训练,再进行调和,降低训练难度,二是在不同的阶段可以采用不同的数据,大幅降低数据成本。
此外,毫末还在端到端自动驾驶中引入了LLM(大语言模型),通过感知大模型识别后,将这些信息输入LLM,通过LLM来提取世界知识,并作为辅助特征来指导驾驶决策。
但据贺翔介绍,这个系统极为复杂,算力消耗非常大,目前还只能在云端运行,未来几年将加快向车端的落地。
端对端的未来还有哪些可能性呢?贺翔提到,为了解决长尾数据问题,业界也在尝试用AIGC技术构造数据。
面对一个尚未解决的问题,如果现实环境难以采集到类似的数据,例如车祸,可以考虑使用 AIGC技术来定向生成类似场景的数据,来快速提升效果。也可以使用仿真引擎来构造类似的场景,生成数据。
随着越来越多的端到端驾驶系统投入研发、落地,这一技术的未来也会越来越清晰。但是对于企业来说,起跑的枪声已经打响,路线是关键,而朝着选好的方向狂奔,也是他们不得不的选择。