地平线提出AlphaDrive,首次基于GRPO强化学习和规划推理实现自动驾驶大模型

地平线提出AlphaDrive,首次基于GRPO强化学习和规划推理实现自动驾驶大模型

摘要:将DeepSeek R1的强化学习和推理策略应用于自动驾驶,大幅提升规划性能和训练效率 项目主页:htt…
正在加载中...

已加载所有文章

已经没有更多文章了