月度归档： 2025 年 3 月

地平线提出AlphaDrive，首次基于GRPO强化学习和规划推理实现自动驾驶大模型

地平线提出AlphaDrive，首次基于GRPO强化学习和规划推理实现自动驾驶大模型

摘要：将DeepSeek R1的强化学习和推理策略应用于自动驾驶，大幅提升规划性能和训练效率项目主页：htt…

科技早报

TechHub科技圈 2025年3月12日 8,027 浏览评论

正在加载中...

已加载所有文章

已经没有更多文章了