理想汽车取得决策模型的训练方法及装置专利,提升自动驾驶技术领域的训练效率

科技知识 2024-02-04 clz123 65428

金融界2023年12月20日消息,据国家知识产权局公告,北京罗克维尔斯科技有限公司取得一项名为“决策模型的训练方法及装置“,授权公告号CN111832652B,申请日期为2020年7月。

专利摘要显示,本发明公开一种决策模型的训练方法及装置,涉及自动驾驶技术领域。本发明的方法包括:S1:基于预置强化学习算法建立智能体,智能体包含决策模型和评价模型;S2:从仿真平台中获取当前时刻仿真车辆对应的第一环境模型、第一高精地图、第一车辆信息和标准位置;S3:根据第一环境模型、第一高精地图、第一车辆信息、标准位置和评价模型确定奖励函数,基于奖励函数对决策模型和评价模型进行训练;S4:判断累计训练次数是否达到预设训练次数及累计训练时长是否达到预设训练时长;若累计训练次数未达到预设训练次数且累计训练时长未达到预设训练时长,则回到步骤S2;若累计训练次数达到预设训练次数和/或累计训练时长达到预设训练时长,则停止训练。

理想汽车取得决策模型的训练方法及装置专利,提升自动驾驶技术领域的训练效率

本文源自:金融界

作者:情报员