基于深度强化学习PPO的车辆智能控制方法

2024-06-22 2280 1.21M 0

　　摘要：为了提高高速公路上混合环境下车辆的行驶效率、减少交通事故的发生，提出了一种基于近端策略优化（PPO）的车辆智能控制方法。首先，构建了一个融合深度强化学习和传统PID控制的分层控制框架，上层深度强化学习智能体负责确定控制策略，下层PID控制器负责执行控制策略。其次，为了提升车辆的行驶效率，通过定义优势距离对观测到的环境状态矩阵进行数据筛选，帮助自主车辆（Ego-car）选择具有更长优势距离的车道进行变道。为了加快深度强化模型的收敛速度，基于定义的优势距离提出了一种新的状态采集方法以减少数据处理量。另外，为了兼顾车辆的安全性、行驶效率和稳定性，设计了一个多目标奖励函数。最后，在基于Gym搭建的车辆强化学习任务仿真环境Highway＿env中开展了仿真测试，对所提方法在不同目标速度下的表现进行了分析和讨论。仿真测试结果表明，相比于深度Q 网络（DQN）方法，所提方法具有更快的收敛速度，且在两种不同目标速度下均能让车辆安全平稳地完成驾驶任务。

　　文章目录

　　0 概述

　　1 相关工作

　　2 场景描述及强化学习

　　2.1 场景描述与任务目标

　　2.2 强化学习

　　3 基于深度强化学习PPO的车辆智能控制方法

　　3.1 PPO算法

　　3.2 状态空间

　　3.3 动作空间

　　3.4 奖励函数

　　3.5 基于PPO的高速公路驾驶模型

　　4 仿真与分析

　　4.1 仿真平台及参数

　　4.2 仿真结果及分析

　　5 结束语

您还没有登录，请登录后查看详情

近端策略优化车辆控制分层控制框架多目标奖励函数

下一篇：考虑生产率差异的地区购买力平价试算研究
上一篇：铜绿微囊藻对自养氨氧化细菌的抑制作用

1/26专辑：论文下载

1.5M双S弯排气系统雷达吸波涂层应用的仿真计算

1.24M短距起飞/垂直降落飞机升力系统研究进展

1.84M航空涡扇发动机机械系统架构和技术综述

1.41M基于Noradamantane的高能量密度富氮笼型含能分子设计与性能预估

0.49M一种视/触觉融合的柔性物体抓取力估计方法

1.18M构建与新发展阶段相适应的现代化意识形态

1.16M猕猴桃叶水浸提液对4种植物化感作用及其化学成分分析

0.71M基于完全但不完美信息序贯博弈计量模型的农地流转影响因素

0.83M病原学送检管理的相关信息化建设要求

0.85M基于非线性加权法的航空发动机总体性能优化设计

1.42M鹅不食草药材倍半萜内酯类特征图谱的建立及多成分定量研究

0.83MGaR视角下海洋产业结构升级、科技创新与海洋经济高质量发展

0.51M经济发展阶段、要素条件变化与区域产业演化路径：后发国家视角

1.56M分离纯化对银耳多糖结构及体外降脂活性的影响

0.59M现代化产业体系绩效测度与区域差异研究——基于江苏与相关省市数据样本分析视角

0.59M“一带一路”背景下柬埔寨海岸带管理体系研究

0.89M中国海洋经济高质量发展的时空差异及影响因素研究

1.16M碳酸钙处理工业废硫酸的硫酸钙结晶与过滤性能研究

0.83M非结核分枝杆菌病诊治六十年

7.87M厚朴酚、和厚朴酚对脂多糖诱导小鼠肠道损伤的抗炎作用及机制研究

1.83MALVE的筛查整合及其对坝上长尾鸡生产性能的影响

1.57M高比例植物蛋白对青鱼幼鱼生长、消化、肝功能及血清生化指标的影响

1.82M絮凝技术在毕赤酵母发酵液固液分离中的应用研究

1.72M黔西南州不同饲草品种生产性能及营养品质的综合评价

5.88M射干不同部位总三萜提取工艺优化及其抗氧化活性分析

10.22M英格兰保护区城市设计控制制度对中国历史文化街区保护更新的启示

点赞 0举报收藏 0打赏 0评论 0

虚交所
加关注9
~~虚拟资产交易平台~~

相关文档

	双S弯排气系统雷达吸波涂层应用的仿真计算
	短距起飞/垂直降落飞机升力系统研究进展
	航空涡扇发动机机械系统架构和技术综述
	基于Noradamantane的高能量密度富氮笼型含能分子设计与性能预估
	一种视/触觉融合的柔性物体抓取力估计方法
	构建与新发展阶段相适应的现代化意识形态
	猕猴桃叶水浸提液对4种植物化感作用及其化学成分分析
	基于完全但不完美信息序贯博弈计量模型的农地流转影响因素
	病原学送检管理的相关信息化建设要求
	基于非线性加权法的航空发动机总体性能优化设计

本类推荐

	基于动力学分析的赛车结构优化及行驶稳定性控制
	安全增强的车载嵌入式系统中任务映射和调度算法
	基于多学科的发动机悬置支架轻量化设计研究
	自动驾驶模块化公交服务优化研究
	间距对带能量回收装置的汽车队列气动特性影响
	光储充技术在传统加油站中的应用
	电动汽车地毯隔音垫的轻量化设计及其声学性能改进
	大客车尾翼的数值模拟与风洞试验
	无人自行车质量偏心识别的认知学习方法研究

下载排行