基于改进PPO算法的城轨能量管理策略

陈沁鑫; 秦斌; 王欣

陈沁鑫,秦斌,王欣.基于改进PPO算法的城轨能量管理策略[J].电工技术,2025(1):41-45

基于改进PPO算法的城轨能量管理策略

DOI：10.19768/j.cnki.dgjs.2025.01.012

中文关键词: 城轨列车混合储能系统功率分配强化学习

英文关键词:

基金项目:

作者	单位
陈沁鑫	湖南工业大学电气与信息工程学院
秦斌	湖南工业大学电气与信息工程学院
王欣	湖南工业大学电气与信息工程学院

摘要点击次数: 31

全文下载次数: 0

中文摘要:

为了削弱城轨交通系统牵引网电压波动并实现再生制动能量的回收利用，城市轨道交通系统一般会采用超级电容加锂电池组成的混合储能系统来实现稳压和节能的双重目标。混合储能系统的功率分配问题是一个关键问题，因此提出了一种基于强化学习在线序列决策的功率分配策略。为了达到较好的稳压节能效果，对强化学习中的PPO算法进行了改进，将原算法中固定不变的学习率改为随时间变化的学习率，使得强化学习中智能体(Agent)的训练效果更好且算法收敛更快。将这种改进后的D PPO算法应用在城轨混合储能系统上，能够使混合储能系统更好地去削弱或填补牵引网电压的波峰和波谷并实现节能目的。为验证所提方法的有效性，在MATLAB和Python上进行联合仿真实验，结果表明所提方法削弱了城轨牵引网电压的波动并且实现了节能。

英文摘要:

查看全文查看/发表评论下载PDF阅读器