∝ 06 现在的位置:首页 > 期刊导读 > 2012 > 06 >

单交叉口信号配时的离线Q学习模型研究

作者: 卢守峰 ; 韦钦平 ; 刘喜敏

关键词: 交通控制 信号配时 离线 学习 变周期

摘要:

为提高交通控制系统的适应性和鲁棒性,采用强化学习方法实现交通控制模型的学习能力。对固定周期和变周期两种模式下的单交叉口信号配时优化进行研究,构造了等饱和度优化目标的奖赏函数,建立了等饱和度和延误最小两个优化目标的离线Q学习模型。采用对流量进行离散的方法解决了状态维数爆炸问题。通过算例对建立的4种离线Q学习模型解的结构、最优解的分布进行分析,结果表明相对于在线Q学习模型,离线Q学习模型更适合交叉151信号配时优化。采用“离线学习,在线应用”的方法,将建立的定周期延误最小离线Q学习模型与Webster定周期模型的性能进行对比,总体上前者的车均延误和累积延误低于后老n

上一篇:基于粒子群优化的细菌觅食优化算法
下一篇:一类非线性微分代数子系统的逆系统控制及应用

版权所有《控制工程》编辑部 copyright © 2005-2012
地址:沈阳市东北大学310信箱 邮政编码:110004  辽ICP备05001360号