发表日期:2018年06期 出版:《应用科技 主管单位:哈尔滨工程大学 作者:郜丽鹏,杜旭华 页数:5页(依默认发送格式:PDF计算) PDF编号:PDF9YYKJ2018060070 可选格式:Word、ePUB、PPT(课件用途) 下载次数:163 论文引用次数:1

建立了以平均排队长度差最小为优化目标的在线Q学习模型.针对控制性能指标相对于临近的配时方案不敏感的特点,提出了以平均排队长度差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性.集成Excel VBA、Vissim、matlab建立了在线仿真平台,作为计算环境对模型进行...

公告:百度文库、百度云(百度盘)、Matlab演示破解版下载、Matlab运行实例数据暂未提供。