基于雙估計強化學(xué)習(xí)結(jié)合前向預(yù)測控制的自動駕駛運動控制研究
汽車工程
頁數(shù): 13 2024-04-25
摘要: 運動控制研究是實現(xiàn)自動駕駛目標的重要組成部分,針對傳統(tǒng)強化學(xué)習(xí)算法在求解中因單步?jīng)Q策局限而導(dǎo)致控制序列次優(yōu)的問題,提出了一種基于雙估計強化學(xué)習(xí)算法及前向預(yù)測控制方法結(jié)合的運動控制框架(DEQL-FPC)。在該框架中引入雙估計器以解決傳統(tǒng)強化學(xué)習(xí)方法動作值過估計問題并提高訓(xùn)練優(yōu)化的速度,設(shè)計前向預(yù)測多步?jīng)Q策方法替代傳統(tǒng)強化學(xué)習(xí)的單步?jīng)Q策,以有效提高全局控制策略的性能。通過虛擬駕駛...