依托多風格強化學(xué)習(xí)的車輛軌跡跟蹤避撞控制
汽車工程
頁數(shù): 11 2024-06-24
摘要: 軌跡跟蹤避撞是車輛智能性的重要體現(xiàn),針對現(xiàn)有控制方法面對同一場景的控制風格單一問題,本文中提出了一種多風格型強化學(xué)習(xí)控制方法。為實現(xiàn)控制風格多樣性,首次將風格指標引入值網(wǎng)絡(luò)和策略網(wǎng)絡(luò),搭建了多風格跟蹤避撞策略網(wǎng)絡(luò),并結(jié)合值分布強化學(xué)習(xí)理論構(gòu)建了多風格策略迭代框架,依托該框架推導(dǎo)提出了多風格值分布強化學(xué)習(xí)算法。仿真和實車試驗表明:所提出方法可以多種駕駛風格(激進、中性、保守)完成...