基于深度強(qiáng)化學(xué)習(xí)的多飛行器自適應(yīng)協(xié)同航路規(guī)劃
戰(zhàn)術(shù)導(dǎo)彈技術(shù)
頁數(shù): 11 2024-04-15
摘要: 針對(duì)單一飛行器突防及作戰(zhàn)能力受限的問題,提出一種多飛行器自適應(yīng)協(xié)同航路規(guī)劃方法。通過引入多智能體深度強(qiáng)化學(xué)習(xí)算法,構(gòu)建多飛行器航路規(guī)劃決策框架,對(duì)各飛行器在線航路規(guī)劃指令進(jìn)行求解。在此基礎(chǔ)上,提出一種改良DL-MADDPG算法,引導(dǎo)智能體進(jìn)行干擾學(xué)習(xí),提升飛行器在復(fù)雜環(huán)境下的適應(yīng)能力。同時(shí),在獎(jiǎng)勵(lì)函數(shù)中分別設(shè)定協(xié)同獎(jiǎng)勵(lì)和個(gè)體獎(jiǎng)勵(lì),有效保證多飛行器系統(tǒng)策略協(xié)同性和各飛行器個(gè)體策略...