規(guī)則耦合下的多異構(gòu)子網(wǎng)絡(luò)MADDPG博弈對(duì)抗算法
智能系統(tǒng)學(xué)報(bào)
頁(yè)數(shù): 19 2023-07-31
摘要: 針對(duì)多無(wú)人機(jī)博弈對(duì)抗過程中無(wú)人機(jī)數(shù)量動(dòng)態(tài)衰減問題和傳統(tǒng)深度強(qiáng)化學(xué)習(xí)算法中的稀疏獎(jiǎng)勵(lì)問題及無(wú)效經(jīng)驗(yàn)抽取頻率過高問題,本文以攻防能力及通信范圍受限條件下的多無(wú)人機(jī)博弈對(duì)抗任務(wù)為研究背景,構(gòu)建了紅、藍(lán)兩方無(wú)人機(jī)群的博弈對(duì)抗模型,在多智能體深度確定性策略梯度(multi-agent deep deterministic policy gradient, MADDPG)算法的Actor-...