亚洲精品亚洲人成在线观看麻豆,在线欧美视频一区,亚洲国产精品一区二区动图,色综合久久丁香婷婷

              當(dāng)前位置:首頁 > 科技文檔 > 自動化 > 正文

              基于碰撞預(yù)測的強化模仿學(xué)習(xí)機器人導(dǎo)航方法

              計算機工程與應(yīng)用 頁數(shù): 12 2023-04-11
              摘要: 基于學(xué)習(xí)的機器人導(dǎo)航方法存在對數(shù)據(jù)的依賴性高和在一些特定環(huán)境下表現(xiàn)不完美的問題,例如在空曠場景下無法走直線,在障礙物密集場景下碰撞率高。為了提高機器人的導(dǎo)航性能,提出了一種基于碰撞預(yù)測的強化模仿學(xué)習(xí)導(dǎo)航方法。在無模型的情況下,根據(jù)機器人的性能,建立馬爾科夫決策過程(Markov decision process,MDP)中所需要的狀態(tài)空間、動作空間、獎勵函數(shù)。采用深度強化學(xué)習(xí)(... (共12頁)

              開通會員,享受整站包年服務(wù)立即開通 >