滑翔導(dǎo)彈末段多約束智能彈道規(guī)劃
來(lái)源:《光學(xué)精密工程》,作者邵會(huì)兵等
摘要:滑翔導(dǎo)彈末段飛行時(shí)空復(fù)雜度高、不確定性強(qiáng)、約束多,給彈道規(guī)劃與制導(dǎo)算法帶來(lái)了較大的建模和求解難度。針對(duì)這一問(wèn)題,同時(shí)增大末段機(jī)動(dòng)范圍并提高彈道規(guī)劃效率,本文提出一種利用連續(xù)型深度置信神經(jīng)網(wǎng)絡(luò)(Convolutional Deep Brief Networks,CDBN)預(yù)測(cè)機(jī)動(dòng)能力、設(shè)計(jì)經(jīng)由點(diǎn)狀態(tài)實(shí)現(xiàn)末段多約束智能彈道規(guī)劃的方法。過(guò)程中采用CDBN對(duì)機(jī)動(dòng)能力進(jìn)行在線預(yù)測(cè),快速判定經(jīng)由點(diǎn)狀態(tài)的可行性,并且通過(guò)經(jīng)由點(diǎn)狀態(tài)智能設(shè)計(jì),實(shí)現(xiàn)前后段能量的優(yōu)化分配,擴(kuò)大彈道機(jī)動(dòng)包絡(luò);通過(guò)設(shè)計(jì)三角函數(shù)型彈目視線角實(shí)現(xiàn)末段彈道擺動(dòng)機(jī)動(dòng),推導(dǎo)機(jī)動(dòng)彈道最優(yōu)末制導(dǎo)律對(duì)視線角進(jìn)行跟蹤,并調(diào)節(jié)機(jī)動(dòng)頻率以滿足速度約束。仿真結(jié)果表明,CDBN相對(duì)BP網(wǎng)絡(luò)具有更高的機(jī)動(dòng)能力預(yù)測(cè)精度;本文所提智能彈道規(guī)劃方法在滿足末端速度約束的前提下,可以實(shí)現(xiàn)彈道擺動(dòng)機(jī)動(dòng)并大幅增加飛行包絡(luò)。彈道規(guī)劃能夠在0.5 s內(nèi)完成,滿足工程應(yīng)用的快速性要求。
關(guān)?鍵?詞:滑翔導(dǎo)彈;機(jī)動(dòng)能力預(yù)測(cè);連續(xù)型深度置信網(wǎng)絡(luò);機(jī)動(dòng)彈道規(guī)劃
1 引 言
滑翔導(dǎo)彈是一種區(qū)別于傳統(tǒng)彈道導(dǎo)彈、可在臨近空間長(zhǎng)時(shí)間高速滑翔、機(jī)動(dòng)飛行的新型武器裝備[1],具有飛行速度快、飛行高度高、飛行環(huán)境復(fù)雜的特點(diǎn)。為了滿足現(xiàn)代化戰(zhàn)爭(zhēng)中實(shí)際作戰(zhàn)需要,滑翔導(dǎo)彈需要具有對(duì)威脅區(qū)和攔截網(wǎng)進(jìn)行規(guī)避、對(duì)攔截彈和探測(cè)網(wǎng)有效突防、為滿足制導(dǎo)或偵察需求經(jīng)由特定區(qū)域以及對(duì)目標(biāo)進(jìn)行高精度打擊等能力。復(fù)雜的飛行環(huán)境、多變的戰(zhàn)場(chǎng)態(tài)勢(shì)、多類型的任務(wù)要求使滑翔導(dǎo)彈任務(wù)規(guī)劃及彈道規(guī)劃的時(shí)空復(fù)雜度急劇增加,亟需在相關(guān)技術(shù)中獲得突破。
滑翔導(dǎo)彈末段打擊任務(wù)對(duì)彈道末端傾角、速度等多種約束具有嚴(yán)苛的要求。同時(shí),飛行過(guò)程中的繞飛探測(cè)任務(wù)需要導(dǎo)彈在滿足速度、過(guò)載、姿態(tài)、終點(diǎn)狀態(tài)等多約束前提下增加飛行通道、擴(kuò)大機(jī)動(dòng)區(qū)域、增加機(jī)動(dòng)形式[2]。因此,需要開(kāi)展末段多約束彈道規(guī)劃和制導(dǎo)方法研究。
然而,滑翔導(dǎo)彈末段飛行的高時(shí)空復(fù)雜度、強(qiáng)不確定性和多約束的特點(diǎn)使相應(yīng)的彈道規(guī)劃與制導(dǎo)問(wèn)題也具有了類似的特征,既難以精確建模,又難以快速精確求解,需要研究行之有效的解決方案。近年來(lái),人工智能基礎(chǔ)理論獲得了突破發(fā)展,人工智能以其強(qiáng)大的學(xué)習(xí)能力與適應(yīng)性在自動(dòng)控制、航空航天等領(lǐng)域表現(xiàn)出突出的優(yōu)勢(shì)與應(yīng)用前景。其中,基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的智能方法在解決各領(lǐng)域中具有復(fù)雜、不確定、多約束等特點(diǎn)的問(wèn)題上獲得了巨大成功。深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)可通過(guò)大量樣本的訓(xùn)練來(lái)逼近實(shí)際問(wèn)題的真實(shí)模型,然后根據(jù)新的輸入迅速給出對(duì)應(yīng)的結(jié)果。因此,本文將結(jié)合深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),一方面解決滑翔導(dǎo)彈末段規(guī)劃與制導(dǎo)中部分環(huán)節(jié)的復(fù)雜系統(tǒng)建模問(wèn)題,一方面滿足在線彈道規(guī)劃與制導(dǎo)的快速性要求。
深度學(xué)習(xí)和傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)不同,在采用監(jiān)督學(xué)習(xí)進(jìn)行網(wǎng)絡(luò)訓(xùn)練前,引入了梯度向上的非監(jiān)督學(xué)習(xí),利用無(wú)標(biāo)記的訓(xùn)練樣本逐層訓(xùn)練參數(shù),通過(guò)對(duì)輸入數(shù)據(jù)信息的充分利用有效地解決了上述問(wèn)題,深度學(xué)習(xí)的深層非線性網(wǎng)絡(luò)結(jié)構(gòu)通過(guò)訓(xùn)練大量的樣本數(shù)據(jù)學(xué)習(xí)有用的特征,逼近復(fù)雜的非線性函數(shù)。目前較為公認(rèn)的深度學(xué)習(xí)基本模型包括卷積神經(jīng)網(wǎng)絡(luò)[3]、基于自動(dòng)編碼器的堆疊自動(dòng)編碼器[4]和基于限制玻爾茲曼機(jī) (Restricted Boltzmann Machine, RBM)的深度置信網(wǎng)絡(luò)(Deep Belief Network, DBN)[5]。DBN不僅在圖像、語(yǔ)音、金融預(yù)測(cè)、模式識(shí)別等領(lǐng)域表現(xiàn)出較好的特征提取及學(xué)習(xí)能力,而且在多因素影響的特征提取及回歸預(yù)測(cè)問(wèn)題中也得到越來(lái)越多的應(yīng)用研究,如儲(chǔ)層預(yù)測(cè)[6]、用戶投訴預(yù)測(cè)[7]、油井熱采效率預(yù)測(cè)[8]、工業(yè)軟測(cè)量建模[9]、疾病風(fēng)險(xiǎn)預(yù)警[10]等問(wèn)題。
在智能彈道規(guī)劃方面,魏黎明等人[11]利用BP神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了吸氣式高超聲速導(dǎo)彈突防彈道,在導(dǎo)彈工作動(dòng)壓窗口、攻角窗口的條件下,通過(guò)大量離線仿真數(shù)據(jù)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)以擬合得出導(dǎo)彈初始機(jī)動(dòng)高度、馬赫數(shù)、質(zhì)量與機(jī)動(dòng)時(shí)間之間的非線性映射關(guān)系,從而實(shí)現(xiàn)了通過(guò)機(jī)動(dòng)初始條件預(yù)測(cè)機(jī)動(dòng)時(shí)間。方科等人[12]基于BP神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了高超聲速再入飛行器時(shí)間可控再入制導(dǎo)律,通過(guò)離線仿真獲得時(shí)間預(yù)估BP網(wǎng)絡(luò)訓(xùn)練集,并采用貝葉斯正則化算法進(jìn)行離線訓(xùn)練,從而實(shí)現(xiàn)了對(duì)剩余再入飛行時(shí)間的預(yù)估。相關(guān)研究主要集中于采用智能優(yōu)化算法進(jìn)行軌跡優(yōu)化設(shè)計(jì),以及采用大量離線數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)以實(shí)現(xiàn)對(duì)彈道規(guī)劃過(guò)程中相關(guān)參數(shù)的在線快速預(yù)測(cè)兩個(gè)方面。
為了增大滑翔導(dǎo)彈的末段機(jī)動(dòng)范圍并降低彈道規(guī)劃難度,本文提出一種利用經(jīng)由點(diǎn)設(shè)計(jì)實(shí)現(xiàn)末段多約束智能彈道規(guī)劃的方法。通過(guò)智能規(guī)劃經(jīng)由點(diǎn)狀態(tài),擴(kuò)大導(dǎo)彈機(jī)動(dòng)包絡(luò),同時(shí)保證有足夠的能量實(shí)現(xiàn)對(duì)目標(biāo)的多約束精確打擊。經(jīng)由點(diǎn)的智能設(shè)計(jì)中,將采用深度置信神經(jīng)網(wǎng)絡(luò)建立機(jī)動(dòng)能力預(yù)測(cè)模型,快速判定經(jīng)由點(diǎn)狀態(tài)的可行性,實(shí)現(xiàn)經(jīng)由點(diǎn)前、后段能量的合理分配,提高經(jīng)由點(diǎn)在線設(shè)計(jì)的效率。
為滿足彈道擺動(dòng)機(jī)動(dòng)需求,本文將導(dǎo)彈相對(duì)目標(biāo)點(diǎn)的視線角設(shè)計(jì)為三角函數(shù)形式,并通過(guò)設(shè)計(jì)機(jī)動(dòng)彈道最優(yōu)末制導(dǎo)律,實(shí)現(xiàn)對(duì)期望視線角的跟蹤,最后通過(guò)調(diào)節(jié)視線角的機(jī)動(dòng)頻率滿足期望的速度約束。
2 基于CDBN的末段機(jī)動(dòng)能力預(yù)測(cè)
2.1 機(jī)動(dòng)能力預(yù)測(cè)流程
結(jié)合任務(wù)需求,彈頭在滑翔末段需要判斷從當(dāng)前狀態(tài)是否能夠到達(dá)給定終端狀態(tài),為經(jīng)由點(diǎn)或機(jī)動(dòng)指令的設(shè)計(jì)提供基礎(chǔ)?;枘┒螜C(jī)動(dòng)能力可通過(guò)比較導(dǎo)彈當(dāng)前位置能量狀態(tài)與限定終端狀態(tài)后反向推算出的當(dāng)前位置所需最小能量狀態(tài)進(jìn)行衡量。其中當(dāng)前位置所需最小能量狀態(tài)是指,彈頭從當(dāng)前位置按當(dāng)前速度方向,以最省能量彈道到達(dá)給定終端位置時(shí),恰好滿足終端速度大小及方向約束,所對(duì)應(yīng)的初始能量狀態(tài)。由于無(wú)動(dòng)力導(dǎo)彈質(zhì)量恒定,故能量狀態(tài)可用速度來(lái)表示。
因此,對(duì)導(dǎo)彈機(jī)動(dòng)能力的預(yù)測(cè)可以通過(guò)建立相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型來(lái)進(jìn)行。即選取關(guān)鍵的狀態(tài)變量作為神經(jīng)網(wǎng)絡(luò)的輸入,預(yù)測(cè)的能量狀態(tài)作為輸出。通過(guò)優(yōu)化設(shè)計(jì)獲得樣本庫(kù),利用樣本庫(kù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行離線訓(xùn)練,通過(guò)神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)對(duì)機(jī)動(dòng)能力的在線預(yù)測(cè)。機(jī)動(dòng)能力預(yù)測(cè)流程圖如圖1所示。
圖1 機(jī)動(dòng)能力預(yù)測(cè)流程圖
Fig.1 Flowchart of maneuverability prediction
假定地球模型為均質(zhì)非旋圓球,則滑翔末段機(jī)動(dòng)能力主要受當(dāng)前點(diǎn)的狀態(tài)、終點(diǎn)狀態(tài)以及當(dāng)前點(diǎn)與終點(diǎn)的相對(duì)狀態(tài)的影響。輸入變量包括當(dāng)前點(diǎn)狀態(tài)中的速度傾角θ、高度H,終點(diǎn)狀態(tài)中的末端速度VfD、末端落角θf(wàn)D、末端高度HfD,當(dāng)前點(diǎn)與終點(diǎn)相對(duì)狀態(tài)中的航向角偏差Δψ、水平距離L、末端航向角偏差ΔψfD。
輸出變量為當(dāng)前位置、當(dāng)前速度方向下,保證飛行終點(diǎn)滿足給定終端狀態(tài)的當(dāng)前最小速度Vmin。
樣本生成中,內(nèi)層采用角度約束最優(yōu)末制導(dǎo)律獲得滿足末端約束的能量最優(yōu)彈道,外層采用牛頓迭代法獲得滿足末端約束的最小初始速度。
預(yù)測(cè)模型采用連續(xù)型深度置信神經(jīng)網(wǎng)絡(luò)。
2.2 機(jī)動(dòng)能力預(yù)測(cè)樣本庫(kù)構(gòu)建
對(duì)每一個(gè)包含當(dāng)前狀態(tài)、終端狀態(tài)和相對(duì)狀態(tài)的輸入X=(H,?L,?θ,Δψ,?VfD,?θf(wàn)D, ΔψfD,?HfD),采取牛頓迭代的方法,可得到滿足末端約束的最小初始速度Vmin,步驟如下:
(1)取當(dāng)前時(shí)刻速度大小初值為V0,基于角度約束最優(yōu)末制導(dǎo)律[13]:
(1)
其中:γD為彈道傾角,
為剩余飛行時(shí)間,λD為高低視線角。
從當(dāng)前位置積分到終端狀態(tài),得到末速Vfmax,得到f(V0)=(Vfmax-VfD)2。
(2)通過(guò)牛頓迭代法搜索速度V0f
(2)
直至式(3)成立:
|Vfmax-VfD|<ε,
(3)
最終得到的V0f即為滿足末端約束的最小初始速度Vmin。
給定多組輸入,通過(guò)上述計(jì)算可獲得相應(yīng)的Vmin作為機(jī)動(dòng)能力預(yù)測(cè)輸出變量,構(gòu)成機(jī)動(dòng)能力預(yù)測(cè)樣本庫(kù)。
2.3 深度置信網(wǎng)絡(luò)及其訓(xùn)練
深度置信網(wǎng)絡(luò)(DBN)是典型的深度學(xué)習(xí)算法,于2006年由Hinton研究組在《Science》上提出,其通過(guò)無(wú)監(jiān)督貪婪學(xué)習(xí)算法逐層優(yōu)化深度置信網(wǎng)絡(luò)的連接權(quán)重和閾值。深度置信網(wǎng)絡(luò)實(shí)際上借鑒了人腦的多層抽象的機(jī)能,通過(guò)大量的限制玻爾茲曼機(jī)單元(可看作神經(jīng)元)構(gòu)成深度置信網(wǎng),利用輸入和輸出的非線性關(guān)系,近似復(fù)雜的多輸入函數(shù),它在提取輸入樣本的特征時(shí)具有較好的性能。
通常DBN網(wǎng)絡(luò)中RBM單元可視層的輸入必須為二值狀態(tài),由于機(jī)動(dòng)能力預(yù)測(cè)問(wèn)題中輸入數(shù)據(jù)為連續(xù)型數(shù)值,因此直接利用傳統(tǒng)二值DBN網(wǎng)絡(luò)來(lái)進(jìn)行預(yù)測(cè)會(huì)存在問(wèn)題。為解決這一問(wèn)題,本文通過(guò)在網(wǎng)絡(luò)的RBM單元可視層中加入高斯噪聲附加項(xiàng)使其轉(zhuǎn)變成連續(xù)型RBM(Continuous RBM, CRBM),使得網(wǎng)絡(luò)具有對(duì)連續(xù)型特征值的處理能力。
深度置信網(wǎng)絡(luò)是一個(gè)概率生成模型,擁有深層的網(wǎng)絡(luò)結(jié)構(gòu),可以看作由多個(gè)CRBM堆疊而成,最底層接收輸入數(shù)據(jù)向量,并通過(guò)CRBM轉(zhuǎn)換輸入數(shù)據(jù)到隱含層,通過(guò)對(duì)多個(gè)CRBM進(jìn)行堆疊可從機(jī)動(dòng)能力預(yù)測(cè)問(wèn)題的復(fù)雜原始輸入數(shù)據(jù)中獲得一些高層非線性特征,在最頂層添加一層BP網(wǎng)絡(luò),即可對(duì)輸出量即最小初始速度,進(jìn)行回歸預(yù)測(cè)。深度置信網(wǎng)絡(luò)的訓(xùn)練由無(wú)監(jiān)督的逐層預(yù)訓(xùn)練和有監(jiān)督的微調(diào)兩個(gè)過(guò)程組成。下面給出用于機(jī)動(dòng)能力預(yù)測(cè)的深度置信網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練過(guò)程。
對(duì)應(yīng)于機(jī)動(dòng)能力預(yù)測(cè)的完整深度置信網(wǎng)絡(luò)結(jié)構(gòu)如圖 2所示,深度置信網(wǎng)絡(luò)模型由最底層接收機(jī)動(dòng)能力預(yù)測(cè)問(wèn)題的輸入數(shù)據(jù)(H,?L,?θ, Δψ,?VfD,?θf(wàn)D, ΔψfD,?HfD),第一層和第二層形成一個(gè)CRBM,第二層和第三層形成第二個(gè)CRBM,依次類推。將最上層CRBM的輸出層得到的結(jié)果,即提取得到的高層非線性特征,輸入到BP網(wǎng)絡(luò)中進(jìn)行回歸預(yù)測(cè)。輸入層的節(jié)點(diǎn)數(shù)由輸入數(shù)據(jù)的維數(shù)決定,輸出層為歸一化后的最小初始速度,節(jié)點(diǎn)數(shù)為1。
圖2 深度置信網(wǎng)絡(luò)的結(jié)構(gòu)圖
Fig.2 Diagram of deep belief network structure
限制玻爾茲曼機(jī)CRBM模型基于能量生成,能夠?qū)W習(xí)數(shù)據(jù)的固有內(nèi)在表示。每個(gè)CRBM包含一個(gè)可視層和一個(gè)隱含層,只有可視層和隱含層單元之間有雙向連接權(quán)值,而可視層內(nèi)部各單元及隱含層內(nèi)部各單元之間沒(méi)有連接。
傳統(tǒng)RBM的結(jié)構(gòu)單元為二值狀態(tài),為了處理連續(xù)數(shù)據(jù),CRBM在可視層sigmoid激活函數(shù)sig(x)=1/(1+e-x)中加入一個(gè)均值為0、方差為σ2的高斯單元,常數(shù)σ和Nj(0, 1)共同產(chǎn)生了高斯輸入分量nj=σNj(0, 1)。
隱含層的激活概率為:
(4)
其中,函數(shù)φj的表達(dá)式為:
(5)
同理,可視層的激活概率為:
(6)
(7)
其中:?I為可視單元的數(shù)量,J為隱含單元的數(shù)量。θL,?θH分別為sigmoid函數(shù)的下漸近線和上漸近線,一般取θH=1,?θL=-1,參數(shù)bj是控制sigmoid函數(shù)斜率的變量,當(dāng)bj由小變大時(shí),單元就可以從無(wú)噪聲的確定性狀態(tài)向二進(jìn)制隨機(jī)狀態(tài)平滑過(guò)渡。
在給定可視層單元v={v1,?v2,?v3, …,?vI}∈[0, 1]、隱含層單元h={h1,?h2,?h3, …,?hJ}∈[0, 1]、權(quán)重矩陣w、可視層單元的斜率a和隱含層單元斜率b的條件下,所有可視單元和隱含單元聯(lián)合狀態(tài)(v,?h)的能量函數(shù)為[14]:
(8)
可視層向量v的獨(dú)立分布為:
(9)
因?yàn)镃RBM的同一層任何兩個(gè)單元之間沒(méi)有連接,因此給定一個(gè)隨機(jī)輸入的可視層向量v,各隱含層單元相互獨(dú)立,隱含層向量h的概率如式(10)所示。類似的,給定一個(gè)隨機(jī)輸入隱含層向量h,得到對(duì)應(yīng)可視層向量v的概率如式(11)所示:
(10)
(11)
CRBM的本質(zhì)就是使學(xué)習(xí)到的模型符合輸入樣本分布的概率最大,即在給定訓(xùn)練數(shù)據(jù)的情況下,通過(guò)調(diào)節(jié)相應(yīng)的參數(shù),使式(9)的概率p(v)的值達(dá)到最大。由式(9)可知,可以通過(guò)調(diào)節(jié)權(quán)重矩陣w、可視層單元斜率a和隱含層單元斜率b去降低能量函數(shù)值,間接提高p(v)的值?;跇O大似然估計(jì)理論,對(duì)式(9)兩邊取對(duì)數(shù),然后執(zhí)行隨機(jī)梯度下降,可以從訓(xùn)練樣本中學(xué)習(xí)CRBM模型的參數(shù)θ={ai,?bj,?wji},使概率p(v)的值最大。
以對(duì)比散度(Contrastive Divergence,CD-k)算法應(yīng)用最為廣泛[14]。通過(guò)使用對(duì)比散度算法,k次更新即可完成訓(xùn)練,一般取為1,參數(shù)更新公式如式(12):
Δwji=γ(〈vihj〉0-〈vihj〉k),
?
?
(12)
其中γ表示學(xué)習(xí)率,取值在[0, 1]之間,一般根據(jù)經(jīng)驗(yàn)確定。
在逐層無(wú)監(jiān)督訓(xùn)練完成后,通過(guò)在最頂層添加標(biāo)簽數(shù)據(jù),對(duì)深度置信網(wǎng)絡(luò)進(jìn)行有監(jiān)督訓(xùn)練,即采用反向傳播算法對(duì)深度置信網(wǎng)絡(luò)的相關(guān)參數(shù)進(jìn)行微調(diào)。與無(wú)監(jiān)督訓(xùn)練中每次訓(xùn)練一層相比,反向傳播有監(jiān)督微調(diào)同時(shí)對(duì)所有層的參數(shù)進(jìn)行更新,以進(jìn)一步減少訓(xùn)練誤差和提高深度置信網(wǎng)絡(luò)的預(yù)測(cè)精度。
全局有監(jiān)督微調(diào)利用網(wǎng)絡(luò)輸出誤差對(duì)各權(quán)值的梯度來(lái)調(diào)整所有權(quán)值,直至誤差收斂。在模型的微調(diào)過(guò)程中,有兩類參數(shù)需要調(diào)整:層之間的連接權(quán)值、斜率控制項(xiàng)。先求出連接權(quán)值、斜率控制項(xiàng)的梯度值[15],再利用擬牛頓法優(yōu)化算法對(duì)各參數(shù)進(jìn)行優(yōu)化。
樣本的目標(biāo)函數(shù)值為:
(13)
其中:x是CRBM的樣本輸出數(shù)據(jù),F(xiàn)W,?a(x)是網(wǎng)絡(luò)的輸出數(shù)據(jù)。
3 飛行末段多約束智能彈道規(guī)劃
為了增大滑翔導(dǎo)彈的末段機(jī)動(dòng)范圍并降低彈道規(guī)劃難度,本文通過(guò)智能規(guī)劃經(jīng)由點(diǎn),實(shí)現(xiàn)末段多約束智能彈道規(guī)劃。
導(dǎo)彈通過(guò)智能規(guī)劃末段經(jīng)由點(diǎn)狀態(tài),可以擴(kuò)大機(jī)動(dòng)包絡(luò),同時(shí)保證有足夠的能量實(shí)現(xiàn)對(duì)目標(biāo)的多約束精確打擊。在經(jīng)由點(diǎn)的智能規(guī)劃過(guò)程中,采用上節(jié)中訓(xùn)練好的深度置信網(wǎng)絡(luò)進(jìn)行機(jī)動(dòng)能力預(yù)測(cè),快速判定經(jīng)由點(diǎn)狀態(tài)的可行性,實(shí)現(xiàn)經(jīng)由點(diǎn)前、后段能量的合理分配,提高經(jīng)由點(diǎn)在線設(shè)計(jì)的效率。經(jīng)由點(diǎn)位置的設(shè)計(jì),需要為后段增強(qiáng)突防能力的彈道擺動(dòng)機(jī)動(dòng)預(yù)留一定的速度增量,因此在迭代搜索經(jīng)由點(diǎn)位置時(shí),在期望終端速度的基礎(chǔ)上增大一定速度增量作為經(jīng)由點(diǎn)位置迭代的速度約束。
為滿足彈道擺動(dòng)機(jī)動(dòng)需求,本文將導(dǎo)彈相對(duì)目標(biāo)點(diǎn)的視線角設(shè)計(jì)為三角函數(shù)形式,并通過(guò)設(shè)計(jì)機(jī)動(dòng)彈道最優(yōu)末制導(dǎo)律,實(shí)現(xiàn)對(duì)期望視線角的跟蹤,最后通過(guò)機(jī)動(dòng)頻率迭代滿足期望的速度約束。
3.1 經(jīng)由點(diǎn)規(guī)劃
經(jīng)由點(diǎn)規(guī)劃采用內(nèi)外兩層規(guī)劃的方法:內(nèi)層固定經(jīng)由點(diǎn)的位置,通過(guò)搜索最優(yōu)的經(jīng)由點(diǎn)速度方向約束,使到達(dá)目標(biāo)點(diǎn)的終端速度最大;外層基于經(jīng)由點(diǎn)Z向位置與終端速度的單調(diào)關(guān)系,以期望終端速度為約束,通過(guò)牛頓法迭代得到經(jīng)由點(diǎn)Z向位置。經(jīng)由點(diǎn)規(guī)劃流程見(jiàn)圖3所示。
圖3 經(jīng)由點(diǎn)規(guī)劃流程圖
Fig.3 Flow diagram of waypoint planning
(1)經(jīng)由點(diǎn)的位置設(shè)計(jì)。將以下壓段起始點(diǎn)作為始點(diǎn)、目標(biāo)點(diǎn)作為終點(diǎn)、采用角度約束最優(yōu)制導(dǎo)律獲得的彈道,作為基準(zhǔn)彈道。
為降低規(guī)劃難度,取基準(zhǔn)彈道上射程中點(diǎn)對(duì)應(yīng)的點(diǎn)作為經(jīng)由點(diǎn)包絡(luò)的中心。導(dǎo)彈從經(jīng)由點(diǎn)到達(dá)目標(biāo)點(diǎn)時(shí)末端速度恰好滿足給定約束時(shí)對(duì)應(yīng)的經(jīng)由點(diǎn)位置,即為最大機(jī)動(dòng)能力對(duì)應(yīng)的經(jīng)由點(diǎn)位置。
經(jīng)由點(diǎn)在該點(diǎn)彈道法平面上的不同坐標(biāo),對(duì)應(yīng)著不同的機(jī)動(dòng)范圍,因此將經(jīng)由點(diǎn)位置對(duì)應(yīng)的設(shè)計(jì)量取為Z向坐標(biāo)。
(2)對(duì)于經(jīng)由點(diǎn)處的速度方向,可根據(jù)初始點(diǎn)及終端狀態(tài)給出其可行的范圍,并以此為基礎(chǔ)進(jìn)行經(jīng)由點(diǎn)速度方向設(shè)計(jì)。
如圖4所示,設(shè)從當(dāng)前點(diǎn)到經(jīng)由點(diǎn)為A段,從經(jīng)由點(diǎn)到終端狀態(tài)為B段。導(dǎo)彈按比例導(dǎo)引律從當(dāng)前點(diǎn)導(dǎo)引至經(jīng)由點(diǎn),到達(dá)經(jīng)由點(diǎn)時(shí)的速度矢量方向可視為使A段能量最優(yōu)的經(jīng)由點(diǎn)速度方向eviaA;固定經(jīng)由點(diǎn)位置及終端狀態(tài),使經(jīng)由點(diǎn)速度最小的速度方向即為使B段能量最優(yōu)的經(jīng)由點(diǎn)速度方向eviaB。經(jīng)由點(diǎn)速度矢量ev在eviaA與eviaB形成的扇面內(nèi)取值,可留出更多能量用于機(jī)動(dòng)。
圖4 經(jīng)由點(diǎn)速度方向設(shè)計(jì)示意圖
Fig.4 Diagram of waypoint velocity direction designing
(3)在固定經(jīng)由點(diǎn)位置時(shí),隨著經(jīng)由點(diǎn)速度方向約束的變化,末端速度呈現(xiàn)先增大后減小的單峰曲線形式,采用黃金分割法即可一維搜索求得在當(dāng)前經(jīng)由點(diǎn)位置下使末端速度最大的最優(yōu)速度方向約束:
J=-Vfmax.
(14)
過(guò)程中基于當(dāng)前位置和速度方向狀態(tài)和經(jīng)由點(diǎn)的位置及速度方向約束計(jì)算X=(H,?L,?θ, Δψ,?VfD,?θf(wàn)D, ΔψfD,?HfD),將其輸入訓(xùn)練好的深度置信網(wǎng)絡(luò),得到在當(dāng)前位置、當(dāng)前速度方向下,保證飛行終點(diǎn)滿足給定終端狀態(tài)的當(dāng)前最小速度Vmin。進(jìn)而判定經(jīng)由點(diǎn)狀態(tài)的可行性。
通過(guò)牛頓迭代法更新經(jīng)由點(diǎn)位置,并搜索相應(yīng)的最優(yōu)航向角。由于經(jīng)由點(diǎn)位置與末端速度存在單調(diào)關(guān)系,可搜索得到滿足期望速度約束的經(jīng)由點(diǎn)位置。
(15)
由于經(jīng)由點(diǎn)位置的設(shè)計(jì),需要為后段的彈道擺動(dòng)機(jī)動(dòng)預(yù)留一定的速度增量,因此在迭代搜索經(jīng)由點(diǎn)位置時(shí),在期望終端速度的基礎(chǔ)上增加一定速度增量作為經(jīng)由點(diǎn)位置迭代的速度約束。
VDf=Vf+ΔV,
(16)
其中ΔV為彈道擺動(dòng)機(jī)動(dòng)所需的速度增量。
3.2 三角函數(shù)型機(jī)動(dòng)彈道規(guī)劃
對(duì)于從經(jīng)由點(diǎn)到目標(biāo)點(diǎn)的飛行段,本文引入三角函數(shù)型機(jī)動(dòng),即在期望角度上疊加三角函數(shù)型視線角函數(shù)。機(jī)動(dòng)彈道規(guī)劃流程如圖5所示。
(1)視線角函數(shù)幅值根據(jù)局部機(jī)動(dòng)范圍需求而確定,一般取1°左右即可滿足。在局部機(jī)動(dòng)范圍較小時(shí),將機(jī)動(dòng)形式由單邊改為雙邊并進(jìn)行相位調(diào)整,以滿足機(jī)動(dòng)范圍及機(jī)動(dòng)形式要求。
(2)通過(guò)機(jī)動(dòng)彈道最優(yōu)制導(dǎo)律得到制導(dǎo)指令,積分得到到達(dá)目標(biāo)點(diǎn)時(shí)的終端速度。
(3)針對(duì)末端速度約束,根據(jù)機(jī)動(dòng)頻率與末端速度的正比關(guān)系,通過(guò)在線大步長(zhǎng)彈道快速積分,對(duì)視線角函數(shù)的機(jī)動(dòng)頻率進(jìn)行迭代修正,得到滿足末端速度約束的機(jī)動(dòng)頻率,完成彈道規(guī)劃。
(4)在實(shí)際飛行中,由于大氣密度偏差等因素,實(shí)際彈道狀態(tài)量(主要是速度)相對(duì)規(guī)劃彈道會(huì)存在一定偏差,因此每隔一定周期需要進(jìn)行一次彈道重規(guī)劃。
圖5 機(jī)動(dòng)彈道規(guī)劃流程圖
Fig.5 Flow diagram of maneuvering trajectory planning
3.3 機(jī)動(dòng)彈道最優(yōu)制導(dǎo)律設(shè)計(jì)
對(duì)于局部機(jī)動(dòng)范圍需求,將導(dǎo)彈相對(duì)目標(biāo)點(diǎn)的視線角設(shè)計(jì)為三角函數(shù)形式,通過(guò)調(diào)節(jié)三角函數(shù)型視線角的幅值、頻率和相位,滿足期望的機(jī)動(dòng)形式和局部機(jī)動(dòng)范圍,并通過(guò)最優(yōu)控制實(shí)現(xiàn)對(duì)期望視線角的跟蹤,最終實(shí)現(xiàn)末制導(dǎo)與機(jī)動(dòng)的一體化設(shè)計(jì)。
以第二段角度約束末制導(dǎo)與三角函數(shù)型機(jī)動(dòng)的一體化設(shè)計(jì)為例,分別在俯沖平面和側(cè)向平面內(nèi)進(jìn)行設(shè)計(jì)。
為實(shí)現(xiàn)在精確攻擊前提下的機(jī)動(dòng)飛行,設(shè)計(jì)以射程為自變量的俯沖平面附加視線角為:
(17)
其中:kD為頻率系數(shù),φDN為幅值系數(shù),Lf為末段總射程,L為當(dāng)前射程??紤]防空系統(tǒng)的最低攔截高度,同時(shí)減小機(jī)動(dòng)對(duì)制導(dǎo)精度的影響,設(shè)置機(jī)動(dòng)結(jié)束高度hme。
在俯沖平面內(nèi),為了在滿足落角約束的同時(shí)使視線角按照期望的運(yùn)動(dòng)規(guī)律變化,可取狀態(tài)變量分別為視線角偏差以及視線角速率偏差:
(18)
其中:γDF為終端期望落角,λDN為期望視線角,λD為高低視線角。
為了簡(jiǎn)化制導(dǎo)問(wèn)題,將俯沖段運(yùn)動(dòng)分解到俯沖平面及側(cè)向平面內(nèi),分別建立相對(duì)運(yùn)動(dòng)方程:
(19)
其中:γD為彈道傾角,γT為彈道偏角。
轉(zhuǎn)化為狀態(tài)空間方程的形式:
(20)
其中
為剩余飛行時(shí)間。
為簡(jiǎn)化制導(dǎo)問(wèn)題的建模及求解,可引入偽控制量:
(21)
狀態(tài)空間方程可進(jìn)一步改寫為:
(22)
根據(jù)最優(yōu)控制理論極大值原理,線性系統(tǒng)二次型性能指標(biāo)對(duì)應(yīng)的最優(yōu)控制律形式為:
us=-R-1BTPx.
(23)
基于最優(yōu)控制理論及Riccati方程,得俯沖平面機(jī)動(dòng)突防最優(yōu)制導(dǎo)律:
(24)
在側(cè)向平面內(nèi),同樣以射程為自變量設(shè)計(jì)附加視線角為:
(25)
其中:kT為頻率系數(shù),φDT為幅值系數(shù)。
假設(shè)對(duì)飛行器進(jìn)入方向沒(méi)有約束,則在側(cè)向平面取狀態(tài)變量為:
(26)
同理,以能量最省為性能指標(biāo),可獲得側(cè)向平面機(jī)動(dòng)最優(yōu)制導(dǎo)律為:
(27)
4 仿真分析
采用美軍CAV滑翔彈頭的總體及氣動(dòng)參數(shù),取俯沖段高度h0=30 km,距目標(biāo)點(diǎn)射程L0=100 km,速度V0=2 500 m/s,速度傾角θ0=-10°,航跡偏航角σ0=0°,攻角α∈[-20°, 20°],落角約束λDF=-60°,末端速度約束Vf≥800 m/s。落點(diǎn)位置精度要求Δx≤1 m,落角精度要求Δλ≤1°,速度精度要求ΔV≤2 m/s。φDN=φDT=1°,kD=kT,機(jī)動(dòng)結(jié)束高度hme=2 km。
機(jī)動(dòng)能力預(yù)測(cè)的樣本容量取為30 000,其中27 000個(gè)作為訓(xùn)練樣本,3 000個(gè)作為測(cè)試樣本。依據(jù)隨機(jī)運(yùn)行的平均結(jié)果選擇最優(yōu)的參數(shù)配置,本文使用平均相對(duì)誤差(Mean Relative Error,MRE)作為評(píng)價(jià)指標(biāo),通過(guò)下式計(jì)算得到:
(28)
其中:yi為真實(shí)值,
為預(yù)測(cè)值,n為樣本數(shù)據(jù)量。
深度置信網(wǎng)絡(luò)模型的結(jié)構(gòu)參數(shù),影響訓(xùn)練過(guò)程和預(yù)測(cè)結(jié)果誤差。根據(jù)已有研究以及數(shù)據(jù)特點(diǎn),CDBN的學(xué)習(xí)率取為γ= 0.02,CRBM最大迭代次數(shù)取為200。為了使訓(xùn)練效果達(dá)到最優(yōu)化,減小誤差,對(duì)預(yù)測(cè)模型訓(xùn)練的隱層層數(shù)和隱層節(jié)點(diǎn)數(shù)進(jìn)行對(duì)比優(yōu)選。本文取隱層數(shù)目為2~6 層,設(shè)定隱層節(jié)點(diǎn)數(shù)為24,對(duì)隱層數(shù)目進(jìn)行優(yōu)選,結(jié)果如表1 所示。
表1?隱層數(shù)目的影響
Tab.1 Effect of number of hidden layers
表中比較了隱層數(shù)目對(duì)預(yù)測(cè)誤差的影響,當(dāng)隱層數(shù)目為3時(shí),MRE值為4.6%,預(yù)測(cè)模型準(zhǔn)確度最高。隱層數(shù)目小于3時(shí),模型誤差隨隱層數(shù)目增加而減小;隱層數(shù)目大于3 時(shí),模型誤差隨隱層數(shù)目增大而增大,模型凸顯“過(guò)擬合”效應(yīng)。
對(duì)于隱含層神經(jīng)元個(gè)數(shù)的選取尚無(wú)理論上的指導(dǎo),沒(méi)有統(tǒng)一的經(jīng)驗(yàn)公式。假定隱層數(shù)目為3,討論和確定適宜的節(jié)點(diǎn)數(shù)目。本文討論最后一層隱含層節(jié)點(diǎn)數(shù)目為4~20時(shí)的預(yù)測(cè)效果。
表2?最后一層隱含層節(jié)點(diǎn)數(shù)目的影響
Tab.2 Effect of nodes number in the last hidden layer
由表2可知,節(jié)點(diǎn)數(shù)為12時(shí),模型預(yù)測(cè)效果最佳。綜上,本文設(shè)定預(yù)測(cè)模型的隱層數(shù)目為3,各隱層的節(jié)點(diǎn)數(shù)為24-24-12。最終確定CDBN的網(wǎng)絡(luò)結(jié)構(gòu)為8-24-24-12-1。
將設(shè)計(jì)好的CDBN與BP網(wǎng)絡(luò)進(jìn)行對(duì)比,考慮多層BP網(wǎng)絡(luò)存在梯度消失問(wèn)題,取BP網(wǎng)絡(luò)結(jié)構(gòu)為8-80-80-1,對(duì)3 000個(gè)測(cè)試樣本進(jìn)行預(yù)測(cè),對(duì)比散點(diǎn)圖與擬合誤差散點(diǎn)圖分別如圖6與圖7所示。從圖 7可以看出,相對(duì)于BP網(wǎng)絡(luò),CDBN明顯具有更小的訓(xùn)練誤差。
圖6 CDBN的預(yù)測(cè)結(jié)果散點(diǎn)圖
Fig.6 Scatter diagram of CDBN prediction results
圖7 CDBN與BP的測(cè)試誤差散點(diǎn)圖
Fig.7 Scatter diagram of test results for CDBN and BP
由圖8可以看出,CDBN網(wǎng)絡(luò)的初始誤差得到減小,誤差的下降速度也快于BP網(wǎng)絡(luò)。這是由于CDBN通過(guò)對(duì)三層CRBM的貪婪無(wú)監(jiān)督預(yù)訓(xùn)練,獲得了更好的神經(jīng)網(wǎng)絡(luò)權(quán)值。
圖8 CDBN與BP的訓(xùn)練殘差對(duì)數(shù)曲線
Fig.8 Logarithm of training error results for CDBN and BP
接下來(lái)進(jìn)行經(jīng)由點(diǎn)規(guī)劃,并進(jìn)一步規(guī)劃末段機(jī)動(dòng)彈道。首先將經(jīng)由點(diǎn)位置的Z向坐標(biāo)初值取為Z=5 km,不同的經(jīng)由點(diǎn)速度方向?qū)?yīng)著不同的末端速度,一般隨著航向角的增大,末端速度呈現(xiàn)先增大后減小的趨勢(shì),由此可以得到在該經(jīng)由點(diǎn)位置下的最優(yōu)速度方向。
表3?航向角對(duì)末端速度的影響
Tab.3 Effect of heading angle on terminal velocity
經(jīng)過(guò)黃金分割法搜索,當(dāng)前經(jīng)由點(diǎn)位置Z=5 km 下的最優(yōu)航向角為-10°。進(jìn)一步,根據(jù)牛頓迭代法更新經(jīng)由點(diǎn)位置,并搜索相應(yīng)的最優(yōu)航向角。為了給彈道機(jī)動(dòng)預(yù)留速度增量,在期望終端速度的基礎(chǔ)上增大100 m/s作為經(jīng)由點(diǎn)位置設(shè)計(jì)的速度約束,通過(guò)牛頓迭代搜索得到滿足該速度約束的經(jīng)由點(diǎn)位置。
終端速度隨經(jīng)由點(diǎn)Z向位置的變化曲線如圖9所示。經(jīng)過(guò)迭代搜索,經(jīng)由點(diǎn)的最大側(cè)向位置為Z=5.36 km,對(duì)應(yīng)的最優(yōu)航向角約束為-12°。
圖9 終端速度隨經(jīng)由點(diǎn)Z向位置的變化
Fig.9 Terminal velocity versus?Z?position of waypoint
對(duì)于期望的末端速度約束,根據(jù)機(jī)動(dòng)頻率與末端速度的單調(diào)性,迭代搜索得到三角函數(shù)型視線角的機(jī)動(dòng)頻率系數(shù)kD=4.02。終端速度隨機(jī)動(dòng)頻率的變化曲線如圖10所示。
圖10 終端速度隨機(jī)動(dòng)頻率系數(shù)的變化
Fig.10 Terminal velocity versus maneuvering frequency coefficient
末段規(guī)劃彈道如圖11~圖15所示。
圖11 攻角隨時(shí)間的變化曲線
Fig.11 Time histories of attack angle
圖12 傾側(cè)角隨時(shí)間的變化曲線
Fig.12 Time histories of bank angle
由俯沖段彈道參數(shù)曲線,落點(diǎn)位置誤差為0.2 m,落角誤差為0.4°,速度誤差為0.5 m/s,機(jī)動(dòng)彈道規(guī)劃耗時(shí)0.5 s。表明本文所提的彈道規(guī)劃方法在實(shí)現(xiàn)擺動(dòng)機(jī)動(dòng)飛行的同時(shí),能夠高精度地滿足終端落點(diǎn)、落角及速度約束條件。
圖13 三維彈道曲線
Fig.13 Three-dimensional trajectory curve
圖14 速度曲線
Fig.14 Time histories of velocity
圖15 彈道傾角曲線
Fig.15 Time histories of flight path angle
5 結(jié) 論
本文針對(duì)滑翔導(dǎo)彈末段多約束智能彈道規(guī)劃問(wèn)題展開(kāi)研究,取得了如下研究成果:
針對(duì)連續(xù)數(shù)值型機(jī)動(dòng)能力預(yù)測(cè)問(wèn)題,提出了一種離線訓(xùn)練CDBN用于在線預(yù)測(cè)的方法。仿真表明基于CDBN的機(jī)動(dòng)能力預(yù)測(cè)相對(duì)于BP網(wǎng)絡(luò)具有更高精度,且具有較高的效率。通過(guò)智能規(guī)劃經(jīng)由點(diǎn)的Z向位置與航向角,優(yōu)化了末段能量分配,在保證對(duì)目標(biāo)多約束精確打擊的同時(shí)增大了末段機(jī)動(dòng)范圍。針對(duì)增強(qiáng)突防能力的彈道擺動(dòng)機(jī)動(dòng),引入了三角函數(shù)形式的彈目視線角,設(shè)計(jì)了機(jī)動(dòng)彈道最優(yōu)末制導(dǎo)律,實(shí)現(xiàn)了對(duì)期望視線角的跟蹤,最后通過(guò)調(diào)節(jié)機(jī)動(dòng)頻率實(shí)現(xiàn)了速度控制。落點(diǎn)位置、落角、速度誤差分別為0.2 m,0.4°,0.5 m/s。彈道規(guī)劃最大耗時(shí)為0.5 s,能夠滿足工程應(yīng)用的快速性要求。
關(guān)注微信公眾號(hào):人工智能技術(shù)與咨詢。了解更多咨詢!
審核編輯:符乾江
評(píng)論