赵彬, 周中良, 谢新辉, 李飞, 江建成
(1.空军工程大学 航空航天工程学院, 陕西 西安 710038;2.空军西安飞行学院 理训系, 陕西 西安 710300)
基于RHC-GCPSO的末端规避轨迹最优控制方法
赵彬1, 周中良1, 谢新辉1, 李飞2, 江建成1
(1.空军工程大学 航空航天工程学院, 陕西 西安 710038;2.空军西安飞行学院 理训系, 陕西 西安 710300)
针对传统典型末端规避战术实时性低、操作难度大和规避效果差等缺点,研究了一种实时指令控制的战斗机末端规避战术轨迹控制方法;分析了增大脱靶量的末端规避原理,在以导弹为原点的球坐标系下建立了导弹与战斗机的相对运动模型;结合战斗机动力学模型,建立了脱靶量末端规避数学模型;选取脱靶量为优化指标,建立了战术轨迹最优控制指令模型;提出了滚动关联粒子群算法并对该模型进行求解,得到了战斗机的最优战术机动控制指令;通过仿真,对比了滚动关联粒子群与粒子群、混沌粒子群三种算法对最优控制指令模型求解的结果,验证了该算法的优越性。
末端规避; 脱靶量; 控制指令; 滚动时域控制
末端规避是战斗机通过战术机动规避来袭导弹,阻止战斗机被导弹命中,达到提高其生存率,实现“保己”的目的[1-2]。目前国内对于战斗机末端防御来袭导弹攻击的技术还不成熟,尤其是在实际训练中没有实践,而当飞行员遇到此类问题时,只能通过自己的临场发挥去处理。文献[3-4]建立了战斗机机动规避的微分动态规划模型,并对该模型进行前、后向积分的推导求解,得到战斗机机动规避的最优机动轨迹。文献[5]探索性地研究了在两枚导弹来袭的情况下战斗机的末端规避问题,建立了战斗机规避优化解算模型,提出了基于最速下降法对其进行优化解算的方法。文献[6]针对未知来袭导弹导引律的情况,提出了一套新的方法研究最优的规避路径。文献[7]对无人机规避攻击进行了研究,以威力势为目标函数,将规避决策问题视为威力势的增减问题。文献[8-9]基于NMPC的思想,对战斗机末端规避策略进行了闭环求解,得到了最优的规避轨迹。空战中,如何在提升战斗力的同时提高飞机在导弹威胁下的生存力成为了各国专家和飞行员较为关注的问题。为进一步提高规避效果,克服传统典型末端规避战术的实时性低、操作难度大和规避效果差等缺点,本文建立了导弹和战斗机的交互模型,对大过载机动进行了定量分析与研究,并指出了典型末端规避机动战术的缺点。以最大化脱靶量为性能指标,通过建立战斗机最优规避控制模型,提出了基于滚动时域的灰色关联混沌粒子群优化决策算法(RHC-GCPSO),对该最优控制模型进行了闭环实时解算,并通过仿真验证了此方法的有效性。
导引律未知时,战斗机末端规避轨迹设计问题本质上是两端受约束的路径引导问题,通常采用的解决方法是微分对策理论,这类问题过于复杂。本文假设导弹为PN制导,确定了导弹导引律,则可以将此问题看作为单边最优控制问题[5]。
1.1地理坐标系下的运动模型
(1)导弹运动模型
(1)
式中:vm为导弹的速度;θm为导弹的俯仰角,导弹抬头为正;φm为导弹的偏航角,逆时针为正;nmd和nmt分别为导弹的俯仰过载和偏航过载;Tm(t)和Dm分别为导弹的推力和所受的空气阻力。
(2)战斗机运动模型
(2)
式中:vf为战斗机的速度;θf和φf分别为战斗机的航迹俯仰角和航迹偏航角;αf,μf和ηf为控制量,分别为战斗机的迎角、滚转角和油门大小,且ηf∈[0,1];Lf为升力;Tfmax为战斗机的最大推力;Df为空气阻力;mf为战斗机的质量。
1.2球坐标系下的相对运动模型
图1给出了导弹和战斗机的态势几何关系。图中,M表示导弹,F表示战斗机;Oxeyeze为“北-天-东”地理坐标系,Fxfyfzf为以F为原点的飞机坐标系;(u,υ)为相对俯仰角和相对偏航角,r为相对距离,h为相对高度差。
图1 导弹与战斗机的几何关系图Fig.1 The geometric relationship between missile and fighter
直角坐标系下M与F的相对运动模型为:
(3)
式中:xr,yr及zr分别为导弹与战斗机的相对水平距离、相对高度和相对侧向距离。
根据直角坐标系到球坐标系(以M为球心)的转换原理,可以得到:
(4)
高度差为:
(5)
综合式(4)和式(5)及战斗机动力学模型,可得到增大脱靶量末端的规避模型为:
(6)
2.1最优控制模型
战斗机规避时的战术轨迹最优控制指令模型可以由下式描述[4,9]:
(7)
2.2性能指标
考虑导弹过载限制和战斗机的飞行参数、控制量的限制,选定脱靶量为优化性能指标。脱靶量为接近速度为零时战斗机与导弹之间的相对距离[4]。战斗机在末端规避时,应使导弹脱靶量越大越好,因此可以选择脱靶量为优化指标:
(8)
在终端时刻,可以认为导弹与战斗机的相对速度vc等于零,即:
(9)
指令实时解算方法
本文引入了RHC[4]方法。在RHC的架构上,基于GAD[5]和CO对PSO算法[10]进行了改进,提出了RHC-GCPSO算法,该算法能够大大提高计算效率,克服GAD-COPSO实时性不高等缺点。
3.1控制量的编码
采用十进制对战斗机的控制量u(t)=[αf,μf,ηf]T进行编码,每个粒子的位置信息对应一个6位数的数字串,初始的控制量[αf1,μf1,ηf1]T分别对应C1,C2和C3,迭代后的控制量[αf2,μf2,ηf2]T分别对应C4,C5和C6。
根据战斗机编码的规则和PSO算法位置的更新公式,可以得到控制量与对应编码的转换公式。以μf为例,相应的转换方程可以表示为:
(10)
式中:Δμfmax为最大滚转角变化率;k为迭代次数(k=1,2,…,n)。同理,可以得到αf和ηf的转换公式。
3.2飞行控制量的求解
由于ηf不能用角度来表示,可以用当前状态的推力系数作为参考,故在对飞行控制量进行求解时对ηf不加限制,下面对控制量进行推导。由于:
(11)
(12)
(13)
将式(13)代入式(12),可得偏航角变化率的表达式为:
(14)
(15)
赋予αf,μf,φf,θf一定的初值,通过5阶龙格-库塔法就能够解算出当前态势下控制量αf,μf与姿态角φf,θf之间的关系,并由此可以建立当前态势下αf,μf与φf,θf之间关系的数据库,方便后期求解时调用。
3.3不可行解的拯救策略
为简化计算方法,对不可行解进行拯救时考虑到战斗机的控制约束范围αfmin≤αf≤αfmax和μfmin≤μf≤μfmax,当αf和μf的可行解都为正时,设Π(u)为可行解,此时不可行域可以表示为:
(16)
拯救的粒子集合C(u)可以表示为:
(17)
将集合C(u)中的粒子加入到搜索空间内,增加粒子的活性,以便取得更加优异的全局最优解。在每次迭代中,对于不在可行域内的粒子需要作以下处理:
(1)判断粒子Xi,若不在不可行域内,则进入更新极值;若在,则转入下一步继续处理;
(2)判断Xi是否在拯救集合C(u)内,若在,则对其进行保留;反之舍弃。
下面通过数字仿真,验证RHC-GCPSO算法的有效性。首先给定典型的作战场景:敌方一枚中远距半主动雷达制导空空导弹对我机进行拦截,并采用比例导引进行制导。初始态势为:战斗机初始参数:(xf0,yf0,zf0)=(10,5.5,2) km,vf0=350 m/s,(θf0,φf0)=(30°,20°) ;导弹初始参数:(xm0,ym0,zm0)=(0,4.5,0) km,vm0=1 200 m/s,(θm0,φm0)=(30°,20°);载机的控制量初值取[αf0,μf0,ηf0]=[5°,10°,0.8]。根据式(4)和式(5)可求得r0,u0,υ0,h0。
某型中远距半主动雷达制导空空导弹的性能参数为:nmmax=40,K=3,τm=0.2 s,CD0=0.4,CL=2,Km=0.08,tmax=28 s。
设定仿真时间为30 s,战斗机初始规避时刻为零时刻,最大可规避时间Tm=28 s,RHC时域窗口取为T=2 s。取粒子总数为60,惯性权值ω=0.5,最大迭代次数50,加速因子N1=N2=2。仿真结果如图2~图7所示。
图2 基于PSO的运动轨迹Fig.2 The trajectories based on PSO
图3 基于COPSO的运动轨迹Fig.3 The trajectories based on COPSO
图4 基于RHC-GCPSO的运动轨迹Fig.4 The trajectories based on RHC-GCPSO
图5 迎角的变化Fig.5 Variation of angle of attack
图6 滚转角的变化Fig.6 Variation of roll angle
图7 油门杆的变化Fig.7 Variation of throttle lever
由图2~图4可以看出,基于PSO,COPSO及RHC-GCPSO三种优化算法求解的结果均表明战斗机最终能够完成规避任务,三种算法解算的终端脱靶量分别为36.05 m,55.16 m,75.89 m,完成规避的时间分别为22.5 s,23.3 s,24.5 s。规避轨迹呈现先爬升、后下降的变化趋势,符合实际空战情景。
由图5和图6可以看出,战斗机的迎角指令呈现来回振荡的变化趋势,基于PSO算法解算的振荡趋势最大,其次为COPSO,RHC-GCPSO的振荡最小;战斗机的滚转角变化曲线出现轻微振荡,整体呈现向负方向增大的变化趋势。
由图7可以看出,三种算法得出的战斗机油门杆指令均处于最大位置上,表明战斗机一直以最大加力状态在执行规避任务,这样不断提高载机的能量,也在不断消耗着导弹的能量。
(1)本文研究的基于增大脱靶量的战斗机末端规避轨迹最优控制方法是有效的,提出的基于RHC-GCPSO的算法经仿真验证也是有效的。
(2)基于RHC-GCPSO的方法增加了粒子活性,扩大了可行域的解空间,与其他两种算法比较,得到的终端脱靶量最大。
(3)由于RHC-GCPSO解算步骤最为繁琐,在寻优进程中所消耗的时间最长,但其解算更为精确,更加贴近实际情况,规避效果更好,所得到的战斗机控制指令更加真实。
[1]贾秋锐,孙媛媛,钟咏兵.空空导弹发展趋势[J].飞航导弹,2012(7):29-42.
[2]李飞.先进战斗机规避决策与控制技术研究[D].西安:空军工程大学,2014.
[3]Tal Shima.Cooperative evasion and pursuit for aircraft protection[R].Haifa,Israel:Technion Research and Development Foundation Limited,Israel Institute of Technology,2012.
[4]Tal Shima.Optimal cooperative pursuit and evasion strategies against a homing missile[J].Journal of Guidance,Control,and Dynamics,2011,34(2):414-425.
[5]Fumiaki Imado,Akeshi Kuroda.Engagement tactics for two missiles against an optimally maneuvering aircraft[J].Journal of Guidance,Control,and Dynamics,2011,34(2):574-582.
[6]胡安辉,郑涛,朱石刚.未知导引律导弹攻击情况下的规避路径[J].弹箭与制导学报,2010,30(3):32-34.
[7]刘杰,张健,李世晓,等.基于三维空间的无人机规避攻击导引设计[J].电光与控制,2014,21(4):34-37.
[8]李飞,于雷,周中良,等.战斗机末端机动的非线性模型预测控制规避策略[J].国防科技大学学报,2014,36(3):83-90.
[9]于雷,付昭旺,李战武,等.目标威胁规避约束下战斗机引导控制优化方法[J].北京航空航天大学学报,2014,40(2):229-234.
[10]Janne Karelahti,Kai Virtanen,Tuomas Raivio.Near-optimal missile avoidance trajectories via receding horizon control[J].Journal of Guidance,Control,and Dynamics,2007,30(5):1287-1298.
(编辑:姚妙慧)
The model of terminal avoidance trajectory optimal control based on RHC-GCPSO
ZHAO Bin1, ZHOU Zhong-liang1, XIE Xin-hui1, LI Fei2, JIANG Jian-cheng1
(1.Aeronautics and Astronautics Engineering College, Air Force Engineering University, Xi’an 710038, China;2.Theory Training Department, Air Force Xi’an Flight College, Xi’an 710300, China)
For the poor real-time performance, difficult operation and bad effect of traditional terminal avoidance tactics, this paper studied a tactical track real-time control method of fighter. The terminal avoidance theory of increasing miss distance was analyzed and a relative motion model of missile and fighter was constructed with the missile as origin in the spherical coordinate system. According to aircraft dynamics model, a mathematical model of miss distance terminal avoidance was established, which was taken as state constraints. A tactical track optimization control command model was built up with the miss distance as the optimization index. The model was solved by Receding Horizon Control-Grey Chaos Particle Swarm Optimization (RHC-GCPSO) algorithm, thus getting the optimal tactical maneuvering control command of the fighter. The advantages of the algorithm were verified by comparing the particle swarm, chaos particle swarm and RHC-GCPSO in simulation.
terminal avoidance; miss distance; control command; receding horizon control
2015-11-09;
2016-03-15; 网络出版时间:2016-04-22 09:52
国家自然科学基金资助(61472441)
赵彬(1991-),男,山东济南人,硕士研究生,研究方向为武器系统总体技术与作战运用。
TJ765.3
A
1002-0853(2016)04-0064-05