一种绕多禁飞区的多步决策弹道规划方法

IPC分类号 : F41G7/00,G06F17/50

申请号

CN201710749025.5

可选规格: 数量

库存1件

确认取消

￥30000; 库存1件

首页

立即咨询

看了又看

专利摘要

本发明涉及一种绕多禁飞区的多步决策弹道规划方法，包括如下步骤：步骤1：预测命中点计算；步骤2：边界趋近制导律；步骤3：速度指向修正；步骤4：比例导引；步骤5：基于多步决策理论的绕多禁飞区弹道规划方法。本发明优点在于：相较于离线规划方法，本发明弹道规划方法具有较强的实时性，在线规划速度快，可根据任务及战场环境需求实时生成新的规避指令；相较于传统的在线规划方法，本发明弹道规划方法推导过程简单，可处理大量、任意分布的禁飞区情况，具有更强的适应性；本发明弹道规划方法可严格保证禁飞区边界约束，飞行弹道平滑，需用过载小，具有更高的制导精度。

说明书

技术领域

本发明涉及一种绕多禁飞区的多步决策弹道规划方法，属于航天技术、武器技术、制导控制领域。

背景技术

随着导弹防御系统的发展，完善的陆、海、空立体化导弹防御系统已对重要军事目标形成了全方位、多层次保护，给现代导弹突防构成了严重的威胁。因此，为了能够有效攻击位于防区内或防区后的目标，就必须在飞行途中尽可能规避敌方的探测雷达以及立体化防御体系成构成的禁飞区，充分利用敌方的探测和防御系间隙或在己方电子干扰支援下所形成的突防通道，进行最优的突防路径规划，同时满足禁飞区边界约束，提高突防概率；此外，对于时敏目标，如敌高空侦察机、正在转移的敌方战略武器发射平台、来袭导弹、敌机等目标，需要导弹在最短的时间对其实施拦截或打击，否则可能错失打击窗口，导致任务失败。因此，需要设计一种能够在线快速规划突防路径，同时满足多禁飞区边界约束的弹道规划方法，以导引导弹以最短的时间、最优的路径命中目标。

目前，绕多禁飞区的弹道规划方法主要分为两类：离线弹道规划方法和在线弹道规划方法。离线弹道规划法通过建立一系列航路点，再结合特定的路径搜索算法，如A*搜索法、 Dijkstra法、动态规划法等，完成对参考弹道的规划，其缺点是只能离线计算，主要针对静止或低速运动目标，且当禁飞区数目较多时，计算量将会非常大。在线弹道规划方法可在线完成突防路径规划并生成制导指令以控制导弹对禁飞区进行规避，主要方法有最优控制法和势能法等。最优控制法将禁飞约区约束条件转化为惩罚项加入到性能指标函数中，从而可推导出绕多禁飞区突防指令的解析解，但因推导过程复杂而只适用于少量禁飞区约束的情况；势能法得到的指令解析解推导相对简单，但因制导系数选取困难，且不易获得平滑的弹道，特别是在禁飞区边界处容易引起过载振荡，从而破坏禁飞区边界约束，同时也会增加导弹的能量消耗。

发明内容

本发明的目的是为了解决上述问题，提出一种绕多禁飞区的多步决策弹道规划方法，该方法可在线快速规划突防路径，同时严格满足多禁飞区边界约束。

本发明内容分为两部分：单禁飞区规避制导律设计和基于多步决策理论的多禁飞区弹道规划方法设计。第一部分，为单禁飞区规避制导律(OBPCG)，主要包括预测命中点计算、边界趋近制导律(BCHS，boundary constraint handling scheme)、速度指向修正(OAS， orientation adjustment scheme)、比例导引(PN，proportional navigation)四项，其中 BCHS控制导弹进行禁飞区规避机动，OAS决定导弹规避禁飞区的绕飞方向，当目标进入视野后，PN控制导弹命中目标；第二步，基于多步决策理论，建立一系列合适的航路点，结合单禁飞区规避制导律，完成绕多禁飞区的多步决策弹道规划方法设计。

本发明一种绕多禁飞区的多步决策弹道规划方法，整个过程包括以下5个步骤，其中步骤1～4为单禁飞规避制导律(OBPCG)设计，步骤5为多步决策弹道规划方法设计。具体如下：

步骤1：预测命中点计算

预测命中点通过以下迭代方法计算：

1)测量目标当前状态，进行滤波；假设目标按当前状态继续飞行，进行弹道预报；

2)初步估计目标到达预测命中点所需时间t_T

其中，R_TM为弹目相对距离，为弹目相对距离的时间导数；

3)记目标经过时间t_T后所处的位置为预测命中点；

4)计算导弹到达上述预测命中点所需时间t_M

t_M＝R_MP/V_M (2)

其中，R_MP是导弹到预测命中点的距离，V_M是导弹的速度大小；

5)计算时间差

Δt＝|t_T-t_M| (3)

6)如果Δt≤ε，则迭代结束，其中ε为误差精度；否则，用黄金分割法修正时间t_T

7)重复步骤3)。

步骤2：边界趋近制导律(BCHS)

绘制BCHS辅助说明示意图：点E为禁飞区圆心，定义垂直于向量的单位向量p_EM

其中，和分别为向量的x和y方向的分量。

H为导弹到禁飞区边界的距离，σ∈[-π,π)为导弹速度矢量V_M与p_EM的夹角，顺时针旋转为正。加速度指令a_c垂直于速度矢量V_M。则导弹在水平面内的运动方程为

其中，r是禁飞区半径，V_M为导弹速度大小，a_c为导弹加速度大小。通过模拟阻尼谐振荡器，设计加速度指令大小为

其中，ξ为阻尼系数，ω_n为自然频率。

定义为垂直于导弹速度V_M的单位矢量

其中，和分别为V_M的x和y方向的分量，则导弹指令加速度的方向向量为

则边界趋近制导律BCHS的加速度指令为

a_c＝a_c·i_ac (10)

步骤3：速度指向修正(OAS)

一些情况下，BCHS可能会控制导弹沿较长的弹道绕过禁飞区，若仅在BCHS的作用下，导弹将沿较长的弹道绕过禁飞区，导致导弹的飞行时间变长，能量消耗增加；因此，需设计OAS 以辅助BCHS获得较短的飞行弹道；

当公式(12)满足时，OAS启动；此时，OAS控制导弹以最大的可用过载n_max进行转弯，指令加速度为

其中g为重力加速度。

其中，为导弹指向预测命中点的向量。

此外，还需考虑最大可用过载n_max对OAS作用的影响，当公式(13)满足时，OAS不被激活，直接进入BCHS制导阶段。

其中r′为导弹最小转弯半径，O′F为导弹转弯中心距离禁飞区圆心E和预测命中点p连线的距离，r为禁飞区半径，O′E为导弹转变中心到禁飞区圆心E的距离；

步骤4：比例导引(PN)

当目标进入视野，即导弹与预测命中点连线与禁飞区无交点时，PN被激活以控制导弹飞向目标。此时，指令加速度为

其中，N′为有效导引比，V_c为弹目接近速度，为视线角速率；

步骤5：基于多步决策理论的绕多禁飞区弹道规划方法

引入多步决策模型如下：

定义：Γ步决策模型(S,D,T,J)，其中

1)记H:＝{0,1,2,...,Γ}，其中Γ表示决策步数；

2)状态空间S是一个非空集合，其元素为所有的状态变量s(s∈S)。记S(k)为第k步起点的状态集合，其中k∈H；

3)D(k,s)为第k步中从状态变量s出发的所有可行决策集合。决策空间D为所有决策步的可行决策总集；

4)在空间H×S×D上，T为在决策x_k作用下，从第k步的起点状态变量s到第k+1步的起点状态变量s'的状态转移函数，其中k∈H,s∈S,x_k∈D(k,s)；

5)在空间S×D^Γ上，J为性能指标函数。J(s₀；x₀,x₁,...x_Γ-1)表示在决策序列x₀,x₁,...,x_Γ-1作用下的性能指标值，初始状态变量为s₀∈S。

首先，搜索所有与导弹和预测命中点连线相交的禁飞区，将禁飞区按其与导弹距离远近标记如下

其中，C_k表示第k个禁飞区，E_k和rE_k分别为第k个禁飞区的圆心和半径；

为了能够处理多禁飞区约束的情况，建立一系列航路点，同时将这些航路点作为多步决策模型的状态变量；一般情况下，在禁飞区C_k和C_k+1(1≤k＜Γ)之间有四条公切线，记位于禁飞区C_k+1上的公切点为Q_k+1,i(i＝1,2,3,4)；需注意的是，第2步的起点状态变量只有两点，因此，第k步起点的状态集合S(k)可表示为

记状态变量之间所有可行决策的集合为决策空间D。

使突防弹道最短的性能指标为

其中，ω(k,x_k)表示在决策x_k(x_k∈D)作用下第k步的飞行距离。

为了使导弹的突防路径最短，应使导弹在最优的决策序列(x₀,x₁,...,x_Γ)控制下飞行，此时 J(s₀；x₀,x₁,...,x_Γ)最小。但当禁飞区数目很大时，搜索最优决策序列的计算量将会变得非常大，无法满足弹载计算机实时生成指令的需求；因此，为了提高多步决策的速度以适应更加多变的战场环境，设计以下方法搜索近优的可行决策控制序列：

使第k步的飞行距离ω(k,x_k)最小的决策x_k(x_k∈D)为：

1)若禁飞区圆心E_k和E_k+1位于导弹与预测命中点连线MP两侧，则内公切线为最优转移弹道；

2)若禁飞区圆心E_k和E_k+1位于导弹与预测命中点连线MP同侧，则外公切线为最优转移弹道；

3)在第1步和最后1步中，单禁飞规避制导律(OBPCG)直接控制导弹自动决策。

定义垂直于向量的单位向量

其中和分别为向量的x和y方向的分量；

则可得第k+1步的起始状态变量为

当建立所有航路点之后，将每一阶段的航路点作为导弹当前单禁飞规避制导律(OBPCG) 制导律的虚拟目标，即可控制导弹沿近优的弹道进行多禁飞区突防，并最终命中目标；首先，进行预测命中点解算，然后搜索所有与视线相交的禁飞区，记为E₁,E₃,E₆,E₈，基于多步决策理论建立一系列航路点Q₁,Q₂,Q₃,Q₄，在单禁飞规避制导律(OBPCG)制导律作用下，控制导弹沿航路点进行多禁飞区突防，并最终在PN制导下命中目标。

本发明一种绕多禁飞区的多步决策弹道规划方法，其优点在于：

(1)相较于离线规划方法，本发明弹道规划方法具有较强的实时性，在线规划速度快，可根据任务及战场环境需求实时生成新的规避指令；

(2)相较于传统的在线规划方法，本发明弹道规划方法推导过程简单，可处理大量、任意分布的禁飞区情况，具有更强的适应性；

(3)本发明弹道规划方法可严格保证禁飞区边界约束，飞行弹道平滑，需用过载小，具有更高的制导精度。

附图说明

图1是BCHS辅助说明示意图。

图2是在有OAS作用和无OAS作用下导弹的飞行弹道。

图3是由于过载能力不足而导致OAS失效的情况一。

图4是由于过载能力不足而导致OAS失效的情况二。

图5是多步决策模型的状态变量示意图。

图6是决策示意图。图6a是相邻两禁飞区圆心在弹目连线异侧的情况；图6b是相邻两禁飞区圆心在弹目连线同侧的情况。

图7是第k+1步的起始状态变量计算示意图。

图8是本发明绕多禁飞区的多步决策弹道规划方法的指令生成流程。

图9是本发明绕多禁飞区的多步决策弹道规划方法的效果示意图。

图10是本发明OBPCG制导律在最大可用过载分别为10G、6G、3G情况下的飞行弹道。

图11是本发明多步决策弹道规划方法在多禁飞区约束情况下的突防弹道。

图12是相应的过载曲线。

图13是在本发明多步决策弹道规划方法作用下导弹的三维突防弹道。

图14是三维突防弹道在水平面的投影情况。

图15是相应的过载曲线。

具体实施方式

下面将结合附图和实施例对本发明做进一步的详细说明。

本发明是一种绕多禁飞区的多步决策弹道规划方法。首先，仅考虑单一禁飞区的情况，进行单禁飞规避制导律(OBPCG)设计，主要包括预测命中点计算、边界趋近制导律(BCHS)、速度指向修正(OAS)、比例导引(PN)四项，其中OAS决定导弹规避禁飞区的绕飞方向，BCHS 控制导弹进行禁飞区规避机动，同时保证严格满足禁飞区边界约束，PN在导弹进入目标视野后被激活，以控制导弹命中目标。然后，基于多步决策理论，进行多禁飞区航路点设计，结合OBPCG，完成绕多禁飞区的多步决策弹道规划方法设计。本发明一种绕多禁飞区的多步决策弹道规划方法，整个过程包括以下5个步骤，其中步骤1－4为单禁飞规避制导律(OBPCG) 设计，步骤5为多步决策弹道规划方法设计。

步骤1：预测命中点计算方法

预测命中点通过以下迭代方法计算：

1)测量目标当前状态，进行滤波。假设目标按当前状态继续飞行，进行弹道预报；

2)初步估计目标到达预测命中点所需时间t_T

其中，R_TM为弹目相对距离，为弹目相对距离的时间导数；

3)记目标经过时间t_T后所处的位置为预测命中点；

4)计算导弹到达上述预测命中点所需时间t_M

t_M＝R_MP/V_M(22)

其中，R_MP是导弹到预测命中点的距离，V_M是导弹的速度大小；

5)计算时间差

Δt＝|t_T-t_M|(23)

6)如果Δt≤ε，则迭代结束，其中ε为误差精度；否则，用黄金分割法修正时间t_T

7)重复步骤3)。

步骤2：BCHS设计

图1为BCHS制导律辅助说明示意图。点E为禁飞区圆心，定义垂直于向量的单位向量p_EM

其中，和分别为向量的x和y方向的分量。

其中，r是禁飞区半径，V_M为导弹速度大小，a_c为导弹加速度大小。通过模拟阻尼谐振荡器，设计加速度指令大小为

其中，ξ为阻尼系数，ω_n为自然频率。

定义为垂直于导弹速度V_M的单位矢量

其中，和分别为V_M的x和y方向的分量，则导弹指令加速度的方向向量为

则BCHS的加速度指令为

a_c＝a_c·i_ac (30)

步骤3：OAS设计

图2展示了一些情况下，BCHS可能会控制导弹沿较长的弹道绕过禁飞区。若仅在BCHS的作用下，导弹将沿较长的弹道2绕过禁飞区，导致导弹的飞行时间变长，能量消耗增加。因此，本发明设计OAS以辅助BCHS获得较短的飞行弹道。

当公式(12)满足时，OAS启动。此时，OAS控制导弹以最大的可用过载n_max进行转弯，指令加速度为

其中g为重力加速度。

其中，为导弹指向预测命中点的向量。

此外，还需考虑最大可用过载n_max对OAS作用的影响。图3和图4介绍了两种由于过载能力不足而导致OAS失效的情况。图3表示导弹距离禁飞区过近，OAS无足够能力进行弹道的调整，导致导弹进入禁飞区，此时OAS失效；图4表示当导弹经过M'点时公式(32)条件不再满足，OAS结束，但导弹绕飞方向无改变，此时OAS没有起到预期的效果。综上所述，当公式(13)满足时，OAS不被激活，直接进入BCHS制导阶段。

其中r′为导弹最小转弯半径，O′F为导弹转弯中心距离禁飞区圆心E和预测命中点p连线的距离，r为禁飞区半径，O′E为导弹转变中心到禁飞区圆心E的距离。

步骤4：PN设计

当目标进入视野，即导弹与预测命中点连线与禁飞区无交点时，PN被激活以控制导弹飞向目标。此时，指令加速度为

其中，N′为有效导引比，V_c为弹目接近速度，为视线角速率。

实施例一验证了本发明单禁飞规避制导律在不同最大可用过载情况下的仿真效果。

步骤5：基于多步决策理论的绕多禁飞区弹道规划方法设计

为了便于设计本发明弹道规划方法，引入多步决策模型如下：

定义1Γ步决策模型(S,D,T,J)，其中

1)记H:＝{0,1,2,...,Γ}，其中Γ表示决策步数；

2)状态空间S是一个非空集合，其元素为所有的状态变量s(s∈S)。记S(k)为第k步起点的状态集合，其中k∈H；

3)D(k,s)为第k步中从状态变量s出发的所有可行决策集合。决策空间D为所有决策步的可行决策总集；

4)在空间H×S×D上，T为在决策x_k作用下，从第k步的起点状态变量s到第k+1步的起点状态变量s'的状态转移函数，其中k∈H,s∈S,x_k∈D(k,s)；

5)在空间S×D^Γ上，J为性能指标函数。J(s₀；x₀,x₁,...x_Γ-1)表示在决策序列x₀,x₁,...,x_Γ-1作用下的性能指标值，初始状态变量为s₀∈S。

首先，搜索所有与导弹和预测命中点连线相交的禁飞区，将禁飞区按其与导弹距离远近标记如下

其中，C_k表示第k个禁飞区，E_k和rE_k分别为第k个禁飞区的圆心和半径。

为了使本发明制导律能够处理多禁飞区约束的情况，本发明建立一系列航路点，同时将这些航路点作为多步决策模型的状态变量。图5展示了决策模型的所有状态变量。一般情况下，在禁飞区C_k和C_k+1(1≤k＜Γ)之间有四条公切线，记位于禁飞区C_k+1上的公切点为 Q_k+1,i(i＝1,2,3,4)。需注意的是，第2步的起点状态变量只有两点，因此，第k步起点的状态集合S(k)可表示为

记状态变量之间所有可行决策的集合为决策空间D。

使突防弹道最短的性能指标为

其中，ω(k,x_k)表示在决策x_k(x_k∈D)作用下第k步的飞行距离。

为了使导弹的突防路径最短，应使导弹在最优的决策序列(x₀,x₁,...,x_Γ)控制下飞行，此时 J(s₀；x₀,x₁,...,x_Γ)最小。但当禁飞区数目很大时，搜索最优决策序列的计算量将会变得非常大，无法满足弹载计算机实时生成指令的需求。因此，为了提高多步决策的速度以适应更加多变的战场环境，本发明设计以下方法搜索近优的可行决策控制序列，图6为决策示意图。

使第k步的飞行距离ω(k,x_k)最小的决策x_k(x_k∈D)为：

4)若禁飞区圆心E_k和E_k+1位于导弹与预测命中点连线MP两侧，则内公切线为最优转移弹道；

5)若禁飞区圆心E_k和E_k+1位于导弹与预测命中点连线MP同侧，则外公切线为最优转移弹道；

6)在第一步和最后一步中，OBPCG直接控制导弹自动决策。

图7为第k+1步的起始状态变量计算示意图。定义垂直于向量的单位向量

其中和分别为向量的x和y方向的分量。

则可得第k+1步的起始状态变量为

当建立所有航路点之后，将每一阶段的航路点作为导弹当前OBPCG制导律的虚拟目标，即可控制导弹沿近优的弹道进行多禁飞区突防，并最终命中目标。图8展示了本发明绕多禁飞区的多步决策弹道规划方法指令生成流程。图9为本发明绕多禁飞区的弹道规划方法效果示意图。首先，进行预测命中点解算，然后搜索所有与视线相交的禁飞区，记为E₁,E₃,E₆,E₈，基于多步决策理论建立一系列航路点Q₁,Q₂,Q₃,Q₄，在OBPCG制导律作用下，控制导弹沿航路点进行多禁飞区突防，并最终在PN制导下命中目标。

实施例：

实施例一

本实施例考虑单一禁飞区约束的情况，以验证本发明OBPCG制导律在不同最大可用过载限制下的突防性能。目标位置固定XT＝(30,30)km，导弹的初始位置为XM＝(-60,0)km,初始速度为禁飞区半径r_E＝30km。图10展示了本发明OBPCG制导律在最大可用过载分别为10G、6G、3G情况下的飞行弹道，可以看出，当最大可用过载足够大时， OBPCG将控制导弹沿较短的飞行路径绕过禁飞区；但当最大可用过载较小的情况下，由于此时导弹的最小转弯半径大于导弹到禁飞区边界的距离，OBPCG将控制导弹沿较长的飞行路径绕过禁飞区，从而保证不打破禁飞区边界约束。

实施例二

本实施例验证本发明多步决策弹道规划方法在多禁飞区任意布置情况下的性能。15个禁飞区随机分布，禁飞区半径从15km到36km不等，导弹的初始状态为XM＝(60,0)km, 目标的初始状态为XT₀＝(-170,-230)km,VT₀＝(-130,150)m/s。假定目标按如下轨迹进行机动

其中，A＝300km,T＝70km。

图11展示了本发明多步决策弹道规划方法在多禁飞区约束情况下的突防弹道，可以看出，在本发明弹道规划方法的作用下，导弹沿一条相对平滑且较短的弹道完成多禁飞区突防任务，且严格保证禁飞区边界约束。图12展示了相应的过载曲线，可以看出，本发明弹道规划方法的过载相对平滑，需用过载较小，具有较好制导性能。

实施例三

本实施例验证本发明多步决策弹道规划方法在三维禁飞区约束情况下的突防性能。这里将三维禁飞区简化为无限高的圆柱，采用本发明BCHS制导律控制导弹在水平面内运动，采用类比例导引的方法控制导弹在垂直平面的运动。下面给出类比例导引控制律的推导过程。

首先，定义坡度率θ

其中，s为剩余飞行距离在水平面内的投影，h_T,h_M分别为目标和导弹的海拔高度。

则坡度率的时间导数为

则导弹在垂直平面内的加速度指令为

其中N'为有效导引比，V_c为弹目相对速度。

本实施例中，假定目标按如下轨迹进行机动

其中A＝300km,T＝70km。

导弹的初始状态为XM＝(-60,0,15)km, 目标的初始状态为 XT₀＝(220,-140,5)km,VT₀＝(180,40,0)m/s。15个三维禁飞区任意分布，半径由15km到36km不等。图13展示了在本发明绕多禁飞区的多步决策弹道规划方法作用下的导弹三维突防弹道，图14展示了三维突防弹道在水平面的投影情况，可以看出，导弹能够沿平滑的、较短的飞行路径完成三维禁飞区突防任务，且严格保证禁飞区边界约束。图15展示了相应的过载曲线，可以看出过载曲线非常平滑，且需用过载较小。

一种绕多禁飞区的多步决策弹道规划方法专利购买费用说明