卫星系统在役考核对数据挖掘的应用需求*

2023-02-10 05:56:06钱昭勇曹裕华王晓乾
科技与创新 2023年1期
关键词:数据挖掘卫星考核

钱昭勇,曹裕华,张 雷,王晓乾

(1.航天工程大学航天保障系,北京 101416;2.国防大学联合勤务学院,北京 100858;3.西安卫星测控中心,陕西 西安 710043)

卫星系统在役考核意义非凡,内容丰富,要求严格,是一个复杂的系统工程问题。数据挖据的应用具有明显的工程性和集合性,涵盖了统计、分类、聚类、关联、预测等多种数据分析与处理思想,一次数据挖掘可视为由多个步骤组成的工程化过程,能够较好地用于分析解决卫星系统在役考核相关问题。显然,数据是卫星系统在役考核的核心资源,考核的筹划设计、组织实施、分析评估3个阶段都离不开对数据的采集、存储和各种有针对性的分析处理。同时,数据挖掘集合了对数据采集、存储和预处理,对算法的选择和应用,对结果的展示和验证的完整过程[1]。考核中不同的应用需求对应着不同的数据挖掘思想和方法,为更好地服务于卫星系统在役考核过程,厘清数据挖掘在卫星系统在役考核中的应用需求显得非常必要。

1 数据挖掘经典技术原理

数据挖掘是指从大量的、不完全的、有噪声的、随机的数据中,综合运用各种技术与方法,获取隐藏在其中的、有价值的知识(特征、规则、趋势等)的过程[2]。最早的数据挖掘理论基础主要源于统计、机器学习和数据库系统。经过不断的发展,数据挖掘领域逐渐形成了一套经典的基础理论,主要包括关联规则、分类、聚类、时间序列等。

1.1 关联规则

数据挖掘的一个重要应用是寻找数据关联性,即发现2个或多个参数数据之间存在的某种内在规律,包括简单关联、因果关联、时序关联等。关联规则分析是数据挖掘中非常典型的一类技术方法。一个典型的关联规则案例就是某超市的啤酒与尿布销售问题。啤酒与尿布是两类看似无关的商品,但是该超市却发现这两类商品经常“绑定”销售。关联分析中的支持度和置信度分别反映关联规则的准确度和重要性,所以关联规则分析的主要目的是找出同时满足最小支持度和置信度的强关联规则。实践表明,Apriori算法和FP-growth算法是最为经典的2种不同类型的代表性关联分析算法。通常情况下,最小支持度阈值越大,频繁项和挖掘的关联规则数量就越少;最小支持度阈值越小,频繁项和挖掘的关联规则数量就越多。为此,算法性能的表现受频繁项集长度的影响,一般广度优先算法针对短频繁项集挖掘相比深度优先算法表现更好,反之亦然。

1.2 分类

分类作为数据挖掘的重要组成部分,属于有监督学习模式,通过使用已知类别标签的样本数据训练分类器,并通过训练出的分类器对未知的新样本进行分类。分类算法主要包括单一分类和集成学习分类2种类型。经典的单一分类算法主要有K-邻近(KNN)、支持向量机(SVM)、朴素贝叶斯分类(BNC)、逻辑回归(LR)、决策树(DT)、神经网络(ANN)等。集成学习分类是为保证分类效果和防止过学习,通过将多个单一的基分类器按照一定的方式集成起来进行分类的方法,集成学习分类算法主要有Bagging系列和Boosting系列算法等。

1.3 聚类

聚类是一种无监督学习的方法,在许多领域得到了重要的应用。聚类通过数据间的相似性把数据归类,并根据数据的概念描述来制定对应的策略。其基本过程是按照特定标准(如距离)把一个数据集分割成不同的类或簇,把相似数据归并到一类的过程,形成同类对象具有共同特征,不同类对象之间的有显著区别,直到所有数据的归类都完成。聚类算法主要包括层次聚类方法(BIRCH、Ward)、划分聚类方法(K-means、PAM)、基于密度的方法(DBSCAN、DENCLUE)、基于网格的方法(STING、CLIQUE)和基于模型的方法(COBWEB、EM)等。

1.4 时间序列

时间序列是按照一定的时间顺序和时间间隔的数据集合,包含着许多潜在有用的信息,时间序列分析不仅可以揭示某一现象的发展变化规律,还可以动态刻画现象之间的相互关系。主要包括以下几种模型:①传统的时间序列分析模型,主要包括自回归(AR)、滑动平均(MA)、自回归滑动平均(ARMA)、使用差分的自回归滑动平均(ARIMA)等模型;②机器学习模型,主要运用Xgboost、LightGBM等算法,能够解决非线性问题,能够支持复杂数据建模和多变量协同回归,挖掘速度快精度高,但是对人工特征工程的能力有较大的依赖;③深度学习模型,主要包括全连接神经网络(如多层感知器MLP)、循环神经网络(长短时记忆网络LSTM)、卷积神经网络(CNN)3类,能够自动地学习时间序列的时间相关性,尤其对于海量时间序列数据处理,具有其他方法不能替代的优势。

2 在筹划设计中的应用

在役考核筹划设计阶段,有很多问题可以通过数据挖掘得到更好的解决,例如考核需求的梳理、考核任务的规划、考核方案(预案)的设计等。数据挖掘技术能够帮助己方在相关应用信息平台管理中,及时、准确地收集和分析自身运维情况、空间环境、轨道、外部航天器及整个自身编组内部的各种数据信息,设计科学的考核指标与方案,既可以对卫星系统自身的适用性进行综合考核评估,又可以对运行趋势进行有效的分析预测,考核不同类型卫星的管控模式,从而为卫星管控提供有针对性的策略,大大提高各类卫星对自身的管控能力和对外部的应急处置能力。

2.1 总体应用矩阵

从任务的视角看,利用数据挖掘可以分析未来潜在的风险,整理出相关卫星长期的时间序列特点,找出最有兴趣的(有威胁的)外部卫星,做好相关预案,让其没有机会对我方卫星作出实质性的干扰或破坏。面对这些卫星,数据挖掘可以发现它们的姿态控制规律而采取相应的应对措施。在卫星系统在役考核筹划设计阶段,最主要的工作就是立足于考核目的需求,充分利用卫星系统对各种运控、管理、维护等历史数据进行挖掘分析。主要包括准确进行考核的必要性、可行性和风险分析,厘清考核任务需求,合理分解考核任务,选择考核科目,设计考核指标,制定并优选考核方案。

2.2 具体应用矩阵

在卫星系统在役考核筹划设计的具体应用中,最突出的2类问题是任务规划和指标设计。对于任务规划,当面对大量的任务需求时,应注意卫星系统如何根据任务的特征以及自身影响因素,科学地对提供天基信息支援的任务进行重要性分类,确定优先满足哪些任务需求,从而为后续实现卫星调度的优化分析奠定基础。对于指标设计,应注意如何立足于考核任务目的,聚焦考核的需求指标,对考核指标的权重进行综合分析考量,并在此基础上对指标进行精简优化,使得指标的分析和选取更具全面性和层次性,助力后续建立更好的考核指标体系。数据挖掘在筹划设计中的具体应用有如下4个方面。

第一,更加正确地判断优先为哪些作战任务提供卫星支援服务。对于每一个作战任务需求而言,能否得到相应及时的卫星系统支援,此类似于回答“是”与“否”的问题,即可等价于一个二分类问题。通过对任务进行特征工程,分别使用数据挖掘中的K邻近、逻辑回归、决策树、支持向量机、高斯朴素贝叶斯、随机森林等多种不同分类模型进行判断,通过对比可找出更适合的分类模型。

第二,更加科学合理地设计卫星系统在役考核指标。关于卫星系统在役考核指标的合理选取问题,可使用统计学中的熵权法等对考核指标进行赋权;关于卫星系统在役考核指标的精简优化问题,针对初始选取的考核指标大多具有冗余性和相关性等不足,可采用统计学中的因子分析方法进行合并,或数据挖掘技术中的关联规则算法(FP-Growth算法)进行指标精简,适当删减冗余指标,整合相关性较强的部分指标,使得指标更精简优化。

第三,更加客观地设置卫星系统在役考核科目,优选考核方案。对于同一考核任务,常常设置不同的多种考核科目,可通过聚类分析,将功能类似的考核科目进行整合或削减。对于同一考核内容,往往有多种考核方案(预案),可利用灰色关联分析,根据方案的不同指标更加客观地筛选出更优的考核方案。

第四,准确地进行卫星系统在役考核的可行性分析。卫星系统在役考核具有政治和舆论敏感性强、外在和自身存在一定的风险等特点,将影响考核的不同因素进行特征工程,在役考核的可行性分析便可视为一个二分类问题,可使用支持向量机或逻辑回归模型进行分析;同时,对实施卫星系统在役考核进行风险预测分析,可将风险进行等级划分,又可将其视为一个多分类问题,可使用随机森林或神经网络模型进行分析。

3 在组织实施中的应用

在役考核组织实施阶段,随着考核任务的实施开展,不断产生大量的考核数据。通过数据挖掘工具能够更好地进行自动化的数据采集,综合统筹卫星系统考核产生的数据与历史运维记录中包含的非结构化数据,可以构建相应的考核任务案例数据库,结合考核任务执行的过程,大大增加了产生新知识的速度。

3.1 总体应用矩阵

数据挖掘可以提高卫星资源的利用率,利用一定的挖掘算法,可以得出一个最优解,节省卫星运维调度中的成本,促进科学安排卫星参与演习训练和卫星资源调度,这样既能满足演习任务,又让成本消耗降至最低。由于对数据资产的不断重视,不仅卫星运维日志记录和控制管理数据可以有效地被存储和提取,不同卫星的星务数据和载荷的遥测数据都可以更好地被采集利用。从卫星系统的在役适用性方面看,利用数据挖掘从这些数据中寻找潜在的关系或规律,可以获得对在轨卫星故障进行诊断、维护的有效知识;提高对故障预测的准确性,及早发现故障,使得保障效率更高;加强对在轨卫星剩余寿命的预测分析,有针对性地采取相应的延寿方案和技术,为卫星的退役报废或其他用途奠定基础。从考核任务的实施过程看,利用数据挖掘技术可以有效判断当前任务是否为考核计划的关键任务、各个任务之间的关联关系以及能否并行开展实施等。

3.2 具体应用矩阵

在卫星系统在役考核组织实施的具体应用中,最突出的2类问题是遥测数据采集监测和卫星故障诊断与预测。

对于遥测数据采集检测,首先一般将采集的卫星遥测数据分为模拟量和数字量,模拟量进一步分为恒定模拟量、区间模拟量和趋势变化模拟量,数字量进一步分为状态数字量、独立数字量和关联数字量。其中,模拟量主要包括温度、压力、电压、电流、角度等,数字量主要包括计数、指令、状态等。然后通过数据挖掘的预处理方法,将遥测数据分为4种异常类型:脉冲型异常、阶跃型异常、渐变型异常、周期型异常。

对于在轨卫星故障诊断和预测,首先按故障种类、故障数量、卫星类型、型号和日期等了解每天的卫星系统运行和维护情况,记录遥测参数的每一点变化。其次建立空间环境数据库,包括统计每日太阳和地磁活动观测数据、各类轨道环境数据等。再次构建在轨测控信息数据库,统计常规的测控事件和发生异常后的测控事件,如某次测控操作的名称、指令名称、执行部件的工作数据等。利用数据挖掘工具和统计模型对数据库的数据仔细研究,以分析测控事件的发生习惯、故障发生率和空间环境的相关信息。最后通过检索数据库中近年来的特殊测控事件数据进行挖掘分析,可预测出季节性故障发生周期,并有利于对测控的时间和调整方式作出决策辅助;将性能退化型模拟数据转换为数值数据,使用数据挖掘可有效分析诊断零部件的故障类型;将遥测数据转换为数值数据,使用数据挖掘可有效地进行在轨卫星实时故障检测和故障预测,数据挖掘在卫星系统在役考核组织实施的具体应用有如下5个方面。

第一,实现在轨卫星系统在役考核的故障分析。卫星系统故障分析是一个综合性问题,根据不同的需求,可以用到多种数据挖掘方法。通过收集历史告警数据,构建时间序列ARMA模型预测相关类型的告警情况,然后采用支持向量机(SVM)和随机森林(RF)等预测模型进行分类判断,进而分析在轨卫星是否发生某具体类型的故障。

第二,实现卫星组件或元器件可靠性趋势分析。建立卫星产品性能退化信息数据库,长周期全寿命统计表征卫星典型产品性能退化信息的数据,如陀螺的电流、轴温等,蓄电池的放电电流、温度、放电终压等,通过利用小波变换将原始信号进行分解,并对子信号进行特征提取,进而将特征数据输入到支持向量机等分类器中进行故障诊断[3]。也可以通过时间序列准确预测各类组件或元器件的质量稳定性,从而为其可靠性趋势分析提供对应的辅助参考。

第三,实现在轨卫星故障分组、诊断推荐和故障参照分析。搜集国内外典型故障案例,包括故障发生原因、发生机理、严重等级、发生频度、运行轨道、故障可恢复性、故障发生时运行时间等卫星在轨信息,建立故障案例数据库,通过关联规则算法从故障记录中挖掘相关信息,可以发现产生某一种故障时可能产生其他故障。这类关联信息可用于形成一定的故障诊断推荐,或者保持一定的相关故障分组,以帮助管理者迅速进行故障诊断,节省故障诊断时间,并可以针对故障采取有针对性的处理应对方式。

第四,利用遥测数据进行故障检测和预测。由于卫星按照轨道周期运行,因此卫星遥测数据存在周期性,而轨道周期与卫星的飞行高度有关,因此不同飞行高度的卫星具有不同的轨道周期。利用数据挖掘技术可以分析出对应的遥测参数会在什么时间、以何种方式和对什么样的组件或者分系统造成影响,大大增强了故障的实时检测预测能力。通过对遥测参数进行监控与分析,结合长短期记忆网络(LSTM)和卷积神经网络(CNN)构建数据挖掘模型,用于解决在线多任务(多参数)在轨卫星故障预测问题。

第五,实现在轨卫星剩余寿命预测。统计表征卫星典型产品在轨寿命信息的数据,例如推进剂、剩余燃料等消耗类产品,电子类产品的工作寿命、积累工作时间和开关机次数等,运动机构的累计运动次数或转动角度等,蓄电池的累积循环次数等,然后在此基础上建立贝叶斯模型,准确预测卫星在轨剩余寿命。

4 在分析评估中的应用

随着考核任务的逐渐完成,在分析评估阶段应进一步处理实施考核任务的各种数据。在役考核分析评估阶段,最主要的目的是评价和提升,即对考核结果的合理评价以及对考核方法的改进提升。评价着重于在卫星系统在役考核中分析发现存在的主要缺陷和不足等,为卫星系统的运维管控、改进升级[4]、中止召回提供决策辅助。提升着重于通过卫星系统在役考核中的各种任务实施,发现和总结部队在使用卫星系统提供天基信息支援时的方式手段或步骤程序的不足之处,改进优化技术方法或执行流程,进一步提升卫星系统核心效能的发挥。

4.1 总体应用矩阵

在卫星系统在役考核评估中通过数据挖掘技术的深入应用,一是可以帮助进行挖掘知识的传播,促进知识助力卫星系统性能和效能的进一步提升,有利于管理人员学习最新的模式来指导卫星管控实践,从而为相关卫星管控计划转变为训练实践提供机会。二是通过在役考核的评估分析,挖掘更加有效的卫星运用方法和应用知识,改进升级利用卫星系统的方式和手段,为部队提供更好的天基信息支援保障,进而让部队在训练演习和实战过程中发挥更积极的作用。

4.2 具体应用矩阵

在卫星系统在役考核分析评估的具体应用中,最突出的2类问题是准确客观地评估卫星系统效能和分析寻找提升卫星系统效能的方法。对于卫星系统效能评估,从其所发挥的核心功能为主的单项效能进行分析,包括通信、导航、遥感卫星系统效能;从整体上划分,主要是运用云模型实现通导遥一体化系统的综合效能评估。对于卫星系统效能提升,通信方面,主要利用基于块稀疏贝叶斯学习方法处理窄带干扰抑制问题;导航方面,主要通过改进模糊C均值实现三频观测值优选;遥感方面,使用深度学习方法实现高效准确的图像语义分割。数据挖掘在卫星系统在役考核分析评估的具体应用有如下4个方面。

第一,卫星系统直扩通信窄带干扰抑制。现有基于Nyquist-Shannon采样定理的窄带干扰抑制方法存在应用受限于采样率较高的问题。应用压缩感知理论解决上述问题,利用窄带干扰抑制在频域表现出的块稀疏特性以及直接序列扩频信号的类噪声特性,使用基于块稀疏贝叶斯学习的方法,建立直接序列扩频通信窄带干扰抑制模型。

第二,导航卫星BDS-3三频观测值线性组合优选。三频线性组合法能够提供具有不同特征的组合,是实现导航效能提升的重要方法之一。但由于组合数目庞大、组合性能不一,人工筛选效率极低,大大降低了导航卫星系统的效能。以BDS-3三频观测值线性组合优选为例,使用模糊C均值(FCM)算法以及对其的优化改进算法,分别基于公开数据集和短基线、长基线以及超长基线BDS实测数据,研究改进粒子群优化模糊C均值(PSO-FCM)算法对提高优选效率的有效性。

第三,遥感卫星系统图像语义分割。随着深度学习在图像领域的迅速发展,作为像素级别的图像分类方法,语义分割也有了长足的进展。可使用基于DeepLab v3等深度学习的语义分割方法,来实现高分辨率遥感图像的语义分割,并在ISPRS Vaihingen数据集上验证分割准确度及精确度。选择更优的方法作为一种高效的自动化分割工具,有利于提高遥感图像自动判图的准确性和效率。

第四,通导遥一体化卫星系统综合效能评估。通导遥一体化卫星系统更有利于在支援联合作战中发挥更强优势,但相关研究目前还不成熟,其综合效能的评估也面临随机性太强、模糊性较大等很多复杂的现实问题。一种可供尝试的方法是基于云模型的综合效能评估方法,其能够较好地克服通导遥系统评估的随机性过大、主观性太强等问题。

5 结语

卫星系统特殊的工作环境和本身复杂的组成结构,决定了其在役考核对数据挖掘技术的重要需求。将数据挖掘技术有效地介入卫星系统在役考核全流程,无疑是一种可行而有效的途径。全文立足卫星系统在役考核筹划设计、组织实施、分析评估3个阶段,从总体上梳理了数据挖掘思想和技术的应用需求,建立了具体的应用矩阵,为下一步卫星系统在役考核的数据分析处理奠定了基础。

猜你喜欢
数据挖掘卫星考核
miniSAR遥感卫星
探讨人工智能与数据挖掘发展趋势
内部考核
童话世界(2020年10期)2020-06-15 11:53:22
静止卫星派
科学家(2019年3期)2019-08-18 09:47:43
创新完善机制 做实做优考核
当代陕西(2019年9期)2019-05-20 09:47:40
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
公立医院 如何考核?
中国卫生(2016年2期)2016-11-12 13:22:24
Puma" suede shoes with a focus on the Product variables
一种基于Hadoop的大数据挖掘云服务及应用
家庭年终考核
海峡姐妹(2014年5期)2014-02-27 15:09:32