摘要:随着时代的发展和技术的进步,数据生产和传播模式不断创新。而随着信息获取方式与数据分析手段的进步,企业防范开源信息泄密面临着越来越高的要求。境外情报机构利用新技术、新手段,搜集、分析国家开源情报信息,导致泄密风险激增。本文梳理和分析了境外情报机构通过开源信息获取国家情报的方式及其特点,提出了新时代企业防范开源信息泄密工作的启示和思考。
关键词:企业;境外情报机构;开源信息泄密
随着互联网和信息技术的发展进步,数据生产和传播模式不断创新,导致数据信息保密工作难度越来越大。境外情报机构利用大数据、云计算、人工智能等新技术手段,大肆搜集、深入分析国家重点领域的新闻宣传、政府公报信息、学术论文等开源情报信息,使得泄密风险隐患激增。美国一直采用信息技术手段监控和获取开源信息,对企业防范开源信息泄密工作带来严峻挑战。
一、境外情报机构通过开源信息攫取情报的方式
开源情报采集是指使用爬虫技术等从互联网中采集海量开源文本信息,然后使用自然语言处理技术对文本信息进行预处理,继而使用文本分类模型对采集的文本信息进行分类[1],从而提取可用信息,获取相关领域的情报。由于互联网信息的综合性,开源情报获取方式有多种分类,且有一定程度的交叉。本文根据情报来源的不同将开源情报获取方式分为公开数据、网络社群和用户生成的内容、专业与学术活动等三类[2]。
(一)公开数据
利用公开数据获取开源情报是指通过政府工作报告、财政预算、人口普查、公开的法院案卷、新闻发布会、演讲、环境影响评估报告、官方媒体等官方权威公开信息,以及全球各地的卫星图片提取有用信息形成情报的方式。如通过专利文献获取专利信息,是境外情报机构了解一个国家前沿技术走势的有效途径之一。再如,公开的卫星图片往往具有很高的分辨率,使得公开来源情报的能力延伸到以往只有主流情报机构才能具备的领域[2]。情报机构结合技术手段,如利用识图功能获取图片EXIF信息,可以提取拍摄器材、拍摄时间、拍摄地点(经纬度、海拔)等信息,再通过地图定位具体地理位置,结合街景图提取照片中的有效特征,有可能获取部分涉密单位、重要设施的地理位置、外观以及内部构造等。
(二)网络社群和用户生成的内容
网络社群和用户生成的内容可能导致无意识的信息泄密。在自媒体时代,用户在社交网站、视频分享网站、百科类网站、博客、问答社区等平台发布的文本、图片、评论和视频等原始内容,往往相对真实、观点看法丰富,可以构成个人画像的主要部分,对分析目标人物和特定人群具有显著的参考作用,从中可筛选出大量有价值的信息。网站访问日志等原始内容关联的元数据详细记录了每个用户的登录、注销信息,如日期、时间、地理位置等,对分析目标人物和特定人群的网络使用习惯具有一定的参考意义,可作为取证和补证证据。境外情报机构广泛收集互联网用户在各类平台发布的原始内容,如文本、图片和视频,与原始内容关联的元数据,以及与目标发布的内容相关联的回复、互动及其日期、时间、地理位置等,可为开源情报关联提供全方位的信息支撑。微信等社交平台也是数据关联的关键一环。境外情报机构通过分析电话号码、实名制存储的微信名、备注的职务、单位等信息获取工作单位等信息;也可能关联到个人目标曾经公开发布的论文、报告等,进而锁定此人所在工作、研究领域等。用户看到感兴趣的内容,为了方便日后查阅使用,往往会有收藏、点赞、评论等交互行为。境外情报机构通过抓取和分析这些交互行为,即可对用户进行数字化描述,再通过IMEI等收集物理特征信息关联,进一步与其他信息处理设备等进行更深层次的大数据分析,从而提取关键的信息数据。
(三)公开发布的学术成果
通过公开发布的学术成果获取情报的方式可细分为通过内部文献、公开会议、学术研讨会、科技论坛、学术论文等方式。各类数据库和研究机构定期发布的研究报告、信息跟踪、专家述评、论文等提供了特定领域较为全面、权威的概念性、前瞻性、探讨性的研究成果,很有可能是未来某领域的核心技术,可为境外情报机构获取国家某领域的权威信息和发展趋势提供大量素材。境外情报机构通过收集各类数据库和研究机构定期发布的成果获取特定领域的权威、前沿信息,进而分析转化为有利用价值的情报并实现定期跟踪,获取和分析某一领域的发展趋势并实现对该领域的预测。如研究机构人员公开发表的论文中包含与国家正在推进研究的方向有较强技术关联的信息,虽然没有透露具体型号参数,但很有可能被境外情报机构利用,通过综合其他情报来源,分析得出相应性能指标[3],造成泄密。
二、开源情报获取的特点
相比传统情报获取方式,开源情报获取本身就具有鲜明的时代特点,在互联网和大数据的加持下,更新速度快、规模海量的信息使得开源情报获取难度小,其公开的属性使得其获取合理合法且具有隐蔽性,全方位的社交媒体为开源情报获取搭建了天然平台,伴随着越来越先进的新兴技术手段,深度挖掘、关联分析赋予开源情报更加立体可信的印证能力。
(一)信息资源获取成本小、风险低
相较于传统情报获取方式,开源情报的显著特点是可以通过互联网等公开渠道、利用免费或者低价的各类工具通过互联网等公开渠道,获取到不断更新的情报,经济成本很低,投入少且可以获得较大回报。如利用Web2.0、维基百科等机制,可以动员大量人员针对感兴趣的主题公示开展信息收集活动,相比传统情报收集需要专业人员,开源情报获取大大降低了成本。开源情报获取是通过合规合法的手段收集分析公开、合法的信息数据,从信息的获取到情报的使用各个阶段的安全风险都比较低。对企业和机构而言,开源情报收集避免了其他情报工作中可能存在的违法或违反道德的风险;对国家而言,开源情报可以避免其他类型情报工作引发的外交纠纷。
(二)情报工作开展独立性、隐蔽性强
开源情报凭借自身独立性强的特点,具有很强的隐蔽性。通过公开途径收集信息数据能够有效防止目标追根溯源,从而避免暴露秘密情报源。也是因此,开源情报技术可以保护自身的战略目的。相较于传统情报获取方式容易被对方追踪并被推测战略意图,开源情报技术难以察觉,难以反推其战略意图。
(三)全方位搭载社交媒体
新时代各类社交媒体平台爆炸式增长,海量用户生成的内容已经成为开源情报的重要来源。通过分析这些内容,可以实现对社会动向、公众情绪、网络舆论等各方面情况的实时监测和预警。系统可通过深度学习算法,自动识别异常的在线讨论和指标,实现对敏感事件的预警。从传统文本媒体到音视频、图像等多媒体数据,情报机构挖掘到的情报类型和形式变得更加多样化。这也使得通过社交媒体获取的开源情报更加立体和直观,能够更加全面地刻画人物画像、描述群体特征、反映舆论倾向。
(四)可交叉鉴别真伪
信息化时代,信息的规模和体量巨大。对于同一目标事件,存在不同信息源、不同视角、不同形式的信息。一方面,海量的开源信息可以通过发布的不同主体、不同时间相互印证真伪。另一方面,开源情报可以快速填补其他手段获取的情报的空白,从而形成相互补充和相互印证,有助于进一步提升情报的准确性。
(五)新兴互联网技术深度参与
在人工智能、大数据分析等新兴互联网技术快速发展的背景下,分析海量素材时,采用大数据等新技术手段关联分析是开源情报获取、分析的一大特征。在信息采集方面,开源信息获取工作无需像传统情报工作一样需要专业的情报人员,降低了情报收集工作的体量和难度。在信息存储方面,存储能力的提升使得数据即用即弃的方式得到改观,大量原始数据被累积。大量集中的数据一方面通过关联提升了数据自身的价值,另一方面也带来了集中泄密的风险[4]。在数据分析方面,可通过人工智能辅助分析。在人工智能的辅助下,用户提供的信息量越大,对其价值挖掘的效果越好。一旦用户的信息中包含涉密敏感信息,便会造成泄密。在信息分析手段方面,过去的数据分析方法主要是采样、统计,而在大数据时代,相关机构和人员可以借助全量数据,通过不断学习提高准确性,分析关联关系而不是因果关系,进行深度的分析挖掘,从而对关联信息泄密带来巨大隐患。
三、启示和思考
目前,在中美博弈的大背景下,开源信息丰富多样,部分信息在未被意识到其情报价值的情况下即已发布。碎片化、模糊化的数据等传统意义上被认为安全的数据汇聚到一起。相关机构和人员通过深入关联与分析,可能洞察到隐藏在大数据表象背后的重要情报。这对新时代开源信息保密工作提出了更严格的要求。
(一)推进新形势新技术发展下保密制度更新换代
在涉密制度方面,随着大数据、云计算等技术的发展,企业和机构在不断创新技术手段、提升行业系统集成和信息处理能力的同时,也应及时推动保密管理制度的更新换代。具体而言,企业和机构应在充分考虑大数据时代各类新技术的基础上,对保密工作的组织领导、思想教育、管理监控、技术防范、新闻宣传、应急处置、案件查处等各项工作进行分解,使保密内容、责任要求和督导检查等要素落实到具体单位、具体部门和具体人员,抓好保密工作的精细化和常态化落实。要结合境外情报机构关注的重点,落实国家相关制度规范,健全信息分级分类管控机制,完善非密信息公开保密审查制度,分级分类确定信息属性,在新闻宣传、论文发表等各环节压实审查责任。要建立信息分级管理机制,从信息的生成、使用、提供等各个环节建立不同等级的保护措施,设置不同的审批流程,下放不同的权限。
(二)细化公开信息风险评估与保密审查
结合境外情报机构关注的重点,加强对本领域开源信息汇聚后的泄密风险评估,健全信息分级分类管控机制,落实相关制度规范,完善信息公开保密审查制度,压实审查责任,从严把握审查标准,加强对信息发布源头的管理。对拟公开发布的信息可能面临的数据汇聚、关联分析进行综合评估,防范敏感信息被滥用的风险。同时,应增强相关人员的政治敏锐性,将保密自查、审查工作做深做实[5]。
(三)强化开源信息保密技术监测
加强开源信息检测能力,扩大保密技术监管范围。对已经公开发布的有可能涉密或敏感信息进行集中清理,建立社交媒体监督监控长效机制。细化日常办公使用要求,严禁在微信、朋友圈及其他社交媒体上传输、发布涉密敏感信息,严禁使用微信小程序对涉密敏感信息进行拍照、录音、录像或图文识别。对新闻媒体公开发表的文章进行保密核查,创新信息公开发布方式,防范“关联”“对比”等类型的泄密。
(四)培养专业化反开源信息泄密人才队伍
面对开源情报泄密风险日渐提升的境况,亟需培养一批掌握大数据挖掘、深度学习、网络安全等前沿技术并可进行创新应用的高端人才。同时,由有关部门主导组织开展有针对性的选拔和培训,迅速提升既有队伍的整体水平。可通过国内培训和选派出国深造相结合的方式。扩大高校和研究机构在开源情报人才培养中的作用,组建产学研合作平台,建立人才交流机制。此外,还应建立健全的人才激励和约束机制,以及安全信息审查制度,充分调动相关人员的工作积极性,强化对人才的管理。
(五)提升人员保密意识
开展开源信息泄密专项安全保密培训教育并形成长效机制,填补保密教育在防范开源信息泄密方面的“盲区”。针对不同岗位的人员进行有针对性的、分级分类的防范开源信息泄密的保密教育和技能培训,紧密结合工作需要,使保密意识入脑入心。深化形势研判,加强对相关法律法规的宣贯教育和对使用新技术、新产品的保密提醒,切实增强相关人员的敌情意识和风险意识。
作者单位:查懿童 杜丽岩 张思源 中核战略规划研究总院有限公司
参考文献
[1]王明乾,倪林,张斌.基于文本分类的开源军事情报获取方法[J].情报探索,2021,(07):17-23.
[2]高伟波,康泽宇,李仲琴.开源情报的搜集及其应用[J].网络安全和信息化,2021,(06):125-130.
[3]董莉,李宗.军队科技期刊的技术泄密因素分析及防范对策[J].编辑学报,2014,26(01):54-56.
[4]曾晴,雷斌.浅析大数据时代的军工行业保密工作[J].网络安全技术与应用,2017,(08):85-86+91.
[5]齐琪.开源情报视角下的新闻把关工作[J].保密科学技术,2023,(06):56-59.