基于Rasch模型的身份认证技术研究

2018-04-19 14:26:04王宏俊王岩松王进汪胡青
活力 2018年24期

王宏俊 王岩松 王进 汪胡青

【摘要】身份认证作为保护用户合法权益的第一道关口,在网络安全中有着重要的作用。本文首先调研了近年来身份认证的热门技术及应用领域,然后,将常用于心理研究的Rasch模型应用于身份认证,根据节点过去的交往行为形成实体集认证矩阵,并代入数据分析工具Mini-step进行分析,根据分析结果评估出各实体节点的身份可靠性概率。

【关键词l身份认证;Rasch模型;Mini-step

引言

随着互联网技术的发展,社交网站和各类社交软件的快速涌现,传统意义上人与人之间的社会关系已经发生了重大的变化,网络安全问题日益突出,对网络中的节点进行身份评估成了一大需求。本文通过将拓扑网络中通信实体抽象为节点,由于每个节点均可发送和接收数据,并可以与一个或多个对等节点直接通信,故极易受到内部恶意节点攻击。一旦网络中的某个节点被控制,便可在网络中发布虚假信息或进行内部攻击(节点访问控制,恶意流量控制等)造成网络瘫痪。因此对节点身份进行认证,识别网络恶意节点具有重大意义。

国内外学者对多个网络应用领域的身份认证做了研究。为了防止学生在考试时作弊和平时成绩抄袭等情况,针对Mooc中的身份认证提出了基于双因子模糊认证与区块链技术,模糊认证即身份认证不再是简单的提取单个图文数据信息,而是由若干个属性的集合,信息比对的不再是准确度,而是重叠程度。双因子采样分为两个阶段,首先由注册阶段由Mooc生成公钥,然后公钥与学生信息绑定,学生(身份证+指纹)生成私钥。最后将信息加密存储。然后验证阶段采取模糊认证,因为生物信息不可避免地会产生误差。作者还把应用了区块链技术,即生成一个空开的账本,记录学生的学习轨迹,区块链技术确保了信息的不可篡改,只能添加。最后通过上述信息对学生颁布数字证书。

由于数据的暴涨,云计算孕育而生,然而如何在云计算中对动态变化的数据用户进行身份认证就显得十分重要并且由于用户量大,如果把身份认证的重担都放在云服务器上势必会降低效率,故提出一种面向注册用户的身份认证方法和一种面向本地代理服务器的身份认证方法。在身份认证策略中,将身份认证放在本地服务器上执行,将加密代理HE-RSA加密算法,由云服务器执行,提高了云服务器的效率和用户访问的可扩展性。

传统的身份认证技术用的是账号密码策略,安全性强一点的使用OTP、手机短信认证等方式。比较成体系的主要是4A和IAM,虽然也采用大数据分析来改进,但还是存在着许多安全问题。而区块链技术具有“单向加密、时间戳、去中心、不可篡改、全网保存、分布式共识”等特点,把采集到的身份信息通过区块链进行信息存储,提高用户信息的安全程度和身份认证的准确性。身份认证的大致流程:首先拍照收集个人证件信息,将个人身份信息写入区块链中,将加密的图像信息存放到身份服务器;其次将身份信息发送给第三方代理,代理根据个人信息完成认证令牌的颁发并发送到区块链中;再次通过区块链的共享,新的代理应用可以从区块链获取个人身份信封数据和加密图像以及令牌;最后,新代理应用再次采集用户生物信息进行验证,达到正确认证个人的目的。

在优化基于挑战/应答机制的一次性口令认证方案的基础上在认证因子中加入硬件表示信息以及基于北斗卫星导航系统的所获得的位置信息和时间戳信息,同北斗指控中心的信息比对反馈,完成节点间的多因素双向认证。在初始阶段,主要完成节点的密钥生成、身份注册、密钥分发。在认证阶段,两个节点A、B之间先进行互相的加解密信息发送,匹对随机数副本,一致后发送至北斗指控中心。中心解密后返还信息给A节点,来认证B节点的真实性。再通过B节点进行类似操作验证A节点的真实性,至此双向认证结束。

基于用户鼠标行为的身份认证方法主要是通过各个用户使用鼠标时的差异行为来进行认证的。在一定的时间内记录下用户使用鼠标的基本行为(移动、点击、拖拽、滚屏、静置),记为一级特征;在一级特征基础上进行的组合操作行为为二级特征。其中二级特征能够有效降低认假率。最终通过极限学习机作为分类器来计算一级特征和二级特征的数据(随机输入权重与偏置来确定隐藏的输出矩阵,从而求解线性系统。运算中的隐藏节点数是一个很重要的参数影响认证的准确性),实现身份认证。

上述身份认证方案对各领域网络安全研究作出了重要贡献,但方案本身由于大多采用密码学方法,存在着计算量大、复杂度高、开销多的缺陷。本文研究了心理学中应用广泛的Rasch模型,将其应用于身份认证中,并用Mini-step工具进行分析,借此评估各实体节点的身份可靠性。

一、Rasch模型

Rasch模型的客观性以一组假定为前提:

a.实体集A與B都有其特定的可信值。

b.他们的可信值都以数值形式呈现在同一个尺度上。

c.通过实体A与B认证的结果,即其得分值,我们可以推算出A与B集合的可信度。

Rasch模型拥有以下几个特性:

(一)节点与测试的独立性

由于大多数身份认证模型过于依赖设备(如服务器),在实际应用中往往存在诸多问题,如服务器故障或无法识别恶意节点等,造成了服务器质量与节点身份之间很强的依赖关系,缺乏客观陛。在Rasch模型中,节点的身份是由节点通信中的“表现”所决定的,因此不具有依赖性。

(二)模型简单

从社会学角度看,信任关系是最复杂的社会关系之一,是一个很难度量的抽象的心理认知,当实体之间的信任关系不能明确定义的时候,它也是不稳定的,给它的管理和评估带来了困难,这一困难在复杂网络中更加明显,由于社区量庞大,节点数众多,给数据分析与模型建立带来了挑战。而Rasch模型将多个受试个体在多次通信中的数据得出的二维0、1矩阵通过对数转换,也就是Logit方法(D Andrich,1982)转换,由于运算量小,数据采集简单,很好地解决了在实际应用中数据量庞大的问题。

二、基于Rasch模型的身份认证技术

在Rasch模型中我们假定有两个实际集A1…A7与B1…B7,他们互相认证情况如表l所示,l代表认证成功,0代表认证失败。

三、Mini-step的数据分析与验证

Mini-step是一种常见的基于Rasch模型的数据分析软件。本文使用该软件对测试数据进行分析处理,将其结果与上文的算法进行对照匹配以进行验证。

(一)能力值及难度值

通过MINISTEP软件我们可以方便地得到实体A和B可信度的Logit图,如图1。

从上图中我们不难看出,左侧为A的可信度Logit值,越往图的上方则可信度越强。A实体集可信度从高到低为:A3、A6、A2、A1、A7、A5、A4。而B实体集可信度从高到低为:B1、B10、B9、B4、B6、Bll、B2、B5、B8、B3、B7。

(二)异常样本

由chi-square统计量除去自由度所得的商为均方Mean-Square,可知均方的值应约等于1。如果均方值大于1,则为Underfit,表示数据中有外界因素影响了测量质量。如果均方值小于1,则为Overfit,表示数据十分符合,若过分符合也会影响其可信度。可以通过Outfit的气泡图(图2)来进行观察。

从图2中的Measure维度看,A和B的广度大致一致,稍有偏差,而从Outfit Mean-Square维度上看,大部分的A和B还是位于l的附近的,基本符合要求,只有B3节点明显处于Underfit区即“不舒适区”。可以得出结论,大部分实体的结果都较为可信,从中发现了A3与B1、B10、B9最为可信的节点,并对A1、A7、A5和B8、B5、B3实体表示怀疑。如果本次测试数据来源于真实实验观察值则会更符合要求,论文中的测试数据仅供学习探讨。

结语

本文通过对网络节点的相互认证结果进行分析,从而得到最可靠节点与不可靠节点以及可疑节点,评估出各自节点身份的可信度,完成身份认证。理论上,数据量越庞大,节点越多,得到的值越精确。本文没有对大规模节点通信数据进行研究,还有进一步研究的意义。