面向水利监管的违采事件检测并行化方法研究

2023-10-07 21:22:34马斌徐海军陈嘉靖
人民黄河 2023年10期
关键词:黄河模型

马斌 徐海军 陈嘉靖

摘 要:现有卷积神经网络检测方法不能满足高检测精度和速度的要求。针对此不足,利用卷积神经网络选取目标检测算法,以DarkNet53 网络模型为基础,结合黄河流域违采事件特点,对模型加入并行化设计,以检测速度和检测精度为评价指标,利用对比实验验证并行化后的HO-DarkNet 网络模型的加速效果。结果表明:并行化前HO-DarkNet 模型的精确率约75%、召回率约96%、mAP@ 0.5 为98.58%、mAP@ 0.5 ∶ 0.95 为64.25%,与DarkNet53 模型相比,并行化前HO-DarkNet 模型的mAP@ 0.5、mAP@ 0.5 ∶ 0.95 值分别提升了7.98%、8.79%;与并行处理前HO-DarkNet 模型相比,并行处理后HO-DarkNet 模型的mAP 精度值未发生太大变化,但其加速比提高了2.32,对于视频图像的处理速度为21 fps/ s,达到视频图像处理速度标准。

关键词:HO-DarkNet 模型;水利监管;违采事件检测;并行化;黄河

中图分类号:TV853;TV882.1 文献标志码:A doi:10.3969/ j.issn.1000-1379.2023.10.022

引用格式:马斌,徐海军,陈嘉靖.面向水利监管的违采事件检测并行化方法研究[J].人民黄河,2023,45(10):122-125.

近年来,频繁发生的黄河违规采砂事件对流域生态系统造成了严重破坏。为此,相关部门提出开展黄河河道采砂专项整治行动,通过强化法治管理,维护河道采砂秩序,促进黄河流域生态系统平稳发展[1] 。在众多检测技术中,目标检测算法在水文检测、水位信息智能识别、砂石检测[2] 等方面发挥着重要作用,其中基于深度学习的目标检测算法应用尤其广泛[3] 。深度学习是在卷积神经网络的基础上,通过增加网络深度提高计算机提取数据特征的能力[4] 。然而,增加网络深度会加大运算量,影响检测效率。采用数据并行、模型并行等方法对多模型进行优化,可以加速运算。数据并行是指在完整模型基础上,通过把数据划分为若干份,实现多批次数据同时训练。此时并行设备数量会受到批数据大小的限制,当批数据过大时,达到相同收敛精度所需的迭代次数会大幅度增加。模型并行是指将模型按层或者其他方式分解为若干份来进行训练,这种方法通常用于拆分大型模型,以加速训练过程,但其扩展性较差。目前,PyTorch 和TensorFlow 等主流深度学习框架都采用数据并行方式。

本文以面向水利监管的违采事件为研究对象,首先改进检测算法模型,减少梯度信息量,再采用并行运算提高模型训练速度和检测速度,最后基于违采事件监管数据集验证模型并行后的加速效果,以期为快速、准确地检测违采事件提供新技术。

1 理论方法

1.1 卷积神经网络

卷积神经网络(Convolutional Neural Networks,CNN)模型[5]结构分为卷积层、池化层和全连接层。卷积层从输入特征图像通道提取特征信息[6] ;池化层对提取的特征信息进行下采样,减轻网络模型的过拟合程度;全连接层连接提取的特征图像,使用分类器得到最终分类结果。在卷积神经网络模型中,通常会在若干个卷积层和池化层之后引入全连接层,池化层伴随卷积层交替显示。

1.2 目标检测算法

one?stage 和two?stage 算法是基于深度学习的主要目标检测算法[7-8] 。two?stage 算法先通过某种方式生成一些候选框,再通过卷积神经网络对候选框进行分类。常见的two?stage 目标检测算法有Faster-RC?NN[9] 、R-FCN[10] 算法,此类算法要进行多次检测和分类,运行较慢。而one?stage 目标检测算法只需将数据一次传送进网络,就可以预测出所有的边界框。常见的one?stage 目标检测算法有SSD 和YOLO v3 算法,此类算法没有单独的候选区域提取过程,不需要产生候选框,仅一个前馈CNN 网络就可以完成目标的位置检测和分类预测任务,因此one?stage 目标检测算法简便快捷、运行较快。one?stage 目标检测算法中DarkNet53网络模型作为基于残差网络结构的卷积神经网络模型,被广泛应用于目标检测领域。本文基于DarkNet53 网络模型展开违采事件检测研究。

2 违采事件检测模型构建与并行化分析

2.1 违采目标群选取

通过调查黄河流域违规采砂事件发现,违采人通常利用手推车、装载车、挖掘机等进行采砂,再进行非法售卖。因此,本文主要选取违采人、采砂工具等作为特定的违采目标群来进行模型设计。2.2 违采事件检测模型构建DarkNet53 网络模型由卷积层和残差层组成,使用大量残差跳层连接,其包含的梯度信息数量多、重复率高。针对此问题,提出改进的HO-DarkNet 网络模型来构建违采事件检测模型。在HO-DarkNet 网络模型中,把基础层次的特征图划分成2 个部分,再使用跨阶段的层次结构将它们合并,可以减少网络模型中大量重复的梯度信息,提高网络模型的处理速度。HODarkNet网络模型单个模块(HO_X)结构见图1,图中CBL 为Conv(卷积)、BN(批量归一化)、Leaky_relu 激活函数三者结合的组件;Res unit 组件借鉴Resnet 网络中的残差结构,可以增加网络深度;Concat 组件的作用是张量拼接,会扩大维度的张量。

3 数据获取与预处理

数据获取方式有实地拍摄和网上图像爬取。本研究通过实地拍摄获取5 000 张图像,通过网络爬虫技术获得35 000 张图像,共获取40 000 张图像作為实验数据集。由于采集的数据集会受到图像尺寸、图像清晰度、目标受遮挡程度等因素的影响,因此需要对采集图像进行数据清洗、人工筛选。采用Labelimg 软件对数据集进行标注,制作成VOC 格式的数据集,在An?notation 文件路径下生成与标注图像相对应的xml 文件。对采集的图像进行处理后,得到违规采砂数据集分类数量如下:违采人图像3 142 张,铲车图像2 812张,灰斗车图像2 746 张,铲子图像2 600 张,挖掘机图像3 068 张,汽车图像2 750 张,拉砂车图像3 352 张。

4 确定评价指标

采用精确率、召回率和平均精确度(mAP)对模型效果进行评估。精确率是指正确预测的正例个数占所有预测为正例的样本个数的比率[11] 。召回率是指所有被正确识别的目标数量占所有被识别目标数量的比率[12] 。mAP 表示一个模型在多个类别上的检测准确性,用mAP@ 0.5 表示IoU(Intersection over Union)阈值为0.5 时的平均精确度,用mAP@ 0.5 ∶ 0.95 表示IoU 阈值为0.5~0.95时的平均精确度。

衡量并行算法性能的指标有加速比和并行效率[13] 。加速比反映系统运行并行程序时发挥并行能力的程度,其与硬件、软件都有关系。并行效率是衡量并行计算系统利用多个处理单元或计算资源时的有效性和性能提升程度的指标,反映实际执行时间与理论最佳执行时间之间的差异。

5 实验结果分析

采用HO-DarkNet 网络模型对违采事件进行实验,使用获取的违规采砂数据集进行训练和测试,批处理大小设置为32,训练次数为5 000 次,测试次数为1 000次,初始学习率设为0.001,在测试第2 000 次和第4 000 次后各设置学习率为0.000 1、0.000 01 进行实验。实验效果见图3 和表1。

阈值为50 时可以实现精确率和召回率的平衡,此时HO-DarkNet 网络模型的精确率在75%附近波动,召回率在96% 附近波动。与DarkNet53 模型相比,HO-DarkNet模型的mAP@ 0.5、mAP@ 0.5 ∶ 0.95 值分别提升了7.98%、8.79%,HO-DarkNet 网络模型性能有所提高。

在处理速度方面,标准的视频图像处理速度为24~30 fps/ s。经过多次实验发现,HO-DarkNet 网络模型对于视频图像的处理速度为6 fps/ s,不能达到实际应用需求。因此,采用并行方法进一步对HO-DarkNet网络模型进行改进,以提高处理速度。

为验证并行化设计的有效性,本实验继续采用上述违规采砂数据集,设置数据集为20 000 张图像,其中:16 000 张为训练图像,4 000 张为验证图像,参数设置保持不变。并行处理前HO-DarkNet 网络模型的加速比为1.00,并行处理后HO-DarkNet 网络模型的mAP @ 0. 5 值为90. 40%, mAP @ 0. 5 ∶ 0. 95 值为55.39%,加速比为3.32。并行处理后HO-DarkNet 网络模型的mAP 精度值未发生太大变化,而检测速度有了大幅度提升。同时经过多次检测发现,并行处理后HO-DarkNet 网络模型对于视频图像的处理速度为21 fps/ s,达到视频图像处理速度标准。

6 结论

本文围绕黄河流域违规采砂事件,对面向水利监管的违采事件检测方法进行并行化研究。通过分析DarkNet53 网络模型基本结构,结合检测背景、需求和目标等特点,对卷积计算过程进行并行化分析,构建并行化HO-DarkNet 网络模型。相比于DarkNet53 网络模型,并行化的HO-DarkNet 网络模型可以显著提高检测速度。

参考文献:

[1] 孙运锋.践行治水思路锚定“两个确保” 深入推动河南水利高质量发展[J].河南水利与南水北调,2022,51(1):1-6.

[2] SIT M,DEMIRAY B Z,XIANG Z R,et al.A ComprehensiveReview of Deep Learning Applications in Hydrology andWater Resources[J].Water Science and Technology,2020,82(12):2635-2670.

[3] REN S Q,HE K M,GIRSHICK R,et al.Faster R?CNN:To?wards Real?Time Object Detection with Region Proposal Net?works[J].IEEE Transactions on Pattern Analysis & MachineIntelligence,2017,39(6):1137-1149.

[4] DONG S,WANG P,ABBAS K.A Survey on Deep Learningand Its Applications[J].Computer Science Review,2021,40(1):100379.

[5] BHATT D,PATEL C,TALSANIA H,et al.CNN Variants forComputer Vision:History,Architecture,Application,Challengesand Future Scope[J].Electronics,2021,10(20):2470.

[6] Wang Z J,TURKO R,SHAIKH O,et al.CNN Explainer:Learning Convolutional Neural Networks with Interactive Visu?alization[J].IEEE Transactions on Visualization and ComputerGraphics,2020,27(2):1396-1406.

[7] 张苗,李璞,杨漪,等.基于目标检测卷积神经网络的图像型火灾探测算法[J].消防科学与技术,2022,41(6):807-811.

[8] 张海涛,张梦.引入通道注意力机制的SSD 目标检测算法[J].计算机工程,2020,46(8):264-270.

[9] MANSOUR R F,ESCORCIA?GUTIERREZ J,GAMARRA M,et al.Intelligent Video Anomaly Detection and ClassificationUsing Faster RCNN with Deep Reinforcement Learning Model[J].Image and Vision Computing,2021,112:104229.

[10] CEN H.Target Location Detection of Mobile Robots Basedon R?FCN Deep Convolutional Neural Network[J].Interna?tional Journal of System Assurance Engineering and Man?agement,2021:14(2):728-737.

[11] 田乔鑫,孔韦韦,滕金保,等.基于并行混合网络与注意力机制的文本情感分析模型[J].计算机工程,2022,48(8):266-273.

[12] 刘万军,王凤,曲海成.融合多尺度特征的目标检测模型[J].激光與光电子学进展,2019,56(23):123-133.

[13] 王之元,杨学军.并行计算系统度量指标综述[J].计算机工程与科学,2010,32(10):44-48.

【责任编辑 栗 铭】

猜你喜欢
黄河模型
一半模型
黄河娃
p150Glued在帕金森病模型中的表达及分布
多彩黄河
金桥(2020年11期)2020-12-14 07:52:46
黄河宁,天下平
金桥(2020年11期)2020-12-14 07:52:42
重要模型『一线三等角』
黄河黄河,我爱你
黄河之声(2020年15期)2020-10-16 01:03:44
重尾非线性自回归模型自加权M-估计的渐近分布
『黄河』
当代陕西(2019年21期)2019-12-09 08:36:12
黄河知道我爱谁
当代音乐(2019年2期)2019-06-11 21:17:05