收藏 分销(赏)

基于深度可分离卷积的多神经网络恶意代码检测模型_蒋瑞林.pdf

上传人:自信****多点 文档编号:275197 上传时间:2023-06-26 格式:PDF 页数:7 大小:1.85MB
下载 相关 举报
基于深度可分离卷积的多神经网络恶意代码检测模型_蒋瑞林.pdf_第1页
第1页 / 共7页
基于深度可分离卷积的多神经网络恶意代码检测模型_蒋瑞林.pdf_第2页
第2页 / 共7页
基于深度可分离卷积的多神经网络恶意代码检测模型_蒋瑞林.pdf_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、2023-05-10计算机应用,Journal of Computer Applications2023,43(5):1527-1533ISSN 1001-9081CODEN JYIIDUhttp:/基于深度可分离卷积的多神经网络恶意代码检测模型蒋瑞林,覃仁超*(西南科技大学 计算机科学与技术学院,四川 绵阳 621010)(通信作者电子邮箱3481665 )摘要:针对传统的恶意代码检测方法存在成本过高和检测结果不稳定等问题,提出一种基于深度可分离卷积的多神经网络恶意代码检测模型。该模型使用深度可分离卷积(DSC)、SENet(Squeeze-and-Excitation Network)通道

2、注意力机制和灰度共生矩阵(GLCM),通过三个轻型神经网络与灰度图像纹理特征分类并联检测恶意代码家族及其变种,将多个强分类器检测结果通过朴素贝叶斯分类器融合,在提高检测准确率的同时减少网络计算开销。在MalVis+良性数据的混合数据集上的实验结果表明,该模型对恶意代码家族及其变种的检测准确率达到 97.43%,相较于ResNet50、VGGNet模型分别提高了6.19和2.29个百分点,而它的参数量只有ResNet50模型的68%和VGGNet模型的13%;在malimg数据集上该模型的检测准确率达到99.31%。可见,所提模型检测效果较好,且参数量也有所降低。关键词:恶意代码;神经网络;深度

3、可分离卷积;SENet;通道注意力机制;灰度共生矩阵中图分类号:TP309.5 文献标志码:AMulti-neural network malicious code detection model based on depthwise separable convolutionJIANG Ruilin,QIN Renchao*(School of Computer Science and Technology,Southwest University of Science and Technology,Mianyang Sichuan 621010,China)Abstract:Concern

4、ing of the problems of high cost and unstable detection results of the traditional malicious code detection methods,a multi-neural network malicious code detection model based on depthwise separable convolution was proposed.By using the Depthwise Separable Convolution(DSC),SENet(Squeeze-and-Excitati

5、on Network)channel attention mechanism and Grey Level Co-occurrence Matrix(GLCM),three lightweight neural networks were connected with GLCM in parallel to detect malicious code families and their variants,then the detection results of multiple strong classifiers were fused via Naive Bayes classifier

6、 to improve the detection accuracy while reducing the computational cost.Experimental results on the hybrid dataset of MalVis+benign data show that the proposed model achieved the accuracy of 97.43%in the detection of malicious code families and their variants,which was 6.19 and 2.29 percentage poin

7、ts higher than those of ResNet50 and VGGNet models respectively,while its parameter quantity is only 68%of that of ResNet50 model and 13%of that of VGGNet model.On malimg dataset,the detection accuracy of this model achieved 99.31%.In conclusion,the proposed model has good detection effect with redu

8、ced parameters.Key words:malicious code;neural network;depthwise separable convolution;SENet(Squeeze-and-Excitation Network);channel attention mechanism;Grey Level Co-occurrence Matrix(GLCM)0 引言 根据2021年中国国家互联网应急中心给出的互联网网络安全监测数据分析报告,捕获恶意程序样本数量约 2 307万个,日均传播次数达582万余次1。全球范围内,根据卡巴斯基安全网络报告,在2021年发生了1 098

9、 968 315次针对在线设备的攻击和62 577 326次恶意代码安全事件2。恶意代码泛滥已经造成了巨大的经济损失,甚至严重威胁到国家安全和社会稳定。在恶意代码检测方法不断迭代的同时,恶意代码为了规避检测产生各种变种,使得目前恶意代码的检测难度增大。如何高效检测恶意代码及其变种成为恶意代码检测领域面临的主要挑战。目前恶意代码检测技术主要分为静态特征分析技术和动态模拟运行技术两个大类。静态特征分析技术的原理是对待检测代码进行逆向分析以确认其执行逻辑;而动态模拟运行技术的原理是通过安全的沙盒模拟真实环境下待检测代码运行并分析其行为特征。它们都是基于特征的检测方法,分别面临代码混淆和沙盒逃逸等问题

10、,使得检测误报率高,费时费力。鉴于上述情况,文献 3 中提出将恶意代码图像化并使用神经网络分类检测的方式。基于神经网络的恶意代码检测技术是恶意代码检测领域的新兴方向,该技术能高效检测隐藏代码和混淆恶意软件,且成本低,是目前恶意代码检测的有效手段之一。传统神经网络不断加深拓宽的网络深度和宽度一定程度上可以提高恶意代码识别准确率,但存在梯度爆炸、参数量剧增等问题,需要耗费大量的计算成本。针对上述问题,本文提出了一种基于深度可分离卷积的多神经网络恶意代文章编号:1001-9081(2023)05-1527-07DOI:10.11772/j.issn.1001-9081.2022050716收稿日期:

11、2022-05-20;修回日期:2022-12-22;录用日期:2023-01-18。基金项目:四川省科技计划项目(2022YFG0339)。作者简介:蒋瑞林(1998),男,陕西咸阳人,硕士研究生,CCF会员,主要研究方向:网络空间安全;覃仁超(1978),男,四川武胜人,副教授,博士,主要研究方向:网络安全、智能计算。第 43 卷计算机应用码检测模型。本文主要工作如下:1)基于Stacking算法与预测模型原理提出了融合多模型的恶意代码检测方法,使用朴素贝叶斯(Naive Bayes)算法作为次级学习器融合最终结果,提高模型检测准确率;2)优化了 MobileNet、ShuffleNet

12、和 Xception 三个轻量级神经网络模型,引入深度可分离卷积来杜绝由于深度和并联个数过多导致的梯度爆炸和内存占用过高问题;3)基于恶意代码及其家族代码复用性高的原理,提出一种基于LGBM(Light Gradient Boosting Machine)的图片纹理特征分类恶意代码的检测方法,并将其加入检测模型增加检测特征提高检测准确率。1 相关工作 1.1基于静态特征分析的恶意代码检测静态特征分析技术是指将可执行程序进行反汇编、反编译,将获取并分析的代码特征作为静态检测特征。主流研究常将静态特征与机器学习相结合来检测恶意代码。ahin等4提出了一种提取程序权限调用特征作为静态特征,使用K最近

13、邻算法和朴素贝叶斯算法作为分类器的检测方法;Lu等5提出了一种基于敏感权限许可结合随机森林(Random Forest,RF)分类算法构建的双层检测模型;Du等6提出了一种基于API调用信息和数据流信息结合支持向量机(Support Vector Machine,SVM)构建的静态特征检测模型。静态特征分析主要是以权限调用为主,而单一的权限调用特征并不能描述一个恶意代码的全部行为;而且在遇到代码混淆或代码加壳逃逸手段时,该技术自身存在的短板会导致检测失效或耗时过多等问题。1.2基于动态模拟特征的恶意代码检测动态模拟运行技术是指对代码执行过程进行分析,在沙盒中执行待检测代码,将代码运行的行为生成

14、日志,包括代码对系统文件操作信息、上传下行流量、动态链接库调用和进程访问情况等,从中提取并分析特征作为动态检测特征。主流研究常将动态模拟运行获取的动态特征与分类算法结合来检测恶意代码。张东等7提出了一种基于动态特征结合多种机器学习的恶意代码检测方式;王宁等8提出了一种基于系统函数调用信息结合多种机器学习框架的检测方式。由于沙盒逃逸技术、反沙盒检测和沙盒原生漏洞等,导致该检测技术对拥有反沙盒技术的恶意代码检测效率低下。1.3基于神经网络的恶意代码检测基于神经网络的检测技术的主要检测思路是将待检测代码转换成矩阵或向量,再映射成图像,使用神经网络对图像进行分类。待检测代码映射成图像的方法主要包括:将

15、待检测代码的可执行文件的二进制矩阵映射成灰度图像9、将待检测代码在动态模拟运行时 API调用转换成向量矩阵后映射成图像10等。Xu 等11将程序控制流图(Control Flow Graph,CFG)和数据流图(Data Flow Diagram,DFG)转换成矩阵后映射为图像,再使用传统卷积神经网络(Convolutional Neural Network,CNN)模型微调后分类;Bakour 等12提出将程序函数声明字段作为数据集,使用自然语言处理模型进行分类。除了上述文献中对经典模型的微调作为分类模型,部分研究人员还提出了融合多个模型的想法。王国栋等13提出的CNN-BiLSTM检测模型

16、融合了CNN和长短期记忆(Long Short-Term Memory,LSTM)经典模型;eponis等14针对目前热门的融合模型,对 7种融合模型进行了对照实验,分析了不同融合模型的优劣;Lad 等15给出了 VGG16、ResNet50、InceptionV3和Xception四个经典神经网络模型与CNN+SVM混合模型的对比;Cui等16结合CNN和非支配排序遗传算法(NSGA-)构建分类检测模型。上述研究结果表明,多个模型融合比单神经网络或机器学习的组合构成的检测模型准确率更高。文献 17 中提出并证明:通过并联多个卷积神经网络同样可以提高恶意代码识别效率,但过多的并联也会导致模型梯

17、度爆炸、参数量剧增等问题,需要耗费大量的计算成本。2 基础理论 2.1深度可分离卷积与常规的卷积操作相比,深度可分离卷积(Depthwise Separable Convolution,DSC)的参数量和运算成本更低,是轻量级神经网络能高效运行的核心因素。DSC分为逐通道卷积(depthwise convolution)和逐点卷积(pointwise convolution)两个过程,卷积内部结构如图1所示。DSC过程的计算量是常规卷积的1/3。2.2SENet通道注意力机制SENet(Squeeze-and-Excitation Network)通道注意力机制常被用于CNN中,对图像中的重要

18、信息部分进行可视化18,SENet内部结构如图2所示。SeNet通过提高整个特征层次结构中空间编码的质量来增强 CNN 的表示能力,显式建模通道之间的相互依赖关系以自适应地重新校准通道特征响应。注意力机制可对特征进行校正,校正后的特征可保留有价值的特征,剔除没价值的特征。SENet通道注意力机制分为Squeeze和Excitation两个过程,分别如式(1)、(2)所示。Squeeze 首 先 通 过 全 局 平 均 池 化(Global Average Pooling,GAP)将输入的CHW的特征图压成C11的特征图,这个结果能表示全局信息。该过程如式(1)所示:zC=Fsq(uC)=1H

19、Wi=1H j=1WuC(i,j)(1)Excitation 对 Squeeze过程的结果进行全连接操作,得到C/r(r为降维参数)维的向量,然后进行ReLU激活,再对激活后的结果进行一次全连接,将C/r维的向量变回C维向量,再进行 sigmoid 激活,得到权重矩阵。Excitation 过程如式(2)所示:s=Fex(z,W)=(g(z,W)=(W2(W1z)(2)图1深度可分离卷积Fig.1Depthwise separable convolution图2SENet的结构Fig.2Structure of SENet1528第 5 期蒋瑞林等:基于深度可分离卷积的多神经网络恶意代码检测模

20、型2.3分类模型MobileNet是Howard等19提出的一种以轻量化为特点的卷 积 神 经 网 络。该 网 络 通 过 NAS(Network Architecture Search)和 NetAdapt 算法优化全局参数,结合 DSC 发挥轻量级网络主要优势,引入SENet通道注意力机制增强神经网络表述能力。ShuffleNet 是 Ma 等20提出的 CNN 模型,特点是运算高效。ShuffleNet的设计核心为逐点卷积和通道混洗(Channel Shuffle)。通道混洗是指将特征在输入到GConv分组卷积之前,按照分组卷积的 Group 数量进行分组,并将组间的特征均匀打乱,增加通

21、道间的信息流动,在保持网络精度的情况下提升计算速度。Xception是Chollet21提出的基于Inception启发的新型深度卷积神经网络架构,使用DSC替换Inception中原有的卷积层,能在不增加网络复杂度的前提下提高模型的效果,利用DSC替代多种依赖人工设计的特征提取方式来提升性能。LGBM 是基于 GBDT(Gradient Boosting Decision Tree)算法开发的支持并行运行的训练框架。GBDT 主要思想是利用决策树(Decision Tree,DT)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。2.4图像纹理信息分类图像纹理信息也被称为图像的

22、复杂度,文献 22 中对此进行了详细的论述,即从整体角度对图像的复杂度进行了描述。图像纹理特征即将图像整体出现的灰度级情况,各灰度级像素的数量和单个像素周围像素灰度级分布情况等关键信息特征化,其中包括对图像表面结构的次序排列、整体与局部之间联系和结构同质现象等视觉特征的描述,是基于内容的图像检测方法中重要的分类特征。基于灰度共生矩阵(Grey Level Co-occurrence Matrix,GLCM)提取纹理特征是通过计算GLCM中的相关值来代表图像的纹理特征。GLCM能反映图像灰度关于方向、相邻间隔、变化幅度等综合信息,是分析图像纹理分布的主要方法之一。3 模型构建 3.1基于深度可分

23、离卷积多神经网络恶意代码检测模型基于DSC的多神经网络恶意代码检测模型如图3所示,包含4个部分:图像特征提取、多神经网络分类检测、纹理特征分类检测和基于朴素贝叶斯算法的结果融合。1)图像特征提取:将二进制恶意代码以8 bit为单位转化为 0255像素点生成恶意代码纹理灰度图,再将该恶意代码纹理灰度图经过数据预处理的归一化变成格式统一的2242243的灰度图。通过GLCM计算出每个恶意代码纹理灰 度 图 样 本 中 的 纹 理 特 征 值:能 量/角 二 阶 矩(Angular Second Moment,ASM)、熵(ENTropy,ENT)、逆方差(Inverse Differential

24、Moment,IDM)和相关度(CORrelation,COR)。2)多神经网络分类检测:将恶意代码纹理灰度图输入到多神经网络检测中,利用 MobileNet-small、ShuffleNet-SE 和Xception-SE对检测样本进行分类检测,多神经网络分类从不同的角度揭示深度可分离卷积的作用。3)纹理特征分类检测:将恶意代码纹理灰度图的纹理特征值输入LGBM分类器中,对检测样本进行分类。4)基于朴素贝叶斯算法的结果融合:多个初级学习器结果传入融合层,将初级学习器的分类结果作为特征,输入基于朴素贝叶斯算法的次级学习器,得到模型最终分类结果。3.2恶意样本特征提取恶意代码二进制位字符串可以分

25、为多个长度为8 bit的子字符串,这些子字符串中的每一位都可以被视为一个像素,因为这8 bit可以解释为0255范围内的无符号整数,其中0为黑色,255为白色。选取连续的3个子字符串,分别对应于彩色图像中RGB的3个通道,即第1个8 bit字符串转化为R通道的值,第2个8 bit字符串转化为G通道的值,第3个8 bit字符串转化为B通道的值;重复这一操作使得所有数据都被选完(最末段端数据量不足3字符串的,用0补足)。利用该原理,二进制恶意代码便转化为十进制数字的一维向量,固定256为行宽向量,高度根据文件大小变化。最终,恶意代码被解释为 RGB图像。二进制转换灰度图过程如图 4所示。3.3多神

26、经网络分类检测多神经网络分类检测部分的主要工作分为两类:加强特征表达和减小参数规模。1)加强特征方面主要在于池化层的选择和 SENet 通道注意力机制的引入。在浅层中替换平均池化(AvgPool),使用最大池化(MaxPool)提取特征纹理,网络结构最后使用global AvgPool获取全局上下文关系,引入SENet通道注意力机制强化识别过程中的特征图,加强多网络对纹理的识别能力,确保对不同数据集拥有高分类精度的同时保持检测的稳定性。2)减小参数规模主要在于对部分基础层的删减和深度可分离卷积,深度可分离卷积结构能减小多神经网络的参数规模,同时提高准确度,解决多卷积神经网络因不断加深网络深度和

27、宽度而带来的梯度消失和参数量加剧问题。3.3.1MobileNet-small相较于 MobileNet结构,MobileNet-small减少了 3层不含SE的Bneck(Bneck是MobileNet模型的基本结构块),有效减小了模型参数规模。MobileNet-small 由三部分组成起始部分:Conv3、批归一化(Batch Normalization,BN)层、h-switch激活层,网络结构如图5所示。图3基于DSC的多神经网络恶意代码检测模型Fig.3Multi-neural network malicious code detection model based on DSC图

28、4二进制转换灰度图过程Fig.4Transformation process of binary number to grayscale image图5MobileNet-small的结构Fig.5Structure of MobileNet-small1529第 43 卷计算机应用3.3.2ShuffleNet-SE在 ShuffleNet的基础单元结构上引入 SENet通道注意力机制生成 ShuffleNet-SE,强化模型识别特征。ShuffleNet-SE中基本结构块Block主要分为两个结构:stride=1的Basic unit和 stride=2 的 Down-sampling

29、unit。ShuffleNet-SE 将 Basic unit结构引入 SE,加强纹理特征识别。Down-sampling unit 由于双通道进行Concat会使输出通道变为输入通道的2倍,双通道都使用DWConv3降维,提高不同通道之间信息的复用性。ShuffleNet-SE结构如图6所示。3.3.3Xception-SE减少 Xeption 原有残差结构,引入 SE 后形成 Xception-SE,可以在减少参数的同时强化特征纹理。Xception-SE 基于对Inception的充分解耦,从结构上能利用残差结构对样本的深层特征进行检测。Xception-SE将原有12个具有线性残差连接

30、的模块优化至 10 个,减少模型参数,在最后一个Block(Block是Xception基本结构块)之后引入SE,得到特征更加显著的特征图,加强纹理特征识别。Xception-SE结构如图7所示。3.4纹理特征分类检测纹理特征分类检测部分,恶意代码家族及其变种的代码复用性高使得所产生的纹理相似度高,基于代码复用性原理,该检测方式使用灰度图纹理特征值为恶意代码家族及其变种画像,达到分类检测的目的,纹理特征检测过程提高了整个模型的精度和对不同数据集分类的稳定性。纹理特征是从灰度共生矩阵中统计分析恶意代码图像数据的特征,以此描述恶意图像灰度的空间分布情况和反映不同恶意代码家族拥有的不同复杂度。通过灰

31、度共生矩阵,可提取图像的以下纹理特征:1)能量(ASM):表示图像纹理分布均匀程度的纹理特征。当ASM值较小时,说明图像的图像纹理规则,反之不规则。ASM的计算如式(3)所示:ASM=i=1N j=1N(p(i,j)2(3)2)熵(ent):表示图像纹理随机程度的纹理特征。当ent值较大时,图像纹理分布随机程度高,反之随机程度不高。ent的计算如式(4)所示:ent=-i=1N j=1Np(i,j)log(p(i,j)(4)3)逆方差(idm):表示图像纹理局部变化的纹理特征。idm值越大,说明图像纹理局部越均匀,反之局部不够均匀。idm的计算如式(5)所示:idm=i=1N j=1N11+(

32、i-j)2p(i,j)(5)4)相关度(COR):表示图像纹理灰度的相关性特征。当COR 值较大时,图像复杂度较小,反之图像复杂度较高。COR的计算如式(6)所示。COR=1xy|i=1N j=1Nij p(i,j)-xy(6)本文基于图像纹理特征提出分类检测,分类检测过程如图8所示。3.5结果融合结果融合层使用朴素贝叶斯算法作为分类器,以多神经网络分类检测模块和纹理特征检测模块的分类结果作为输入数据,通过贝叶斯分类器分类后输出模型最终的检测结果。如式(7)所示,f1,f2,fn为该样本输入数据中的类别,p(C=c)为类的先验概率,p(Fi=fi|C=c)为类的条件概率。classify(f1

33、,f2,fn)=argmax p(C=c)i=1np(Fi=fi|C=c)(7)类的先验概率即分类器将样本c分类的所有可能性,如式(8)所示,allCategory为输入的类别数量:p(C=ci)=1allCategory(8)类的条件概率使用抽取训练集中每类恶意代码家族的1/3作为生成分类器对每类恶意代码检测的正确概率作为条件概率,如式(9)所示,N为fi分类器判断C类样本总数,f为fi分类器判断C类正确分类样本个数。p(Fi=fi|C=c)=f N(9)4 实验与结果分析 4.1实验环境本次实验环境在 Windows 10 系统环境下进行,硬件配置:AMD Ryzen 5 3600 6-C

34、ore Processor 3.95 GHz,GPU 型号为 NVIDIA GeForce GTX 1660 Ti。软件平台使用 anaconda3编程。语言使用 Python3.8,训练与测试框架为深度学习开源框架PyTorch1.11.0和Sklearn 1.0.2。4.2实验数据集4.2.1malimg数据集malimg数据集包含大约 9 339张灰度图像,代表恶意软件分为 25个家族。样本分布不均衡,即每个家族的样本数量不一样。如图 9 所示,其中包含恶意代码类型为 Worm、PWS、Trojan、TrojanDownloader、Dialer、Rogue、Backdoor。图6Shu

35、ffleNet-SE的结构Fig.6Structure of ShuffleNet-SE图7Xception-SE的结构Fig.7Structure of Xception-SE图8基于纹理特征的分类检测过程Fig.8Classification and detection process based on texture features1530第 5 期蒋瑞林等:基于深度可分离卷积的多神经网络恶意代码检测模型4.2.2MalVis+良性数据集MalVis数据集包含26个恶意代码家族,14 226个恶意代码生成的灰度图像,该数据集由 Hacettepe 大学计算机工程多媒体信息实验室与COM

36、ODO合作收集,如图10所示。其中 包 含 恶 意 代 码 类 型 为 Adware、Virus、Worm、Trojan、Backdoor、HackTool。良 性 数 据 集 由 Kaggle 上 提 供 的Microsoft windows数据集通过Mallook工具转换而来,该数据集包含大约6 313张灰度图像。4.3评价指标本文使用准确率Acc(Accuracy)、精度Pre(Precision)、召回率 Rec(Recall)和 F1 分数 F1(F1-score)作为评估指标。指标定义如下:Acc=(TP+TN)(TP+FP+FN+TN)(10)Pre=TP(TP+FP)(11)R

37、ec=TP(TP+FN)(12)F1=2 Pre Rec(Pre+Rec)(13)其中:真阳性TP(True Positives)和假阳性FP(False Positives)为被正确和错误地归类为恶意的文件样本数;真阴性 TN(True Negatives)和假阴性FN(False Negatives)指被正确和错误地分类为良性的文件样本数。4.4对比实验本文设计3组对照实验,实验数据集按照7 3的比例随机划分为训练集和测试集。第一组纹理特征分类实验将 LGBM 与下列机器学习算法作为对照:支持向量机(SVM)、决策树(DT)、随机森林(RF)和逻辑回归(Logistic Regressio

38、n,LR),以验证本文所提出的图像纹理特征在检测恶意代码上的可行性。第二组使用MalVis数据集+良性程序图像特征集组合的混合数据集,验证本文模型相较于单一模型在不平衡数据集上分类检测结果的稳定性和准确性,而且为了进一步说明本文模型的轻便型,实验中给出了本文模型和对照组的参数量及内存占用量。第三组实验对比本文与相关方法在malimg数据集上的分类检测表现。4.4.1纹理特征检测实验本实验使用malimg数据集作为训练集和测试集,通过灰度共生矩阵(GLCM)获取数据集中图片的纹理特征值:熵、能量、逆方差和相关性作为特征,进行分类对比实验。实验使用机器学习算法:支持向量机(SVM)、决策树(DT)

39、、随机森林(RF)和逻辑回归(LR)与LGBM进行对比实验。实验中LGBM 参数设置为:学习率=0.1,森林模型里树的个数n_estimators=50,LGBM 框架下提升树的类型 boosting_type=gbdt,最 大 树 的 深 度 max_depth=6,树 的 最 大 叶 子 数num_leavel=100。分类算法对比结果如表1所示。由表 1可知,在分类检测上,LGBM 和 RF的准确率都超过 90%,DT、LR 和 SVM 的准确率远低于 LGBM 和 RF。为了进一步验证两个分类器的分类效果,实验增设均方误差(Mean Square Error,MSE)来衡量分类器的过拟

40、合程度。在训练集和测试集上分别为Training MSE和Test MSE,实验结果如表 4所示,RF的 Training MSE 与 Test MSE 差值比 LGBM高3.03,表明RF在纹理特征分类实验中存在过拟合的问题,而LGBM有更好的泛化性。综合上述实验可知,本文所提出的图像纹理特征在检测恶意代码上具有可行性,使用LGBM分类检测方法有更好的检测结果。4.4.2混合数据集对比实验本实验使用MalVis+良性程序的混合数据集作为训练集和测试集,其中MalVis包含26类恶意代码家族及其变种,良性程序数据集包含多种常用类型程序。实验将 AlexNet23、VGG16、ResNet50

41、以 及 模 型 子 模 块(MobileNet-small、SR9malimg数据集样本分布Fig.9Sample distribution of malimg dataset图10MalVis数据集样本分布Fig.10Sample distribution of MalVis dataset表1纹理特征分类实验结果对比单位:%Tab.1Comparison of texture feature classification experimental resultsunit:%算法LGBMRFDTLRSVM准确率92.0492.1189.4877.9069.77精度84.3883.9979.4

42、570.8059.31召回率86.5586.4383.3164.2358.31F1分数84.8784.6180.0877.9156.66表2LGBM与RF算法的均方差对比Tab.2LGBM and RF comparison in MSE算法LGBMRFTraining MSE0.110.00Test MSE4.707.841531第 43 卷计算机应用ShuffleNet-SE 和 Xception-SE)作为对照组,模型采取交叉熵损失函数来衡量真实值与预测值之间的差异,使用224224作为统一输入,Epoch 设置为 50,batchsize 设置为 32,采用Adam优化器对网络进行优化

43、,学习率选用经验值0.005,最终通过激活函数ReLU进行分类。在50次迭代过程中,选取测试集中准确率最高的值为模型的准确率,相应的损失值即为该模型的损失值,分类结果如表3所示。为了更进一步验证模型参数和内存占用,本文使用专业工具torchstat测量各个模型总参数量和内存占用,结果如表4所示。从表3中可以看出,本文恶意代码检测模型的准确率为97.43%。综合表3、4的结果可知,相较于AlexNet模型,本文模型的准确率提高了 14.57 个百分点,但参数规模仅为AlexNet模型的30%,AlexNet模型训练所需内存占用量比本文模型更高;相较于ResNet50模型,本文模型的准确率提高了

44、6.19 个百分点,但参数规模仅为 ResNet50 模型的 68%,ResNet50模型训练所需内存占用量比本文模型更高,在相同内存成本的情况下,本文模型有更高的准确率;相较于VGG16模型,本文模型的准确率提高了2.29个百分点,但参数规模仅为 VGG16 模型的 13%,内存占用率也只有 VGG16的46%,因为深度加深虽然能为VGG16带来更高的准确率,但训练成本高,在准确率相差较小时,本文模型有更小的训练成本。综合表3、4实验结果可得:相较于传统的神经网络模型,本文模型在混合数据集上分类检测结果准确率更高、更稳定、计算成本相对较低。4.4.3相关工作对比本实验将malimg数据集按7

45、 3分为训练集和测试集,该数据集包含25类恶意代码及其变种。相关工作检测结果对比如表5所示。由表5可知,本文模型检测结果的准确率为99.31%,精度、召回率和F1分数指标均超过98%;对比模型分支 MobileNet-small、ShuffleNet-SE 和 Xception-SE 的准确率为 97.77%、98.28%、97.43%,但另外 3 项指标均低于 95%,说明单一的模型不能保证分类结果的稳定性。ResNet50和VGG16的准确率也超过了98%,但精度、召回率和F1分数指标均低于95%。MFF_CNN25是利用图像的多种分辨率作为输入的融合模型,准确率为98.10%,且精度、召

46、回率和F1分数指标均比较稳定。SPP_CNN26通过使用空间金字塔池化原理从神经网络层面强化特征表达,但相较于本文模型准确率低2.21个百分点。AlexNet23和VGGNet24为改善模型,在精度、召回率和F1分数指标上拥有较好表现,但是单一模型的准确率低于本文模型。GLCM+SVM3是机器学习算法改善模型,模型对于图片特征检测能力低于神经网络模型,准确率仅为 93.20%。综合表 5 实验结果可以看出,本文模型在malimg数据集上有更好的检测结果。综合上述三个实验结果可知,本文提出的基于深度可分离卷积多神经网络恶意代码检测模型在恶意代码分类上比传统机器学习算法拥有更高的检测准确率,而且在

47、不同数据集上的分类效果也更稳定。5 结语 本文针对以往基于深度学习的恶意代码检测方法存在的参数量剧增导致成本过高和检测结果不稳定等问题,提出了一种基于深度可分离卷积的多神经网络恶意代码检测模型。模型主要由 MobileNet-small、ShuffleNet-SE 和 Xception-SE三个轻量级神经网络以及基于LGBM图片纹理特征的分类方法组成。本文在研究多神经网络并行的策略上,找到了既能提高准确率同时资源占用率又不高的方案:并行三个基于深度可分离卷积和 SENet通道注意力机制的轻量级神经网络。该方法解决了目前神经网络模型深度和宽度不断扩展造成的常见问题。深度可分离卷积通过逐通道卷积和

48、逐点卷积减少了神经网络需要的参数量和计算量,在特征提取方面SENet通道注意力机制强化了图片特征提高检测效果。研究发现利用图片纹理特征可以为检测模型提供不同特征,特别是针对良性和恶意分类时效果最为明显,该方法也是检测模型在混合数据集中有高准确率表现的原因。实验结果也表明,基于深度可分离卷积多神经网络恶意代码检测模型在检测效率上优于传统深度学习模型。参考文献(References)1 国家计算机网络应急技术处理协调中心(CNCERT/CC).2021年上半年我国互联网网络安全监测数据分析报告EB/OL.2022-03-20.https:/ Computer Network Emergency R

49、esponse Technical Team/Coordination Center of China(CNCERT/CC).First-half year cyberseurity report 2021 of China EB/OL.2022-03-20.https:/ 单位:%Tab.5Comparison of related work results on malimg datasetunit:%模型本文模型MobileNet-smallShuffleNet-SEXception-SEGLCM+SVMResNet50VGG16AlexNetVGGNetMFF_CNNSPP_CNN准确

50、率99.3197.7798.2897.4393.2097.8498.0197.8096.1698.1097.10精度98.5192.4793.8092.2093.4092.7093.1297.8596.1097.9096.80召回率98.1093.0794.4591.8393.0093.0093.7397.5096.5398.0097.10F1分数98.2692.6094.0491.6292.4493.3396.5696.3697.1097.00表3MalVis+良性程序的混合数据集结果对比单位:%Tab.3Results comparison of hybrid dataset of Mal

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服