改进型深度残差网络在轴承故障诊断中的应用研究.pdf

上传人：爱文献爱资料

文档编号：21773087

上传时间：2024-04-28

格式：PDF

页数：6

大小：736.24KB

《改进型深度残差网络在轴承故障诊断中的应用研究.pdf》由会员分享，可在线阅读，更多相关《改进型深度残差网络在轴承故障诊断中的应用研究.pdf（6页珍藏版）》请在文库网上搜索。

1、22 萍乡学院学报 2023 年第 40 卷第 3 期萍乡学院学报 2023 年 6 月 Vol.40 NO.3 Journal of Pingxiang University Jun.2023 改进型深度残差网络在轴承故障诊断中的应用研究韩小棒1,2，孙伦业1（1.安徽理工大学机械工程学院；2.安徽理工大学人工智能学院，安徽淮南 232001）摘要：残差网络的残差层数过多不能很好地提取轴承振动信号特征，这使得网络模型的故障识别率无法满足工业生产需求。为了解决这一问题，文章提出一种改进型深度残差网络模型进行轴承故障诊断的方法，通过减少网络的残差个数减轻了网络的冗余度；同时，在此网

2、络的基础上添加了注意力机制模块，使得网络更有针对性地提取重要数据特征。然后将一维振动信号转换为二维灰度图，利用网络模型对图片样张进行特征提取并对网络模型进行充足地训练。使用改进后的模型和其他网络模型对同一个振动信号进行故障识别，试验结果表明：改进模型的故障识别准确率相较于原模型和其他网络模型都显著提高。关键词：轴承故障诊断；深度学习；残差网络；注意力机制；二维灰度图中图法分类号：TH183 文献标志码：A 文章编号：2095-9249（2023）03-0022-06 0 引言滚动轴承作为一种精密传动零件广泛应用于工业生产中，其结构由内圈、外圈、滚动体部位和保持架组成。由于滚动轴承长期处于高

3、速运转和摩擦状态，极易产生磨损，影响设备运行的稳定性，严重时会导致重大安全事故1。因此，实时监测轴承健康状态，事先采取预防措施显得尤为重要。根据轴承故障出现的位置，可以将轴承故障分为内圈故障、外圈故障，轴承故障，诊断方法主要有人工判别法、短时傅里叶变换、小波包变换、时频域分析等2。应用最广泛的是人工判别法，机器操作师傅通过观察机器运转状态或听机器响动的音色来判断机器的健康状态，这种方法优点是成本较低，但识别率不高。短时傅里叶变换法在分析稳态信号时有着优异的性能，在分析非稳态信号时表现较差。小波包变换可以充分地提取出非稳态信号的数据特征，但对边界信号进行特征提取时表现较差。随着人工智能技术的不断

4、发展，深度学习算法在轴承故障诊断中得到了广泛的应用3，这为上述问题提供了一种更高效的解决方案。许子非等4开发了一种基于多尺度卷积神经网络的故障诊断系统，提升了滚动轴承在变载荷与复杂工况下的诊断准确率。胡若晖等5首先使用 DCGAN 网络对少量的振动信号进行模拟扩充，随后通过 DANN 网络完成多领域的特征提取和适配，实现了在可用样本较少时依然能实现滚动轴承跨域故障诊断。陈月凤6提出了融入注意力机制卷积神经网络的轴承故障诊断方法，在单工况的变工情况下，ATTM-CNN 模型识别准确率比 CNN 模型高 2.94%。瞿红春等7针对滚动轴承工况复杂测得的振动信号信噪比低的特点，提出了一种利用注意力机

5、制构建数字胶囊并与胶囊网络相融合的微弱故障诊断模型。构建初级胶囊时引入双向长短时记忆网络(Bi-LSTM)，对时频图中的时序特征进行特征提取，并建立胶囊间的非线性关联。刘权等8针对传统的深度卷积只能生成无监督学习对抗网络(DCGAN)的缺陷，提出一种基于自注意力机制的条件残差生成对抗网络(S-CRGAN)的轴承故障诊断方法，S-CRGAN 在 DCGAN 的基础上与对抗网络(CGAN)相结合并引入标签信息，将深度残差网络(Resnet)引入 DCGAN 中以减缓梯度消失，并在深度残差网络模块中加入自注意力机制来获取全局信息，增强模型的可适性，使模型更加稳定。可以看出利用神经网络对振动信号进行特

6、征提取来进行故障诊断已经取得了很大的进步9。文章设计了一种新的轴承故障诊断网络模型，在残差网络 Resnet-18 的基础上添加了多层注意力机制，同时去除网络结构中冗余部分，使得轴承故障诊断识别率进一步提高。1 卷积神经网络卷积神经网络(Convolutional Neural Networks,CNN)是由卷积层、池化层、激活函数、全连接层组成。本模型的卷积神经网络结构如图 1 所示。投稿日期：2022-09-27 作者简介：韩小棒（1995），男，安徽阜阳人，硕士研究生，研究方向：轴承故障诊断。第 3 期韩小棒，孙伦业：改进型深度残差网络在轴承故障诊断中的应用研究 23 图 1 本文所

7、设计的卷积神经网络结构图 1.1 卷积层卷积层主要负责对数据进行特征提取，它包含多层卷积核，每层卷积核单独对输入的数据进行卷积运算，再将每层卷积核提取到的特征数据进行拼接，卷积层的运算如(1)式所示。1()nnnniiixf wXb+=(1)其中，niw与nib分别为第 n 层的第 i 个卷积核的权重矩阵与偏置矩量；Xn-1为第 n-1 层输出特征；nix为第 n 层第 i 个卷积核卷积后的输出结果。1.2 池化层、激活函数卷积层通过卷积计算提取出输入数据的特征，但此时的特征数据一般都有很高的维度，对后续网络模型训练造成一定的困难，同时过高的数据维度也会使网络训练出现过拟合，引入池化层可以

8、有效地解决上述问题。为了更好地与原模型 Resnet-18 进行比对，本模型在选取池化方法时同原模型一样选用最大池化层。其运算过程如(2)式所示。()1max()jnk Djniiyxk+=(2)其中，()1jniy+表示经过池化后的第 n+1 层第 i 个特征图中的元素；()nixk为第 n 层第 i 个特征在池化核范围的元素；Dj表示第 j 个池化区域。激活函数对线性数据进行非线性变换，可以解决线性数据难以分类的问题，在残差网络中主要运用ReLU 函数，本模型不对激活函数进行调整。2 改进型残差网络 2.1 注意力机制注意力机制(Attention Mechanism)可以在网络传播过程

9、中给数据分配不同的权重，这会让数据的相对重要性产生差异化，将需要关注的数据凸显使网络能够自适应地去关注它要提取数据的重点部分10。将注意力机制应用在本模型中达到了优化网络结构同时减轻网络计算负担的目的。本试验主要运用注意力机制中 SENet 模块，通过在主干网络中运用两次 SENet 模块，有针对性地对数据进行特征提取。SENet 的网络结构如图 2 所示。图 2 SENet 的网络结构图 2.2 残差网络图 3 模型中的残差块残差网络(Residual Neural Network,Resnet)是一种深度神经网络11。深度神经网络有着复杂的非线性映射结构，相较于浅层神经网络它的非线性表

10、达能力更强，这有利于获取更深维度的数据特征，然而这也会带来梯度消失的问题，引起过拟合。为了解决这一问题同时又保留深度神经网络的特点，He 等12设计了残差网络结构。Resnet 的核心是在深度神经网络中引入012铺展3种状态.输入64x64特征图尺寸32x3216x168x84x42x2残差层1、2残差层3、4残差层5、6残差层7、8残差层9分配权重+stride+stridestrideReLUReLUa 残差块stride+stridestrideReLUReLUstrideb 残差块24 萍乡学院学报 2023 年残差模块(Residual Building Block,RBB)，残差

11、块结构如图 3 所示。残差块将上一层的数据特征直接映射到残差块的下一层，这使得下一层不仅包含经残差非线性变换后的数据特征也包含上一层的数据特征。残差块将神经网络的每一层连接起来，可以有效地避免梯度消失的问题。由于振动信号的非线性特征较强，本实验所使用的网络模型包括 4 个残差块和 5 个残差块。在本试验网络模型主干结构的 2、5、7、9、12 位置上使用残差块，将注意力机制模块加在残差模块的外部，分别放在第 4 层和第 10 层，剩余位置使用残差块。残差网络设计之初主要应用在图像识别领域，图像识别需要很深的网络层数进行大量计算。本模型并不需要使用过多的残差块，只需要一定数量的残差结构配合注意力

12、机制就能在数据特征提取和网络预训练过程中达到很好的效果。优化后的残差网络参数如表 1 所示。表 1 网络结构参数结构名称结构参数输出尺寸通道数预处理层(1,1,0)64x64 4 残差层 1 (1,1,0),(3,2,1),(1,1,0)(1,2,0)32x32 8 残差层 2(1,1,0),(3,2,1),(1,1,0)32x32 8 空间注意力模块 8 残差层 3 (1,1,0),(3,2,1),(1,1,0)(1,2,0)16x16 16 残差层 4(1,1,0),(3,2,1),(1,1,0)16x16 16 残差层 5 (1,1,0),(3,2,1),(1,1,0)(1,

13、2,0)8x8 32 残差层 6(1,1,0),(3,2,1),(1,1,0)8x8 32 残差层 7 (1,1,0),(3,2,1),(1,1,0)(1,2,0)4x4 64 空间注意力模块 64 残差块 8(1,1,0),(3,2,1),(1,1,0)4x4 64 残差块 9 (1,1,0),(3,2,1),(1,1,0)(1,2,0)2x2 128 最大池化层(1,1)128 全连接层 3 2.3 优化后的网络结构本试验所设计网络模型的故障诊断整体流程如图4 所示。在使用本试验所设计网络模型进行故障诊断之前要先将一维振动信号转换为二维灰度图，再将二维灰度图导入本模型中，对网络模型进行充

14、足地预训练。图 4 改进型轴承故障诊断流程图 3 试验数据集 3.1 数据来源本文选取渥太华大学轴承故障数据集作为试验数据集，该数据集收集了滚动轴承不同转速时的各种故障信号。包含的故障状态有健康、内圈故障、外圈故障三种类型，数据集的采样频率为 200,000 Hz，每种故障状况的采集时间为 10 s。为了消除轴承处于不同的转速时对试验产生的影响，试验所使用的三组数据是在同一转速范围内测得的数据。轴承处于健康状态的振动信号如图 5 所示。图 5 健康状态的振动信号波形图 3.2 数据增强使用大量的数据样本训练深度神经网络模型，可轴承振动信号信号预处理训练集测试集网络模型计算损失值与准确率验证

15、模型性能保存训练好的模型是否达到训练次数?优化参数50000100000-0.100-0.050.05振动加速度第i个振动点第 3 期韩小棒，孙伦业：改进型深度残差网络在轴承故障诊断中的应用研究 25 以提高网络模型的识别率13。为了获取足够多的数据样本，本试验采用重叠采样法对连续的振动信号进行数据分割，数据分割如图 6 所示。图 6 数据增强示意图每种信号可分割出样本数量 D 的计算公式如(3)式。1LlDm=+(3)由式(3)可大概地推出偏移量的表达式为(4)式。1LlmD=(4)其中：L 表示某种故障状态下振动信号的总长度，l 表示采样样本的长度，m 表示分割样本点的偏移量。*表示对

16、结果进行向下取整运算。3.3 数据的划分为了保持数据的原始特征，本试验将一维振动信号转换为二维灰度图。按照时间先后顺序将所有振动点包含的数据依次映射到二维灰度图上。所采用二维灰度图的尺寸为 6464，即每次截取 4096 个连续的点来生成二维灰度图。采用重叠采样法生成二维灰度图，根据式(4)算得每次采样步长为 1660 个振动点。轴承的每种状态都得到了 1200 张图片样本，每张图片样本上都包含一个完整振动周期的数据，这样可以保证数据的延续性和完整性。得到的二维灰度图如图 7 所示。图 7 三种故障状态所得到的二维灰度图本试验每组按照 80%划分给训练集，20%划分给验证集的原则对图片样张

17、进行划分，图片样张分配数量如表 2 所示。表 2 数据集划分健康类型标签号总样张(张)训练集(张)测试集(张)健康状态 0 1200 960 240 内圈故障 1 1200 960 240 外圈故障 2 1200 960 240 4 试验验证 4.1 试验结果本试验将学习率设置为 0.01。在模型训练过程中模型正确率和损失值的变化趋势如图 8 所示。由图 8 可以看出，在 epoch 迭代到第 20 轮时模型的准确率开始收敛于 1，模型损失值收敛于 0.008，说明本模型的泛化能力较强，没有出现过拟合现象。图 8 测试集的损失函数值和识别准确率 4.2 探究数据特征提取过程在神经网络

18、传播的过程中 t-SNE 算法14可以将网络中每一层的高维特征数据映射到二维平面上，实现了高维数据的可视化。利用 t-SNE 算法对本模型的部分残差层和全连接层进行特征可视化，如图 9 所示。在神经网络向着深层网络传播的过程中，具有相同特征的数据逐步聚拢在一起，庞杂的数据被很好地区分开，这说明本模型在振动信号特征提取与数据分析上有着较好的能力。图 9 t-SNE 降维可视化截取样本1截取样本2偏移量内圈故障健康状态外圈故障020400.00.20.40.60.81.0识别正确率和损失函数值迭代次数损失值准确率残差层1残差层3残差层5残差层7全连接层残差层626 萍乡学院学报 2023 年

19、 4.3 其他模型横向对比试验混淆矩阵可以直观地观察网络模型对轴承健康状况的识别情况，在本试验所选用的网络模型中引入混淆矩阵进行分析，验证集中三种轴承故障状态的识别结果如图 10 所示。通过对比观察可知，在本模型中有 2 个健康状态的二维灰度图被误判为外圈故障远少于其他模型误判个数，内圈故障全部判别正确，外圈故障误判的样张个数也少于其他模型。其余三种模型中误判数据与真实数据的偏离程度都比本模型的偏离程度要大，比如在 Vgg-16 模型中共计误判 24 张图片，三种状态的二维灰度图被误判的张数分别为 5、7、12 张，多于本模型。这说明本模型无论是总体识别率还是针对具体某一种轴承故障状态的识别

20、率都要高于其他网络模型。图 10 预测结果混淆矩阵图为了验证本试验所设计模型在轴承故障诊断中优异的性能，试验选取了 Resnet-18、Vgg-16、Svm 算法模型与本模型做横向对比。同时也注意到在一维数据映射到二维图上时虽没有改变数据的时间维度，但在提取数据特征进行卷积运算时破坏了时间维度，为了探究在时间维度被破坏的情况下本模型是否还能高效地提取振动信号特征，本试验使用 Resnet-1D 模型提取一维信号数据特征作为对比试验，综合试验结果如表 3 所示。可以看出，本模型的轴承故障识别率均高于其他几种算法模型，达到了 98.25%。值得注意的是对比 Resnet-18本模型的故障识别率提

21、高了 3.9%，使用 Resnet-1D 对一维信号进行故障诊断的识别率也没有本模型的识别率高，这说明网络模型得到了进一步的优化。通过对试验结果分析可知，本试验所设计的网络模型可有效地应用在轴承故障诊断中，轴承故障的识别率相较于其他网络模型进一步提高。表 3 不同模型的故障识别率模型名称故障识别准确率(%)Resnet-1D Vgg-16 95.24 96.73 Svm 96.78 Resnet-18 94.35 本模型 98.25 5 结论文章设计了一种新的网络模型进行轴承故障诊断，相比于传统的轴承故障诊断方法有着优异的诊断性能。1)通过深度神经网络来进行轴承故障诊断，大幅地省去了人力

22、提取数据特征的步骤，节约了人力成本，实现了机械故障诊断的智能化。2)将一维信号转换为二维灰度图，很好地保留了原始振动信号的数据特征，生成了适合残差网络读取的数据，实现了将深度神经网络与轴承故障诊断的优化组合。3)在深层网络中引入注意力机制可以强化重要数据的特征，弱化相对冗余的数据，使得网络结构更加合理。优化后的网络结构相比原网络结构和其他网络结构有着更高的故障识别率。参考文献 1 裴洪,胡昌华,司小胜,等.基于机器学习的设备剩余寿命预测方法综述J.机械工程学报,2019,55(8):113.2 SAMANTA.Use of time domain features for the neu

23、ral network based fault diagnosis of a machine tool coolant systemJ.Proceedings of the Institution of Mechanical Engineers,Part I:Journal of Systems and Control Engineering.2001,215(3):199207.3 雷亚国,贾峰.大数据下机械智能故障诊断的机遇与挑战J.机械工程学报,2018,54(5):94104.4 许子非,金江涛,李春.基于多尺度卷积神经网络的滚动轴承故障诊断方法J.振动与冲击,2021,40(18):

24、212220.5 胡若晖,张敏,许文鑫.基于 DCGAN 和 DANN 网络的滚动轴承跨域故障诊断J.振动与冲击,2022,41(6):2129.6 陈月凤.轴承变工况故障的深度学习网络诊断研究J.机械设计与制造,2022(12):172176+180.7 瞿红春,朱伟华,高鹏宇,等.基于注意力循环胶囊网络238240230020046050100150200健康健康内圈外圈内圈外圈本模型235233228503439050100150200健康健康内圈外圈内圈外圈Vgg-16235235227053249050100150200健康健康内圈外圈内圈外圈Svm22922922174568110

25、50100150200健康健康内圈外圈内圈外圈Resnet-18第 3 期韩小棒，孙伦业：改进型深度残差网络在轴承故障诊断中的应用研究 27 的滚动轴承故障诊断J.振动测试与诊断,2022,42(6):11081114+12421243.8 刘权,裴未迟.基于自注意力机制条件残差生成对抗网络的滚动轴承故障诊断J.轴承,2022,516(11):6875.9 HU J,SHEN L,SUN G.Squeeze-and-excitation networksC/Proceedings of the IEEE conference on computer vision and pattern re

26、cognition.2018:71327141.10 KAIMING HE,XIANGYU ZHANG.Identity Mappings in Deep Residual NetworksJ.Journal of Computing research repository,2016,137(17):630645.11 KAIMING HE,XIANGYU ZHANG.Deep Residual Learning for Image RecognitionC.Proceedings of the IEEE Conference on Computer Vision and Pattern Re

27、cognition.2016.12 HUANG H,BADDOUR N.Bearing vibration data collected under time-varying rotational speed conditions.J.Journal of Sound and Vibration,2018(21):17451749.13 ZHIBIN ZHAO,TIANFU LI.Deep learning algorithms for rotating machinery intelligent diagnosis:An open source benchmark studyJ.Journa

28、l of Instrumentation Systems and Automation,2020,107(3):224225.14 VAN D M L,HINTON G.Visualizing data using t-SNEJ.Journal of Machine Learning Research,2008,9:25792605.责任编校：陈楠楠 Research of Improved Deep Residual Network in Bearing Fault Diagnosis HAN Xiao-bang1,2，SUN Lun-ye1(1.School of Mechanical E

29、ngineering,Anhui University of Science and Technology,Huainan Anhui 232001,China;2.School of Artificial Intelligence,Anhui University of Science and Technology,Huainan Anhui 232001,China)Abstract:The excessive number of residual layers in the residual network makes it unable to extract the bearing v

30、ibration signal very well and the fault identification rate of the network model is too low to meet the needs of industrial production.This paper proposes the method of improved network model applied in bearing fault diagnosis.By reducing the number of residual of the network,the redundancy of the n

31、etwork is reduced.On the other hand,the attention mechanism is added to this network,which makes the network more targeted to extract important data features.After that,the one-dimensional vibration signal is converted into two-dimensional gray scale map,and then the image sample is imported into th

32、e model for processing.Fault identification of the same vibration signal was performed using the improved model and other network models.Experimental results show that the fault recognition accuracy of the improved model is significantly improved compared with the original model and other network models.Key words:bearing fault diagnosis;deep learning;residual network;attention mechanism;two-dimensional gray scale graph