改进型深度残差网络在轴承故障诊断中的应用研究.pdf
《改进型深度残差网络在轴承故障诊断中的应用研究.pdf》由会员分享,可在线阅读,更多相关《改进型深度残差网络在轴承故障诊断中的应用研究.pdf(6页珍藏版)》请在文库网上搜索。
1、22 萍乡学院学报 2023 年 第 40 卷第 3 期 萍乡学院学报 2023 年 6 月 Vol.40 NO.3 Journal of Pingxiang University Jun.2023 改进型深度残差网络在轴承故障诊断中的应用研究 韩小棒1,2,孙伦业1(1.安徽理工大学 机械工程学院;2.安徽理工大学 人工智能学院,安徽 淮南 232001)摘 要:残差网络的残差层数过多不能很好地提取轴承振动信号特征,这使得网络模型的故障识别率无法满足工业生产需求。为了解决这一问题,文章提出一种改进型深度残差网络模型进行轴承故障诊断的方法,通过减少网络的残差个数减轻了网络的冗余度;同时,在此网
2、络的基础上添加了注意力机制模块,使得网络更有针对性地提取重要数据特征。然后将一维振动信号转换为二维灰度图,利用网络模型对图片样张进行特征提取并对网络模型进行充足地训练。使用改进后的模型和其他网络模型对同一个振动信号进行故障识别,试验结果表明:改进模型的故障识别准确率相较于原模型和其他网络模型都显著提高。关键词:轴承故障诊断;深度学习;残差网络;注意力机制;二维灰度图 中图法分类号:TH183 文献标志码:A 文章编号:2095-9249(2023)03-0022-06 0 引言 滚动轴承作为一种精密传动零件广泛应用于工业生产中,其结构由内圈、外圈、滚动体部位和保持架组成。由于滚动轴承长期处于高
3、速运转和摩擦状态,极易产生磨损,影响设备运行的稳定性,严重时会导致重大安全事故1。因此,实时监测轴承健康状态,事先采取预防措施显得尤为重要。根据轴承故障出现的位置,可以将轴承故障分为内圈故障、外圈故障,轴承故障,诊断方法主要有人工判别法、短时傅里叶变换、小波包变换、时频域分析等2。应用最广泛的是人工判别法,机器操作师傅通过观察机器运转状态或听机器响动的音色来判断机器的健康状态,这种方法优点是成本较低,但识别率不高。短时傅里叶变换法在分析稳态信号时有着优异的性能,在分析非稳态信号时表现较差。小波包变换可以充分地提取出非稳态信号的数据特征,但对边界信号进行特征提取时表现较差。随着人工智能技术的不断
4、发展,深度学习算法在轴承故障诊断中得到了广泛的应用3,这为上述问题提供了一种更高效的解决方案。许子非等4开发了一种基于多尺度卷积神经网络的故障诊断系统,提升了滚动轴承在变载荷与复杂工况下的诊断准确率。胡若晖等5首先使用 DCGAN 网络对少量的振动信号进行模拟扩充,随后通过 DANN 网络完成多领域的特征提取和适配,实现了在可用样本较少时依然能实现滚动轴承跨域故障诊断。陈月凤6提出了融入注意力机制卷积神经网络的轴承故障诊断方法,在单工况的变工情况下,ATTM-CNN 模型识别准确率比 CNN 模型高 2.94%。瞿红春等7针对滚动轴承工况复杂测得的振动信号信噪比低的特点,提出了一种利用注意力机
5、制构建数字胶囊并与胶囊网络相融合的微弱故障诊断模型。构建初级胶囊时引入双向长短时记忆网络(Bi-LSTM),对时频图中的时序特征进行特征提取,并建立胶囊间的非线性关联。刘权等8针对传统的深度卷积只能生成无监督学习对抗网络(DCGAN)的缺陷,提出一种基于自注意力机制的条件残差生成对抗网络(S-CRGAN)的轴承故障诊断方法,S-CRGAN 在 DCGAN 的基础上与对抗网络(CGAN)相结合并引入标签信息,将深度残差网络(Resnet)引入 DCGAN 中以减缓梯度消失,并在深度残差网络模块中加入自注意力机制来获取全局信息,增强模型的可适性,使模型更加稳定。可以看出利用神经网络对振动信号进行特
6、征提取来进行故障诊断已经取得了很大的进步9。文章设计了一种新的轴承故障诊断网络模型,在残差网络 Resnet-18 的基础上添加了多层注意力机制,同时去除网络结构中冗余部分,使得轴承故障诊断识别率进一步提高。1 卷积神经网络 卷积神经网络(Convolutional Neural Networks,CNN)是由卷积层、池化层、激活函数、全连接层组成。本模型的卷积神经网络结构如图 1 所示。投稿日期:2022-09-27 作者简介:韩小棒(1995),男,安徽阜阳人,硕士研究生,研究方向:轴承故障诊断。第 3 期 韩小棒,孙伦业:改进型深度残差网络在轴承故障诊断中的应用研究 23 图 1 本文所
7、设计的卷积神经网络结构图 1.1 卷积层 卷积层主要负责对数据进行特征提取,它包含多层卷积核,每层卷积核单独对输入的数据进行卷积运算,再将每层卷积核提取到的特征数据进行拼接,卷积层的运算如(1)式所示。1()nnnniiixf wXb+=(1)其中,niw与nib分别为第 n 层的第 i 个卷积核的权重矩阵与偏置矩量;Xn-1为第 n-1 层输出特征;nix为第 n 层第 i 个卷积核卷积后的输出结果。1.2 池化层、激活函数 卷积层通过卷积计算提取出输入数据的特征,但此时的特征数据一般都有很高的维度,对后续网络模型训练造成一定的困难,同时过高的数据维度也会使网络训练出现过拟合,引入池化层可以
8、有效地解决上述问题。为了更好地与原模型 Resnet-18 进行比对,本模型在选取池化方法时同原模型一样选用最大池化层。其运算过程如(2)式所示。()1max()jnk Djniiyxk+=(2)其中,()1jniy+表示经过池化后的第 n+1 层第 i 个特征图中的元素;()nixk为第 n 层第 i 个特征在池化核范围的元素;Dj表示第 j 个池化区域。激活函数对线性数据进行非线性变换,可以解决线性数据难以分类的问题,在残差网络中主要运用ReLU 函数,本模型不对激活函数进行调整。2 改进型残差网络 2.1 注意力机制 注意力机制(Attention Mechanism)可以在网络传播过程
9、中给数据分配不同的权重,这会让数据的相对重要性产生差异化,将需要关注的数据凸显使网络能够自适应地去关注它要提取数据的重点部分10。将注意力机制应用在本模型中达到了优化网络结构同时减轻网络计算负担的目的。本试验主要运用注意力机制中 SENet 模块,通过在主干网络中运用两次 SENet 模块,有针对性地对数据进行特征提取。SENet 的网络结构如图 2 所示。图 2 SENet 的网络结构图 2.2 残差网络 图 3 模型中的残差块 残差网络(Residual Neural Network,Resnet)是一种深度神经网络11。深度神经网络有着复杂的非线性映射结构,相较于浅层神经网络它的非线性表
10、达能力更强,这有利于获取更深维度的数据特征,然而这也会带来梯度消失的问题,引起过拟合。为了解决这一问题同时又保留深度神经网络的特点,He 等12设计了残差网络结构。Resnet 的核心是在深度神经网络中引入012铺展3种状态.输入64x64特征图尺寸32x3216x168x84x42x2残差层1、2残差层3、4残差层5、6残差层7、8残差层9分配权重+stride+stridestrideReLUReLUa 残差块stride+stridestrideReLUReLUstrideb 残差块24 萍乡学院学报 2023 年 残差模块(Residual Building Block,RBB),残差
11、块结构如图 3 所示。残差块将上一层的数据特征直接映射到残差块的下一层,这使得下一层不仅包含经残差非线性变换后的数据特征也包含上一层的数据特征。残差块将神经网络的每一层连接起来,可以有效地避免梯度消失的问题。由于振动信号的非线性特征较强,本实验所使用的网络模型包括 4 个残差块和 5 个残差块。在本试验网络模型主干结构的 2、5、7、9、12 位置上使用残差块,将注意力机制模块加在残差模块的外部,分别放在第 4 层和第 10 层,剩余位置使用残差块。残差网络设计之初主要应用在图像识别领域,图像识别需要很深的网络层数进行大量计算。本模型并不需要使用过多的残差块,只需要一定数量的残差结构配合注意力
12、机制就能在数据特征提取和网络预训练过程中达到很好的效果。优化后的残差网络参数如表 1 所示。表 1 网络结构参数 结构名称 结构参数 输出 尺寸 通道数 预处理层(1,1,0)64x64 4 残差层 1 (1,1,0),(3,2,1),(1,1,0)(1,2,0)32x32 8 残差层 2(1,1,0),(3,2,1),(1,1,0)32x32 8 空间注意力模块 8 残差层 3 (1,1,0),(3,2,1),(1,1,0)(1,2,0)16x16 16 残差层 4(1,1,0),(3,2,1),(1,1,0)16x16 16 残差层 5 (1,1,0),(3,2,1),(1,1,0)(1,
13、2,0)8x8 32 残差层 6(1,1,0),(3,2,1),(1,1,0)8x8 32 残差层 7 (1,1,0),(3,2,1),(1,1,0)(1,2,0)4x4 64 空间注意力模块 64 残差块 8(1,1,0),(3,2,1),(1,1,0)4x4 64 残差块 9 (1,1,0),(3,2,1),(1,1,0)(1,2,0)2x2 128 最大池化层(1,1)128 全连接层 3 2.3 优化后的网络结构 本试验所设计网络模型的故障诊断整体流程如图4 所示。在使用本试验所设计网络模型进行故障诊断之前要先将一维振动信号转换为二维灰度图,再将二维灰度图导入本模型中,对网络模型进行充
14、足地预训练。图 4 改进型轴承故障诊断流程图 3 试验数据集 3.1 数据来源 本文选取渥太华大学轴承故障数据集作为试验数据集,该数据集收集了滚动轴承不同转速时的各种故障信号。包含的故障状态有健康、内圈故障、外圈故障三种类型,数据集的采样频率为 200,000 Hz,每种故障状况的采集时间为 10 s。为了消除轴承处于不同的转速时对试验产生的影响,试验所使用的三组数据是在同一转速范围内测得的数据。轴承处于健康状态的振动信号如图 5 所示。图 5 健康状态的振动信号波形图 3.2 数据增强 使用大量的数据样本训练深度神经网络模型,可轴承振动信号信号预处理训练集测试集网络模型计算损失值与准确率验证
15、模型性能保存训练好的模型是否达到训练次数?优化参数50000100000-0.100-0.050.05振动加速度第i个振动点第 3 期 韩小棒,孙伦业:改进型深度残差网络在轴承故障诊断中的应用研究 25 以提高网络模型的识别率13。为了获取足够多的数据样本,本试验采用重叠采样法对连续的振动信号进行数据分割,数据分割如图 6 所示。图 6 数据增强示意图 每种信号可分割出样本数量 D 的计算公式如(3)式。1LlDm=+(3)由式(3)可大概地推出偏移量的表达式为(4)式。1LlmD=(4)其中:L 表示某种故障状态下振动信号的总长度,l 表示采样样本的长度,m 表示分割样本点的偏移量。*表示对
16、结果进行向下取整运算。3.3 数据的划分 为了保持数据的原始特征,本试验将一维振动信号转换为二维灰度图。按照时间先后顺序将所有振动点包含的数据依次映射到二维灰度图上。所采用二维灰度图的尺寸为 6464,即每次截取 4096 个连续的点来生成二维灰度图。采用重叠采样法生成二维灰度图,根据式(4)算得每次采样步长为 1660 个振动点。轴承的每种状态都得到了 1200 张图片样本,每张图片样本上都包含一个完整振动周期的数据,这样可以保证数据的延续性和完整性。得到的二维灰度图如图 7 所示。图 7 三种故障状态所得到的二维灰度图 本试验每组按照 80%划分给训练集,20%划分给验证集的原则对图片样张
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 改进型 深度 网络 轴承 故障诊断 中的 应用 研究