工器图像分割与识别技术研究.pdf
《工器图像分割与识别技术研究.pdf》由会员分享,可在线阅读,更多相关《工器图像分割与识别技术研究.pdf(5页珍藏版)》请在文库网上搜索。
1、现代电子技术Modern Electronics Technique2023年12月1日第46卷第23期Dec.2023Vol.46 No.230 引 言在水电站机组检修维护期间,发电机风洞内需进出大量工作人员,且携带大量的工器具和检修物资,检修工作过程中因金属物品遗落易造成发电机短路、机组扫膛、机组跳机等不安全事件的发生,故检修作业现场需对进出发电机风洞人员及随身携带物品进行严格登记和销账,由于传统的登记与核销方式效率较低,往往需要耗费大量的时间和人力,且难以保证精确性与实时性12。随着科技的快速发展,图像分割与识别技术已经在各个领域得到了广泛应用,很多学者都曾对其进行了深入的研究,也取得了
2、一些实用性成果38。文献9通过对分水岭基本算法的研究,改进了传统的分水岭算法,减少了图像分割受噪声的影响;文献10针对复杂环境下图像难以分割定位的问题,提出一种基于改进深度学习网络的方法解决难点;文献11基于融合领域特征向量与词向量的方法使识别的向量稀疏特征利用率更高。但上述研究对象却各有不同且对采样数据和硬件算力有苛刻的要求,至于工具方面,目前还没有一种普遍使工器图像分割与识别技术研究方 恒1,张 强1,黄冬梅2,敬光荣2(1.雅砻江流域水电开发有限公司,四川 成都 610000;2.成都万江港利科技股份有限公司,四川 成都 610000)摘 要:针对水电站发电机风洞检修场景下进出风洞登记与
3、核销工具效率低的问题,提出一种基于机器视觉的工具图像分割与识别算法。该算法首先用ToolNet网络对工具图像进行分割,采用基于八度卷积的ToolRSU模块将特征按频率分解,降低模型的空间冗余和计算成本,并且引入了双重注意力模块提升模型的分割精度;然后根据工具分割图像的轮廓对工具目标进行定位,将检测到的工具目标图像输入到预训练好的特征提取器中,将工具信息转换表征为一个512维的特征向量;最后将特征信息与工具特征库进行对比完成工具的识别。实验结果表明,工具图像分割的效率相比U2Net提升了54.47%,并且工具识别算法的识别准确率达到96.78%,检测时间为0.86 s,满足工具实时检测的速度与精
4、度需求,具有较好的应用价值。关键词:检修工具;机器视觉;八度卷积;注意力;图像分割;特征提取器;神经网络;图像识别中图分类号:TN91134;TP311 文献标识码:A 文章编号:1004373X(2023)23006605Research on tool image segmentation and recognition technologyFANG Heng1,ZHANG Qiang1,HUANG Dongmei2,JING Guangrong2(1.Yalong River Hydropower Development Co.,Ltd.,Chengdu 610000,China;2.C
5、hengdu Wanjiang Gangli Technology Co.,Ltd.,Chengdu 610000,China)Abstract:A tool image segmentation and recognition algorithm based on machine vision is proposed to address the low efficiency issue of registration and verification of maintenance tools in the scenario of wind tunnel maintenance of hyd
6、ropower station generators.In the algorithm,the ToolNet network is utilized for tool image segmentation.The ToolRSU module based on octave convolution is employed to decompose features by frequency,so as to reduce spatial redundancy and computational costs.Additionally,a dualattention module is intr
7、oduced to enhance the segmentation accuracy of the model.Subsequently,the tool(the object)are localized based on the contours of the segmented tool images.The detected tool images are then inputted into a pre trained feature extractor,which transforms tool information into a 512 dimensional feature
8、vector.Finally,the feature information is contrasted with the tool feature database to recognize the tool.Experimental results demonstrate that the efficiency of tool image segmentation is improved by 54.47%in comparison with that of U2Net,the tool recognition algorithm achieves a recognition accura
9、cy of 96.78%,and its detection time is 0.86 s,which meets the speed and accuracy requirements of realtime detection of tools.The algorithm exhibits considerable practical value.Keywords:maintenance tool;machine vision;octave convolution;attention;image segmentation;feature extractor;neural network;i
10、mage recognitionDOI:10.16652/j.issn.1004373x.2023.23.012引用格式:方恒,张强,黄冬梅,等.工器图像分割与识别技术研究J.现代电子技术,2023,46(23):6670.收稿日期:20230603 修回日期:202306216666第23期用的方法能够有效解决。本文设计了一种多尺度特征提取卷积模块,卷积过程中将图像分解为低频与高频分量,再采用双重注意力机制处理特征图的高低频分量,并对高频分量和低频分量进行信息交互,通过邻域内像素间的信息交换可以降低低频特征图的空间分辨率和冗余,同时对不同通道间的信息相关性进行建模,保证了工具分割算法的性能,
11、最后通过特征表征的方式完成工具识别任务。该算法针对工具类图像在现场环境使用具有低功耗、易扩展等优点,具有实际应用价值。1 研究方法1.1 工具图像分割算法1.1.1 ToolNet模型结构文献12提出一种深度学习模型UNet语义分割网络模型,它不同于传统的深度卷积神经网络模型采用不断深化卷积结构的方法。UNet网络模型由编码、解码和特征融合三部分组成。在编码过程中,采用多层下采样提取更全面的特征;在解码过程中,采用多层上采样还原特征结果;在特征融合阶段,在全连接编解码过程中生成特征结果和显著概率图。文献13在UNet网络的基础上提出了一个两级嵌套 U 结构模型 U2Net,该网络模型继承了 U
12、Net网络模型的编解码思想,但不再为每个样本使用单个卷积层或反卷积层,而是嵌入完整的 U结构残差块(Residual Ublocks)来替换单个卷积操作,如图 1所示。U结构残差块解决了过去由于使用小卷积核而导致感受野过窄,只能提取局部细节的缺陷。同时,减少了因使用空洞卷积而导致的过度计算问题。U2Net网络模型可以通过设计简单的框架逐层提取多尺度特征,从而提高识别效率。针对工具分割任务提出的ToolNet网络模型如图 2所示。ToolNet由三部分组成:6 层编码层、5 层解码层和全连接层。每层包含一个U形残差块,用于提取多尺度特征。每次训练样本通过一个编码层时,采样的训练样本向下传递,该层
13、的训练结果传递给同级的解码层,计算损失函数。在图像特征提取阶段,使用改进的ToolRSU 模块来提取特征。遍历所有编码层和解码层后,将获得 6个提取结果,这些结果将恢复为与训练样本相同的大小。最后,将所有特征结果聚合到全连接层,将每个解码端的预测结果上采样到原始图像大小,并利用混合注意力机制,通过级联运算得到预测结果。通过不断迭代来减小损失函数的值,提高了模型的识别效果。图1 U结构残差块(RSU)图2 ToolNet模型结构图方 恒,等:工器图像分割与识别技术研究67现代电子技术2023年第46卷1.1.2 ToolRSU模块与一般卷积不同,八度卷积(Octave Convolution)认
14、为卷积层的输入输出特征图或通道具有高频和低频分量。低频分量用于支撑物体的整体形状,但它们往往是多余的,这在编码过程中可以得到缓解。高频分量用于恢复原始图像的边缘和细节纹理。ToolNet设计了一种新的ToolRSU模块,用八度卷积替换 RSU 中的普通卷积,以更好地抵用局部和全局上下文信息来提高分割效果。在八度卷积中,低频分量是指经过高斯滤波处理后得到的特征图,高频分量是指未经高斯滤波的原始特征图。由于低频分量的冗余,低频分量的特征图大小设置为高频分量特征图大小的1 2。将卷积层中的输入特征图X和卷积核W分为高频和低频分量,如下所示:X=XL,XHY=WL,WH(1)式中:XL和XH分别表示特
15、征图的低频和高频分量;WL和WH分别表示用于低频分量和高频分量的卷积核。八度卷积在提取低频和高频特征的同时,在低频和高频分量的特征表示之间进行有效通信,如图3所示。图3 八度卷积以高频和低频进行特征提取由于高频和低频特征图的大小不一致,无法执行卷积操作。因此,为了实现高频和低频特征之间的有效通信,当信息从低频更新到高频(过程WL H)时,需要对低频分量进行上采样,见公式(2):YH=f()XH;WH H+Upsampling()f()XL;WL H,k(2)式 中:f()X;W表 示 具 有 卷 积 核W参 数 的 卷 积;Upsampling()f(),k表示上采样,使用步幅k=2的最近邻插
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 分割 识别 技术研究