文库网
ImageVerifierCode 换一换
首页 文库网 > 资源分类 > PDF文档下载
分享到微信 分享到微博 分享到QQ空间

基于关键点位特征对中药材产地的高效鉴别研究_陈培辉.pdf

  • 资源ID:13944336       资源大小:1.65MB        全文页数:5页
  • 资源格式: PDF        下载积分:10文币
微信登录下载
快捷下载 游客一键下载
账号登录下载
三方登录下载: QQ登录 微博登录
二维码
扫码关注公众号登录
下载资源需要10文币
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 
账号:
密码:
验证码:   换一换
  忘记密码?
    
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

基于关键点位特征对中药材产地的高效鉴别研究_陈培辉.pdf

1、SOFTWARE软 件2023第 44 卷 第 1 期2023 年Vol.44,No.1基金项目:2022 年度汕尾职业技术学院校级科研课题“基于关键特征的降维技术应用研究”(SWKT22-009);2022 年广东省普通高校青年创新人才类项目“高水平专业群背景下基于数学建模对学习力机制的研究”(2022KQNCX249);2020 年度广东省普通高校创新团队项目(2020KCXTD045);2020 年度广东省高职院校高水平专业群建设项目(GSPZYQ2020076);2022 年度广东省普通高校重点科研平台和项目“智能制造执行系统(MES)单元管控及自动化应用研发产教融合创新平台”;202

2、1 年度广东省普通高校重点领域专项(新一代信息技术)项目(2021ZDZX1101);2021 年度广东省教育科学规划课题(高等教育专项)项目(2021GXJK515)作者简介:陈培辉(1991),硕士,助教,研究方向:机器学习、模式识别、关系分类。基于关键点位特征对中药材产地的高效鉴别研究陈培辉 彭强 吴志锐 郑东荣(汕尾职业技术学院工程学院,广东汕尾 516600)摘要:特征降维能够有效地消除无关和冗余的数据,有效提升模型效率。然而,现有的降维技术对于一些特定领域下的高维数据并不适用。本文针对中药材的产地鉴别这一特定领域问题,提出了一种基于关键点位特征的降维技术方法,结合Matlab 分类

3、工具箱开展模式识别应用研究。通过与 PCA、NMF 等降维方法进行对比,实验结果表明,本文提出的降维方法能更好地提升中药材产地鉴别模型的效率和精度。关键词:降维;关键点位;模式识别;Matlab 分类工具箱中图分类号:TP391.4 文献标识码:A DOI:10.3969/j.issn.1003-6970.2023.01.016本文著录格式:陈培辉,彭强,吴志锐,等.基于关键点位特征对中药材产地的高效鉴别研究J.软件,2023,44(01):062-065+088Research on the Efficient Identification of the Origin of Chinese

4、Medicinal Materials Based on the Characteristics of Key PointsCHEN Peihui,PENG Qiang,WU Zhirui,ZHENG Dongrong(School of Engineering,Shanwei Vocational and Technical College,Shanwei Guangdong 516600)【Abstract】:Feature dimensionality reduction can effectively eliminate irrelevant and redundant data an

5、d effectively improve model efficiency.However,the existing dimensionality reduction techniques are not suitable for high-dimensional data in some specific fields.Aiming at the specific field of identification of the origin of Chinese medicinal materials,this paper proposes a dimensionality reductio

6、n technology method based on the characteristics of the key points,and combines Matlab classification toolbox to carry out pattern recognition research.Compared with PCA,NMF and other dimensionality reduction methods,the experimental results shows that the dimensionality reduction method proposed in

7、 this paper can better improve the efficiency and accuracy of the origin identification model of Chinese medicinal materials.【Key words】:dimensionality reduction;key points;pattern recognition;Matlab classification toolbox基金项目论文0 引言降维技术是数据挖掘领域一大重要研究方向,有效地改善了“维数灾难”这一问题,提高了机器学习的效率1-3。然而,当前通用的降维技术方法,对于

8、某些特定领域下的高维数据问题,降维效果并不显著,模型应用效果较差4。在中药材这一特定领域,其道地性以产地为主要目标,产地的鉴别对于药材品质鉴别尤为重要。由于不同中药材的近、中红外光谱数据存在高维度、高耦合的问题,使得光谱鉴别的误差较大,常规降维技术并不能有效改善鉴别质量5,6。本文主要针对中药材的产地鉴别问题,基于中药材的红外光谱数据,提出了一种基于关键点位特征的降维方法,结合 Matlab分类工具箱开展中药材产地的模式识别应用研究7,8。结果表明,在处理中药材产地这一特定领域的分类问题63陈培辉彭强吴志锐等:基于关键点位特征对中药材产地的高效鉴别研究上,本文提出的基于关键点位特征的降维方法效

9、果显著,有效提升了模型的鉴别效率和精度。1 准备工作1.1 数据准备本文以 2021 年高教社杯全国大学生数学建模竞赛E 题“中药材鉴别”中的附件作为研究数据,开展中药材产地的高效鉴别应用研究5。该附件数据,主要包含中红外光谱(波段区域:552cm-13999cm-1)和近红外光谱(波段区域:4004cm-110000cm-1),该数据存在以下特点:(1)数据量大,波段长,特征多;(2)部分光谱存在耦合现象,冗余度高。若直接使用该光谱数据鉴别药材产地,需耗费较大的计算资源,会导致模型复杂度高、效率较低,不符合实际应用场景,因此需通过降维手段对数据预处理。现有的 PCA9、NMF10降维算法提取

10、主成分,会导致中药材光谱数据中某些重要特征的缺失,在模型鉴别效率和精度上都无法达到最优。1.2 模型框架针对上述情况,本文提出了一种关键点位降维应用于中药材产地的高效鉴别方法,鉴别框架如图 1 所示。首先,对于中药材的中、近红外光谱数据进行低方差过滤,减少对模型训练有负面影响的特征;其次,选择标准差差值较大的波动区间进行特征选点,获取信息量较大的特征点位;最后,使用支持向量机进行单模型和融合模型训练,实现中药材产地的高效鉴别。2 实验设计在实验设计上,本文分为 4 个部分,首先是将波数区域选择与点位提取进行模型效率和精度对比,证明关键点位的高效性;其次是将关键点位降维方法与 PCA、NMF 等

11、现有的降维方法进行对比,证明关键点位的有效性;接着是利用方差分析对关键点位降维进行有效性分析;最后是开展单模型和融合模型的对比实验。2.1 波数区域选择与点位提取如图 2 所示是本文基于波数区域选择及其位点提取的流程框架图,其最后结果确定了波数区域选择与位点提取方案的可行性,同时证明了少数关键特征点位的降维方案对中药材产地分类模型的建立有更好的效果。在这里,就中红外光谱曲线为例做波数区域分析及关键点位提取,分别作如下两个对比实验。分类模型建立效果所有光谱曲线少数点位部分点位所有点位第二次实验结果第一次对比实验最佳提取提取少数波数区域部分波数区域全波数区域筛选过滤图 2 光谱的波数区域选择与点位

12、提取流程Fig.2 Wavenumber region selection and point extraction process of spectrum实验 1:全波数区域 VS 部分波数区域。中药材的红外光谱曲线的各波数区域的方差、标准差在一定程度上均能反映各波数区域的信息量,方差可表示一个波数区域中某个特征的发散程度,方差太小意味着特征值很稳定,说明不同药材在这个特征上基本无差异,即这个特征对药材的分类来说没有区分价值。因此,本文先采用过滤法将光谱曲线所有位点中方差最小的位点进行过滤,如图 3 所示可以得到 3346 个位点,接着将 3346个位点所在的标准差相对较小、质量较差的波数区

13、域进行初步处理,得到 2579 个位点及其所在波数区域,从如图 3、图 4 所示的观察中可以看到,由 2579 个位点组成的波数区域所保留的信息量与 3346 个位点组成的波数区域所保留的信息量仅有较小的差异。使用 Matlab 分类工具箱中所有的分类模型分别对其进行训练,在并行模式下,以模型选举的方式,同时设置十折交叉验证避免模型过拟合,从第一个模型训练开始,到最后一个模型训练结束的时间作为本次训练总时长,以最高模型精确度作为本次实验的效率评价指标。拼接波数区域选择近红外光谱点位提取-近红外点位提取-中红外产地未知产地已知产地已知产地已知模型A模型C选举预测预测波数区域选择中红外光谱模型B分

14、类模型图 1 结合关键点位降维对中药材产地的鉴别框架Fig.1 Identification framework of Chinese medicinal materials origin combined with dimensionality reduction of key points64软 件第 44 卷 第 1 期SOFTWARE结论 1:经过初次波数区域选择得到的 2579 个位点及其波数区域在模型精确度上比 3346 个位点组成的波数区域在模型精确度上高了 2.5%,说明被过滤掉的位点在一定程度上对分类模型的建立具有负反馈作用,因此本次实验能初步证明波数区域选择的可行性。实验

15、2:关键点位特征的提取及其应用。在第一次实验中点位的过滤对模型的准确度、模型训练效率有一定的提高,但其训练总时长不符合实际应用场景,如表 1所示。因此,对图 3 中 2579 个位点的波数区域(红色曲线)进行分析评估,从中可观察到,2579 个位点中还存在着较多标准差相对较小的波数区域,需要再次对其进行处理,首先剔除掉标准差较低的波数区域,再重新对各个波数区域的标准差值进行观测评估,剔除质量差的波数区域,结果选出了质量较好的 20 个波数区域,最后采用极值法从这 20 个波数区域中选出 20 个特征值作为中药材中红外光谱曲线的特征位点,如图 5 所示。表 1 中红外光谱波段区域与位点方案的模型

16、性能对比Tab.1 Comparison of model performance between mid-infrared spectral band region and site scheme位点数Model accuracyTIME(s)3348(原始位点)80.0%1200334681.2%1045257983.7%10302095.1%25Std:中红外光谱数据 2579点位_20点位提取2579个点位20个点位吸光度(AU)标准差0.000.080.060.040.02波数(cm-1)4008001200 1600 2000 2400 2800 3200 36004000图 5

17、中红外光谱的 20 个特征点位Fig.5 20 feature points in the middle infrared spectrum结论 2:与实验 1 保持一致的实验参数设置,在实验 1 波段区域的基础上,进一步验证了关键点位提取特征的可行性和高效性,相比较于原始位点,训练总时长缩短整整 48 倍,模型计算复杂度大幅减少,模型性能得到大幅提升。2.2 点位法与其他降维方法的效率对比每种数据降维算法原理不同,就 PCA 而言,会重新生成新的成分且新的成分与原有的成分不一样。同理,同一种数据降维算法很难适用于所有场景下的模型训练,进而导致模型效率不高。因此,对于不同的应用场景,选择适合的

18、降维方法将更有利于建立高效的模型。为了进一步证明本文提出的降维方法在中药材光谱数据这一特定领域的有效性,将通过与 PCA、NMF 进行横向对比,从效率和精度上对比分析不同降维方法对于模型的性能影响,如表 2 所示。基于上述实验结果,可知关键点位降维方法相比于PCA、NMF 在性能表现上更优,同等模型时耗下的精度达到了 95.1%,优于 PCA 的 89%和 NMF 的 91%,有助于高效、快速地鉴别中药材产地。吸光度(AU)标准差Std:中红外光谱数据 3346位点VS 2579位点3346个位点2579个位点波数(cm-1)400 800 12001600200024002800320036

19、0040000.000.080.060.040.02图 3 中红外全光谱与部分波段的信息量对比图Fig.3 Comparison of information content between full spectrum and partial band of mid-infraredEfficiency:3346个位点_2579个位点81.2%1045s83.7%1035s模型精确度/总训练时长25793346位点数总训练时长(单位:s)模型精确度*1000+100图 4 中红外全光谱与部分波段的总训练时长、模型精确度对比图 Fig.4 Comparison of total training

20、 duration and model accuracy between full spectrum and partial band of mid-infrared65陈培辉彭强吴志锐等:基于关键点位特征对中药材产地的高效鉴别研究表 2 不同降维方法的模型性能对比Tab.2 Comparison of model performance of different dimensionality reduction methods降维方法Model accuracyTIME(s)无降维81.2%1045PCA 算法(20 个特征)89%25NMF 算法(20 个特征)91%26点位法(20 个特

21、征)95.1%252.3 关键点位法的有效性分析为了进一步证明关键点位降维方法的有效性,本文利用方差对基于关键点位法提取的特征与原光谱曲线特征的信息保留性做对比分析,验证关键点位法的有效性。统计学中,方差用来计算每一个变量与总体均数之间的差异。在中药材光谱数据中,往往均数难以得到,因此应用样本统计量代替总体参数,样本方差计算公式如下所示:22()1XXSn=S2为样本方差,X 为变量,X为样本均值,n 为样本数,本题中药材样本数 n 1,2,242(其中有 3 个异常样本分别为 No.64、136、201)。通过随机抽取若干同种产地的不同中药材样本,基于统计学方差对完整光谱数据与基于关键点位提

22、取后的数据进行统计分析,得到 3 组随机实验结果,如表 3 所示。可知:信息保留量基本一致,基于关键点位特征的降维方法是科学、有效的。2.4 近、中红外的融合实验 上述实验证明了基于波数区域选择与关键点位的降维方法的有效性,考虑到上述实验主要是利用中红外光谱数据,最高鉴别精度达到了 95.1%,但在实际应用中仍有较大的错误率。为了进一步提升鉴别性能,本文设计了近、中红外的互相验证的融合实验,通过将近红外与中红外的特征进行拼接,得到信息量更大的融合特征,实验结果如图 6 所示。由结果可知:采用单一近红外(20 个特征点)、中红外光谱(20 个特征点)的数据建立的鉴别模型均未能达预期效果,近、中红

23、外的融合特征(30 个特征点)能够更有效地提升模型的鉴别性能,精度达到 98.5%。对比近、中红外全光谱数据(共 9444 位点)与经过关键点位降维的近、中红外光谱数据(30 个位点)的模型性能,结果如表 4 所示。表 4 融合实验的性能对比Tab.4 Performance comparison of fusion experiment近、中红外的全光谱特征(9444 个点位)近、中红外的关键点位特征(30 个点位)AccuracyTime(s)AccuracyTime(s)98.4%387098.5%18.33 结论本项目的特色及创新之处在于,提出了一种针对中近红外光谱位点数据中红外光谱位

24、点数据近+中红外光谱位点数据模型 ROC 得分0.790.931.0模型精确度92.2%95.1%98.5%混淆矩阵(红点越多集代表模型失败率越高,反之,则失败率越低)图 6 近、中红外的融合实验对比结果Fig.6 Comparison results of fusion experiment between near and mid-infrared表 3 点位法与原曲线的信息保留性对比Tab.3 Comparison of information retention between point position method and original curve全位点20 个位点0.000

25、6380.0007350.0010030.0009660.0006830.000722 下转第88页88软 件第 44 卷 第 1 期SOFTWARE基于云的测试环境用于信息管理系统软件测试主要有 3 点优势:(1)运行环境可按需定制,不同层级和节点的软件运行硬件环境可根据需求精确定制,软件运行系统平台可根据需要安装部署;(2)使用模式可灵活配置,信息管理系统软件的应用模式和系统规模灵活多变,在基于云的测试平台环境下,软件席位节点可弹性伸缩,网络拓扑结构由软件定义,均可灵活配置;(3)测试环境状态可保存重用,以往的信息管理系统软件测试过程中,出现问题的测试环境和状态是难以恢复的,基于云的测试环

26、境能够保存测试环境状态,可用于软件多种应用模式交叉测测试、软件问题精确复现等。4 结论测试的环境构建是进行软件测试的重要基础,直接影响软件测试的结果。软件测试环境的分类能够更加清图 4 信息管理系统软件云测试环境Fig.4 Information management system software cloud test environment晰明确地展现测试环境资源分配,有效地提升了对软件测试环境的构建和管理能力。本文归纳总结了软件测试环境的分类和规范化描述流程,分析了基于虚拟仿真的测试环境构建方法的优势和制约因素,并结合云计算理论与方法,设计了基于云的快速可重构测试环境构建框架和流程,为提

27、升软件的测试能力提供了参考。参考文献1 韩春亮,阚亚斌,荀杨.舰艇辅助决策软件测试与评估系统设计J.舰船电子工程,2018,38(11):134-140.2 顾滨兵,张峰,李军锋.雷达对抗装备软件测试系统的设计J.计算机测量与控制,2018,26(7):99-105.3 王象刚.基于云计算的软件测试J.软件,2013,34(12):246-252.网络资源池存储资源池计算资源池服务器存储设备网络设备数据采集与分析保障设备 软件定义网络云测试系统管理(测试工具)信息管理系统软件云测试环境系统环境测试工具代理被测软件节点1系统环境测试工具代理被测软件节点2系统环境测试工具代理被测软件节点n仿真控制

28、系统信息系统仿真传感器仿真配试资源节点交互设备仿真不可云化资源硬件模拟设备工装设备实装设备药材这一特定领域下的高维数据降维方法的应用,该方法通过波段分析和方差过滤,结合标准差获取中药材光谱数据的关键点位特征,利用融合特征进一步地提高了鉴别效率,为其他特定领域下的高维数据应用研究提供了一种思路。参考文献1 毕达天,邱长波,张晗.数据降维技术研究现状及其进展J.情报理论与实践,2013,36(02):125-128.2 胡洁.高维数据特征降维研究综述J.计算机应用研究,2008(09):2601-2606.3 吴晓婷,闫德勤.数据降维方法分析与研究J.计算机应用研究,2009,26(08):283

29、2-2835.4 刘春红,赵春晖,张凌雁.一种新的高光谱遥感图像降维方法J.中国图象图形学报,2005(02):218-222.5 2021全国大学生数学建模竞赛赛题.E题“中药材鉴别”EB/OL.2021-09-09.6 何秋妍,邓明华.中药材鉴别的统计建模与分析J.数学建模及其应用,2022,11(01):91-105.7 周志华.机器学习M.清华大学出版社,2016.8 刘沭华,张学工,周群,等.近红外漫反射光谱法和模式识别技术鉴别中药材产地J.光谱学与光谱分析,2006(04):629-632.9 冯燕,何明一,宋江红,等.基于独立成分分析的高光谱图像数据降维及压缩J.电子与信息学报,2007(12):2871-2875.10 李乐,章毓晋.基于线性投影结构的非负矩阵分解J.自动化学报,2010,36(01):23-39.上接第65页


注意事项

本文(基于关键点位特征对中药材产地的高效鉴别研究_陈培辉.pdf)为本站会员(爱文献爱资料)主动上传,文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文库网(点击联系客服),我们立即给予删除!




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

文库网用户QQ群:731843829  微博官方号:文库网官方   知乎号:文库网

Copyright© 2025 文库网 wenkunet.com 网站版权所有世界地图

经营许可证编号:粤ICP备2021046453号   营业执照商标

1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png