飞行时间质谱结合机器学习识别香烟烟灰研究.pdf
《飞行时间质谱结合机器学习识别香烟烟灰研究.pdf》由会员分享,可在线阅读,更多相关《飞行时间质谱结合机器学习识别香烟烟灰研究.pdf(5页珍藏版)》请在文库网上搜索。
1、消防科学与技术2023年 9 月第 42 卷第 9 期消防设备研究飞行时间质谱结合机器学习识别香烟烟灰研究王靖童1,刘术军2,杨明3,徐芷芊2(1.沈阳航空航天大学 安全工程学院,辽宁 沈阳 110136;2.应急管理部沈阳消防研究所,辽宁 沈阳 110000;3.中国科学院大连化学物理研究所,辽宁 大连 116000)摘要:为了对不同品牌、不同厂家的香烟烟灰进行准确、快速的识别,收集了 58 种香烟、26 种干扰物以及干扰物和香烟的混合烟灰样品,通过飞行时间质谱仪得到相应的飞行时间质谱数据,再通过系统聚类对飞行时间质谱数据进行分类,针对质谱图特征峰进行比对,最后运用机器学习的主成分分析、偏最
2、小二乘判别分析方法,建立不同方法的判别分析。主成分分析结果表明,此模型具有良好的可靠性,并且具有较好的预测能力;偏最小二乘判别分析结果表明,模型建立可靠且有很好的预测香烟和干扰物烟灰的能力。此外,对该模型进行了 200 次置换验证,结果表明偏最小二乘判别模型在建立时未发生过拟合。因此,利用飞行时间质谱谱图并结合 2 种机器学习算法能够帮助查勘人员对香烟烟灰样本进行精确迅速辨别和检测。关键词:香烟烟灰;飞行时间质谱;机器学习;主成分分析;偏最小二乘判别分析中图分类号:X928.7;D918.91 文献标志码:A 文章编号:1009-0029(2023)09-1265-05香烟燃烧时中心温度高达
3、700800,而一般可燃物质的燃点都在这个温度以下,因此香烟极易引燃可燃物,从而导致火灾的发生。香烟燃烧主要产生 2 类产物,一类是气体产物即香烟烟气1-2,一类是固体产物即香烟烟灰3。在火灾物证鉴定方面,国内外消防部门对电气火灾物证、放火火灾物证及自燃火灾物证研究多年,建立了拉曼光谱法4和气相色谱-质谱法5-6等多种技术鉴定方法,为火灾原因的准确认定提供了强有力的技术支持,但对香烟烟灰的分析研究成果却相对较少,国内外对吸烟火灾的研究主要集中在香烟的引燃特性及痕迹特征等方面7,并未涉及火灾物证鉴定。由于吸烟引发的火灾现场8-12形式千差万别,起火部位处有的灰量较大,有的灰量较小,残留的少量烟灰
4、混合于各种干扰物之中,为了研究快速识别火灾现场香烟烟灰的方法,本文启用机器学习的方法,起初通过系统聚类的方法对不同种类的香烟烟灰和干扰物烟灰进行分类,之后比较 2 种机器学习方法的辨别精确性,为识别不同种类香烟烟灰找出可行性方法。1试验部分1.1材料与仪器试验所用化学试剂均为分析纯,未经二次处理净化直接使用。磷酸(H3PO4,分析纯,Kermel),购于某集团化学试剂有限公司。试验中用水均为高纯水。试验中采用红双喜、利群、双喜好日子、哈德门、呼伦贝尔、黄山香烟、玉溪、中华、云烟等 58 种香烟;采用纸壳、墙皮大白、土、泡沫箱、棉花、粉煤、编织袋、水泥、壁纸、瓷砖(墙)、报纸、白纸、塑料袋、地毯
5、、地垫(硬)等 26种干扰物。本次试验使用自制酸化溢出气装置与大气压负离子光电离飞行时间质谱仪(NCI-TOFMS)集成系统13,如图 1所示。该系统包括63Ni负化学电离源(NCI)、离子传输系统和正交加速飞行时间质量分析器。NCI源包含 3个 1 mm厚的不锈钢电极,分别为 SE1、SE2 和 SE3。放射性 Ni源放在 SE1和 SE2之间,这 3个电极和 Skimmer1,电极由一个 10 mm 厚的聚四氟乙烯(PTFE)绝缘垫圈隔开,另一个3 mm 厚 的 PTFE 绝 缘 垫 圈 放 在 SE1 和 NCI 之 间。在SE2 和 Sk1 之间的 2 个 PTFE 绝缘垫圈中间各有一
6、个直径 3 mm 的气孔,SE2和 SE3之间的一个气孔用作处理废气,靠近 Skimmer1,电极的另一个气孔用作放射性63Ni源的保护气。另一个直径 3 mm,在不锈钢中间的气孔用作灰烬样品酸化溢出气的入口。动态样品吹扫气和保护气的流量分别设定为 200、500 mL/min,不锈钢板至 Sk1 电极之间的 NCI源的长度为 36 mm。为了获得离子的最大环形电极 1环形电极 2环形电极 3小孔电极 1小孔电极 2小孔电极 3提取区域MCP检测器硅胶盖镍诱导源排气管吹扫气质量流量控制器离子传输系统干燥空气穿刺器质量流量控制器样品瓶磁力搅拌棒加热磁力搅拌器飞行时间质谱仪离子透镜图 1酸化溢出气
7、装置与大气压负离子光电离飞行时间质谱集成系统Fig.1Acidizing overflow gas device and atmospheric pressure negative ion photoionization time-of-flight mass spectrometry integrated system基金项目:国家重点研发计划项目(2022YFC3006304)1265Fire Science and Technology,September 2023,Vol.42,No.9传输效率,SE1SE3电极的直流电压分别设定为-800、-600、-400 V。1.2试验方法与过程
8、1.2.1香烟灰的制备取一根红塔山香烟,放在坩埚中,用点火器点燃,然后放置于大空间模拟实验室(长、宽、高分别为 6、9、10 m)中,自由燃烧至熄灭,取香烟灰直接使用即可。其他香烟灰的制备方法同上。1.2.2干扰物灰的制备泡沫箱、纸壳、报纸、塑料袋、编织袋、地垫、棉花等可燃干扰物的灰制备方法同上;对于墙皮大白、粉煤灰、水泥、瓷砖(墙)等不燃干扰物,先用斧子或锤子砸成大块,然后放入研磨仪中,研磨成灰待用。1.2.3混合灰的制备将上述制备的灰烬样品按质量比 1:1混合,即制得混合灰样品。1.2.4磷酸溶液的配制质谱分析:质谱条件为吹扫气流速为 200 mL/min,保护气流速为 500 mL/mi
9、n,电离源加热温度为 65,谱图采集时间为 150 s。磷酸背景检测:取 2 mL 磷酸倒入 20 mL 样品瓶中,水浴温度设置为 50 ,加热平衡 5 min 后,通入流速为300 mL/min 的干净空气,吹扫样品瓶顶空气体进入质谱进行检测。样品检测:磷酸背景检测完成后,向样品瓶中加入 10 mg 烟灰样品,立即通入流速为 300 mL/min 的干净空气,吹扫顶空气体进入质谱进行检测。单个样品检测完成后,通入流速为 3 000 mL/min 的干净空气,吹扫进样管路,所有烟灰样品的检测条件及流程均相同。2结果与讨论3 组烟灰数据:干扰物烟灰(缩写为 G)、国产香烟烟灰(缩写为 Y)以及干
10、扰物和香烟的混合烟灰(缩写为 H)。共选用了 26 个干扰物烟灰、58 个国产香烟烟灰以及 9 个混合烟灰数据进行分析。2.1烟灰数据原始谱图对样品进行质谱分析后得到质谱图,该图谱表示化合物或样品中各种化学成分的质荷比和其对应的相对丰度。质谱图通常由两个坐标轴组成:质荷比(m/z)轴和相对丰度轴。质荷比表示离子在质谱中的质量和电荷比,而相对丰度表示了每个离子的相对丰度或信号强度。扣除磷酸背景后的国产香烟烟灰、干扰物烟灰以及干扰物和香烟的混合烟灰的对比质谱图如图 2图 4所示。可以看到,不同国产香烟烟灰的质谱图的相似性较高(图 2),检测出的物质种类及相对强度基本相同,谱图中谱峰的出峰位置固定;
11、而不同干扰物烟灰的谱图之间差异比较大(图 3),出峰位置复杂并且具有不同的信号强度,与国产香烟烟灰相比具有不同的特征峰及信号强度。而将国产香烟烟灰与干扰物烟灰混合进行检测后,发现仍能检测到国产香烟灰存在的特征谱峰(图 4)。因此,通过质谱图来识别香烟烟灰具有一定的可行性。2.2系统聚类图通过观察质谱图发现,国产香烟烟灰与干扰物烟灰存在差别,有通过质谱检测识别香烟烟灰的可行性,但仅通过质谱图的观察并不够严谨,所以可以进行聚类分析,利用统计学方法验证香烟烟灰和干扰烟灰是有差异的,m/z40 50 60 70 80 90 100 110 120强度/1057.56.04.53.01.50.0图 2国
12、产香烟烟灰原始谱图对比Fig.2Comparison of original spectra of domestic cigarette ashm/z40 50 60 70 80 90 100 110 120强度/1057.56.04.53.01.50.0图 3干扰物烟灰原始谱图对比Fig.3Comparison of the original spectrum of the interfering sootm/z40 50 60 70 80 90 100 110 120强度/1057.56.04.53.01.50.0图 4干扰物和国产香烟混合烟灰原始谱图对比Fig.4Comparison o
13、f the original spectrum of the mixed soot of the interferences and domestic cigarettes1266消防科学与技术2023年 9 月第 42 卷第 9 期表明通过质谱检测进行分类的可行性。由于原始数据矩阵中的变量一般都有不同的量纲和数量级单位,为了能将不同量级的数据放在一起进行比较,通常会对数据进行转换。在此,选择 z-score 标准化的方法来处理数据,该方法首先会求出变量 xij的算术平均值 xi和标准差聚 si,然后根据公式 zij=(xij-xi)/si(式中:x,s,z为距离)进行标准化处理,最后将逆指标
14、前的正负号对调,标准化后的变量大于 0 则说明高于平均水平,小于 0则说明低于平均水平。系统聚类法(Hierarchical clustering methods)14也称层次聚类法,是目前实践中使用最多的方法,其基本原理是:先将 n 个样本各自看成一类,并规定样本与样本之间的距离以及类与类之间的距离。开始时,每个样本自成一类,因此类与类之间的距离与样本之间的距离是相同的。然后,选择距离最小的两个类合并成一个新类,并计算出所得的新类和其他各类的距离;接着将距离最近的两类合并,直至将所有的样本都合并成一类为止。在此,选择了组间联接法作为聚类方法,样本间的距离选择平方欧式距离,使用 SPSS St
15、atistics 统计分析软件得到聚类树状谱系图。在聚类树状谱系图中,当距离为 9时,3个组别的样本聚类效果最好,仅有个别样本与不同组别聚为一类,绝大多数香烟烟灰样本被分为一类,仅有部分被分为另外一类;而干扰烟灰因其种类复杂,被分为 7类;9个香烟烟灰和干扰灰的混合样本中,有 8 个样本被聚为一类。这表明,香烟烟灰与干扰灰之间具有较为明显的差异,可以通过统计学方法区分干扰烟灰与香烟烟灰。2.33个组别的烟灰数据对比对质谱图进行细化和放大处理,确定了一些质谱图中存在的特征峰。为进行主成分分析确定一些变量。从 3 个组别中随机挑选 3 个样本数据绘制其对比质谱图,结果如图 5图 7所示。对比图 5
16、图 7 可以发现,香烟烟灰中有 m/z=42、75、85、93 这几个特殊峰,在干扰物烟灰中是不存在或信号强度相对较低的。此外,由于干扰物烟灰是不同种类的干扰物,其对比质谱图中的谱峰数量和位置也存在明显差异。2.4多变量分析主成分分析15-16是一种统计分析、简化数据集的方法,通过正交变换将一系列可能相关的变量的预测值进行线性变换,投影为一系列不相关变量的值,这些不相关变量称为主成分。主成分分析经常用于减少数据集的维数,同时保留数据集中对方差贡献最大的特征。在此,使用 SIMCA-P软件对数据进行主成分分析,选择归一化方法为单位方差缩放,主成分分析得分图如图 8所示。可以明显地观察到,3 组烟
17、灰样本呈现出聚类分布,其中,国产香烟烟灰样本点聚集较为紧密,说明国产香烟样本之间的差异性较小;干扰物烟灰因选择的干扰物种类不同,燃烧后的烟灰成分存在较大差异,所以在主成分分析得分图中聚集较为分散;而国产香烟和干扰物混合烟灰由于是混合烟灰,因而组间的差异性更大,所以聚集得更为分散。在主成分分析得分图中,R2X=0.897,Q2=0.571,该结果表明此模型具有良好的可靠性,并且具有较好的预测能力。m/z40 50 60 70 80 90 100 110 120强度/105543210607585899311111111142606042428589938589937575Y7Y46Y16图 5香
18、烟烟灰对比质谱图Fig.5Comparative mass spectrum of cigarette ashm/z40 50 60 70 80 90 100 110 120强度/1052.52.01.51.00.50.0506068788692104G3506068788692104104928678686050G30G7图 6干扰物烟灰对比质谱图Fig.6Comparison mass spectrum of the interferential sootm/z40 50 60 70 80 90 100 110 120强度/10554321050606878104H550606878104
19、10493897868604242425075757593899389111111111H3H6图 7干扰物烟灰和香烟烟灰对比质谱图Fig.7Comparison mass spectrum of interferential soot and cigarette ash1267Fire Science and Technology,September 2023,Vol.42,No.9偏最小二乘判别分析(PLS-DA)17-19与主成分分析类似,但它是通过投影预测变量和观测变量到一个新空间来寻找一个线性回归模型。当样本组间差异大而组内差异小时,无监督的分析方法,如主成分分析可以很好地区分组间差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 飞行 时间 结合 机器 学习 识别 香烟 烟灰 研究