收藏 分享(赏)

飞行时间质谱结合机器学习识别香烟烟灰研究.pdf

上传人:爱文献爱资料 文档编号:21763407 上传时间:2024-04-23 格式:PDF 页数:5 大小:2.10MB
下载 相关 举报
飞行时间质谱结合机器学习识别香烟烟灰研究.pdf_第1页
第1页 / 共5页
飞行时间质谱结合机器学习识别香烟烟灰研究.pdf_第2页
第2页 / 共5页
飞行时间质谱结合机器学习识别香烟烟灰研究.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、消防科学与技术2023年 9 月第 42 卷第 9 期消防设备研究飞行时间质谱结合机器学习识别香烟烟灰研究王靖童1,刘术军2,杨明3,徐芷芊2(1.沈阳航空航天大学 安全工程学院,辽宁 沈阳 110136;2.应急管理部沈阳消防研究所,辽宁 沈阳 110000;3.中国科学院大连化学物理研究所,辽宁 大连 116000)摘要:为了对不同品牌、不同厂家的香烟烟灰进行准确、快速的识别,收集了 58 种香烟、26 种干扰物以及干扰物和香烟的混合烟灰样品,通过飞行时间质谱仪得到相应的飞行时间质谱数据,再通过系统聚类对飞行时间质谱数据进行分类,针对质谱图特征峰进行比对,最后运用机器学习的主成分分析、偏最

2、小二乘判别分析方法,建立不同方法的判别分析。主成分分析结果表明,此模型具有良好的可靠性,并且具有较好的预测能力;偏最小二乘判别分析结果表明,模型建立可靠且有很好的预测香烟和干扰物烟灰的能力。此外,对该模型进行了 200 次置换验证,结果表明偏最小二乘判别模型在建立时未发生过拟合。因此,利用飞行时间质谱谱图并结合 2 种机器学习算法能够帮助查勘人员对香烟烟灰样本进行精确迅速辨别和检测。关键词:香烟烟灰;飞行时间质谱;机器学习;主成分分析;偏最小二乘判别分析中图分类号:X928.7;D918.91 文献标志码:A 文章编号:1009-0029(2023)09-1265-05香烟燃烧时中心温度高达

3、700800,而一般可燃物质的燃点都在这个温度以下,因此香烟极易引燃可燃物,从而导致火灾的发生。香烟燃烧主要产生 2 类产物,一类是气体产物即香烟烟气1-2,一类是固体产物即香烟烟灰3。在火灾物证鉴定方面,国内外消防部门对电气火灾物证、放火火灾物证及自燃火灾物证研究多年,建立了拉曼光谱法4和气相色谱-质谱法5-6等多种技术鉴定方法,为火灾原因的准确认定提供了强有力的技术支持,但对香烟烟灰的分析研究成果却相对较少,国内外对吸烟火灾的研究主要集中在香烟的引燃特性及痕迹特征等方面7,并未涉及火灾物证鉴定。由于吸烟引发的火灾现场8-12形式千差万别,起火部位处有的灰量较大,有的灰量较小,残留的少量烟灰

4、混合于各种干扰物之中,为了研究快速识别火灾现场香烟烟灰的方法,本文启用机器学习的方法,起初通过系统聚类的方法对不同种类的香烟烟灰和干扰物烟灰进行分类,之后比较 2 种机器学习方法的辨别精确性,为识别不同种类香烟烟灰找出可行性方法。1试验部分1.1材料与仪器试验所用化学试剂均为分析纯,未经二次处理净化直接使用。磷酸(H3PO4,分析纯,Kermel),购于某集团化学试剂有限公司。试验中用水均为高纯水。试验中采用红双喜、利群、双喜好日子、哈德门、呼伦贝尔、黄山香烟、玉溪、中华、云烟等 58 种香烟;采用纸壳、墙皮大白、土、泡沫箱、棉花、粉煤、编织袋、水泥、壁纸、瓷砖(墙)、报纸、白纸、塑料袋、地毯

5、、地垫(硬)等 26种干扰物。本次试验使用自制酸化溢出气装置与大气压负离子光电离飞行时间质谱仪(NCI-TOFMS)集成系统13,如图 1所示。该系统包括63Ni负化学电离源(NCI)、离子传输系统和正交加速飞行时间质量分析器。NCI源包含 3个 1 mm厚的不锈钢电极,分别为 SE1、SE2 和 SE3。放射性 Ni源放在 SE1和 SE2之间,这 3个电极和 Skimmer1,电极由一个 10 mm 厚的聚四氟乙烯(PTFE)绝缘垫圈隔开,另一个3 mm 厚 的 PTFE 绝 缘 垫 圈 放 在 SE1 和 NCI 之 间。在SE2 和 Sk1 之间的 2 个 PTFE 绝缘垫圈中间各有一

6、个直径 3 mm 的气孔,SE2和 SE3之间的一个气孔用作处理废气,靠近 Skimmer1,电极的另一个气孔用作放射性63Ni源的保护气。另一个直径 3 mm,在不锈钢中间的气孔用作灰烬样品酸化溢出气的入口。动态样品吹扫气和保护气的流量分别设定为 200、500 mL/min,不锈钢板至 Sk1 电极之间的 NCI源的长度为 36 mm。为了获得离子的最大环形电极 1环形电极 2环形电极 3小孔电极 1小孔电极 2小孔电极 3提取区域MCP检测器硅胶盖镍诱导源排气管吹扫气质量流量控制器离子传输系统干燥空气穿刺器质量流量控制器样品瓶磁力搅拌棒加热磁力搅拌器飞行时间质谱仪离子透镜图 1酸化溢出气

7、装置与大气压负离子光电离飞行时间质谱集成系统Fig.1Acidizing overflow gas device and atmospheric pressure negative ion photoionization time-of-flight mass spectrometry integrated system基金项目:国家重点研发计划项目(2022YFC3006304)1265Fire Science and Technology,September 2023,Vol.42,No.9传输效率,SE1SE3电极的直流电压分别设定为-800、-600、-400 V。1.2试验方法与过程

8、1.2.1香烟灰的制备取一根红塔山香烟,放在坩埚中,用点火器点燃,然后放置于大空间模拟实验室(长、宽、高分别为 6、9、10 m)中,自由燃烧至熄灭,取香烟灰直接使用即可。其他香烟灰的制备方法同上。1.2.2干扰物灰的制备泡沫箱、纸壳、报纸、塑料袋、编织袋、地垫、棉花等可燃干扰物的灰制备方法同上;对于墙皮大白、粉煤灰、水泥、瓷砖(墙)等不燃干扰物,先用斧子或锤子砸成大块,然后放入研磨仪中,研磨成灰待用。1.2.3混合灰的制备将上述制备的灰烬样品按质量比 1:1混合,即制得混合灰样品。1.2.4磷酸溶液的配制质谱分析:质谱条件为吹扫气流速为 200 mL/min,保护气流速为 500 mL/mi

9、n,电离源加热温度为 65,谱图采集时间为 150 s。磷酸背景检测:取 2 mL 磷酸倒入 20 mL 样品瓶中,水浴温度设置为 50 ,加热平衡 5 min 后,通入流速为300 mL/min 的干净空气,吹扫样品瓶顶空气体进入质谱进行检测。样品检测:磷酸背景检测完成后,向样品瓶中加入 10 mg 烟灰样品,立即通入流速为 300 mL/min 的干净空气,吹扫顶空气体进入质谱进行检测。单个样品检测完成后,通入流速为 3 000 mL/min 的干净空气,吹扫进样管路,所有烟灰样品的检测条件及流程均相同。2结果与讨论3 组烟灰数据:干扰物烟灰(缩写为 G)、国产香烟烟灰(缩写为 Y)以及干

10、扰物和香烟的混合烟灰(缩写为 H)。共选用了 26 个干扰物烟灰、58 个国产香烟烟灰以及 9 个混合烟灰数据进行分析。2.1烟灰数据原始谱图对样品进行质谱分析后得到质谱图,该图谱表示化合物或样品中各种化学成分的质荷比和其对应的相对丰度。质谱图通常由两个坐标轴组成:质荷比(m/z)轴和相对丰度轴。质荷比表示离子在质谱中的质量和电荷比,而相对丰度表示了每个离子的相对丰度或信号强度。扣除磷酸背景后的国产香烟烟灰、干扰物烟灰以及干扰物和香烟的混合烟灰的对比质谱图如图 2图 4所示。可以看到,不同国产香烟烟灰的质谱图的相似性较高(图 2),检测出的物质种类及相对强度基本相同,谱图中谱峰的出峰位置固定;

11、而不同干扰物烟灰的谱图之间差异比较大(图 3),出峰位置复杂并且具有不同的信号强度,与国产香烟烟灰相比具有不同的特征峰及信号强度。而将国产香烟烟灰与干扰物烟灰混合进行检测后,发现仍能检测到国产香烟灰存在的特征谱峰(图 4)。因此,通过质谱图来识别香烟烟灰具有一定的可行性。2.2系统聚类图通过观察质谱图发现,国产香烟烟灰与干扰物烟灰存在差别,有通过质谱检测识别香烟烟灰的可行性,但仅通过质谱图的观察并不够严谨,所以可以进行聚类分析,利用统计学方法验证香烟烟灰和干扰烟灰是有差异的,m/z40 50 60 70 80 90 100 110 120强度/1057.56.04.53.01.50.0图 2国

12、产香烟烟灰原始谱图对比Fig.2Comparison of original spectra of domestic cigarette ashm/z40 50 60 70 80 90 100 110 120强度/1057.56.04.53.01.50.0图 3干扰物烟灰原始谱图对比Fig.3Comparison of the original spectrum of the interfering sootm/z40 50 60 70 80 90 100 110 120强度/1057.56.04.53.01.50.0图 4干扰物和国产香烟混合烟灰原始谱图对比Fig.4Comparison o

13、f the original spectrum of the mixed soot of the interferences and domestic cigarettes1266消防科学与技术2023年 9 月第 42 卷第 9 期表明通过质谱检测进行分类的可行性。由于原始数据矩阵中的变量一般都有不同的量纲和数量级单位,为了能将不同量级的数据放在一起进行比较,通常会对数据进行转换。在此,选择 z-score 标准化的方法来处理数据,该方法首先会求出变量 xij的算术平均值 xi和标准差聚 si,然后根据公式 zij=(xij-xi)/si(式中:x,s,z为距离)进行标准化处理,最后将逆指标

14、前的正负号对调,标准化后的变量大于 0 则说明高于平均水平,小于 0则说明低于平均水平。系统聚类法(Hierarchical clustering methods)14也称层次聚类法,是目前实践中使用最多的方法,其基本原理是:先将 n 个样本各自看成一类,并规定样本与样本之间的距离以及类与类之间的距离。开始时,每个样本自成一类,因此类与类之间的距离与样本之间的距离是相同的。然后,选择距离最小的两个类合并成一个新类,并计算出所得的新类和其他各类的距离;接着将距离最近的两类合并,直至将所有的样本都合并成一类为止。在此,选择了组间联接法作为聚类方法,样本间的距离选择平方欧式距离,使用 SPSS St

15、atistics 统计分析软件得到聚类树状谱系图。在聚类树状谱系图中,当距离为 9时,3个组别的样本聚类效果最好,仅有个别样本与不同组别聚为一类,绝大多数香烟烟灰样本被分为一类,仅有部分被分为另外一类;而干扰烟灰因其种类复杂,被分为 7类;9个香烟烟灰和干扰灰的混合样本中,有 8 个样本被聚为一类。这表明,香烟烟灰与干扰灰之间具有较为明显的差异,可以通过统计学方法区分干扰烟灰与香烟烟灰。2.33个组别的烟灰数据对比对质谱图进行细化和放大处理,确定了一些质谱图中存在的特征峰。为进行主成分分析确定一些变量。从 3 个组别中随机挑选 3 个样本数据绘制其对比质谱图,结果如图 5图 7所示。对比图 5

16、图 7 可以发现,香烟烟灰中有 m/z=42、75、85、93 这几个特殊峰,在干扰物烟灰中是不存在或信号强度相对较低的。此外,由于干扰物烟灰是不同种类的干扰物,其对比质谱图中的谱峰数量和位置也存在明显差异。2.4多变量分析主成分分析15-16是一种统计分析、简化数据集的方法,通过正交变换将一系列可能相关的变量的预测值进行线性变换,投影为一系列不相关变量的值,这些不相关变量称为主成分。主成分分析经常用于减少数据集的维数,同时保留数据集中对方差贡献最大的特征。在此,使用 SIMCA-P软件对数据进行主成分分析,选择归一化方法为单位方差缩放,主成分分析得分图如图 8所示。可以明显地观察到,3 组烟

17、灰样本呈现出聚类分布,其中,国产香烟烟灰样本点聚集较为紧密,说明国产香烟样本之间的差异性较小;干扰物烟灰因选择的干扰物种类不同,燃烧后的烟灰成分存在较大差异,所以在主成分分析得分图中聚集较为分散;而国产香烟和干扰物混合烟灰由于是混合烟灰,因而组间的差异性更大,所以聚集得更为分散。在主成分分析得分图中,R2X=0.897,Q2=0.571,该结果表明此模型具有良好的可靠性,并且具有较好的预测能力。m/z40 50 60 70 80 90 100 110 120强度/105543210607585899311111111142606042428589938589937575Y7Y46Y16图 5香

18、烟烟灰对比质谱图Fig.5Comparative mass spectrum of cigarette ashm/z40 50 60 70 80 90 100 110 120强度/1052.52.01.51.00.50.0506068788692104G3506068788692104104928678686050G30G7图 6干扰物烟灰对比质谱图Fig.6Comparison mass spectrum of the interferential sootm/z40 50 60 70 80 90 100 110 120强度/10554321050606878104H550606878104

19、10493897868604242425075757593899389111111111H3H6图 7干扰物烟灰和香烟烟灰对比质谱图Fig.7Comparison mass spectrum of interferential soot and cigarette ash1267Fire Science and Technology,September 2023,Vol.42,No.9偏最小二乘判别分析(PLS-DA)17-19与主成分分析类似,但它是通过投影预测变量和观测变量到一个新空间来寻找一个线性回归模型。当样本组间差异大而组内差异小时,无监督的分析方法,如主成分分析可以很好地区分组间差

20、异;而样本组间差异不大时,无监督的方法就难以区分组间差异。此外,如果组间差异较小,且各组的样本量相差较大时,样本量大的一组将会主导模型,此时,有监督的分析方法,如偏最小二乘判别分析是更好的选择。图 9为偏最小二乘判别分析20-21得分图。由图 9 可知国产香烟烟灰样本点和干扰物烟灰样本点分别在坐标轴两侧聚类分布,其中干扰物烟灰较为离散,而国产香烟烟灰聚集紧密,说明干扰物烟灰组间差异大,国产香烟烟灰组间差异小,与主成分分析结果相同。而干扰物烟灰中有 4 个样本点在 95%置信区间之外,说明这几个样本点与其他样本点存在较大差异。在 PLS-DA 得分图中,R2Y=0.838,Q2=0.782,表明

21、模型建立可靠,且具有很好的预测香烟和干扰物烟灰的能力。此外,对该模型进行了 200 次置换验证,结果表明该 PLS-DA模型在建立时未发生过拟合,表明该模型具有合适的复杂度,并能够对未知数据进行良好的泛化,提高了模型的可靠性和可用性。3结 论传统案件过程中对于香烟的识别、判断方法有:查明火灾现场是否具备遗留烟头的条件;起火点处是否放置有能被烟头引燃的物品;起火时的燃烧特征是否与烟头火源引燃周围可燃物起火燃烧痕迹特征吻合,或者使用“排除法”排除其他火源引发火灾的可能性等方法,但是这些方法仍存在很多不确定性及偶然性,因此通过飞行时间质谱谱图并结合系统类聚、主成分分析和偏最小二乘判别分析两种机器学习

22、22-23算法,对于香烟样本的识别建立了分析方法,首先通过系统聚类对不同品牌的香烟数据进行分类,再通过不同算法间可靠性的比较,得到这两种算法相比于传统识别方法更加准确、简单和省时,为案件侦查提供了新的物证检验的方法。参考文献:1 HALL M G,RIBISL K M,BREWER N T.Smokersand nonsmokers beliefs about harmful tobacco constituents:implications for FDA communication effortsJ.Nicotine and Tobacco Research,2014,16(3):343-

23、350.2 CRAWFORD M A,BALCH G I,MERMELSTEIN R,et al.Responses to tobacco control policies among youthJ.Tobacco Control,2002,11(1):14-19.3 BOTKIN J.The firesafe cigaretteJ.Journal of the American Medical Association,1988,260(2):226-229.4 LEE E P,OHTANI H,MATSUBARA Y,et al.Study on discrimination between

24、 primary and secondary molten marks using carbonized residueJ.Fire Safety Journal,2002,37(4):353-368.5 BAERNCOPF J,HUTCHES K.A review of modern challenges in fire debris analysisJ.Forensic Science International,2014,244:12-20.6 TURNER D A,WILLIAMS M,SIGMAN M A,et al.A comprehensive study of the alte

25、ration of ignitable liquids by weathering and microbial degradationJ.Journal of Forensic Sciences,2018,63(1):58-65.7 CHUNG Y J.Accdident analysis by the fire of cigarettesJ.Journal of The Korean Society of Hazard Mitigation,2012,12(5):259-266.8 KEGLER S R,DELLINGER A M,BALLESTEROS M F.Deareasing res

26、idential fire death rates and the association with the prevalence of adult cigarette smoking-United States,1999-2015J.Journal of Safety Research,2018,67:197-201.9 CONNOLLY G N,ALPERT H R,REES V.Effect of the New York State cigarette fire safety standard on ignition propensity,smoke constituents,and

27、the consumer marketJ.Tobacco Control,2005,14(5):321-327.10 LAUGESEN M,DUNCANSON M,FRASER T,et al.Hand rolling cigarette papers as the reference point for regulating cigarette fire safetyJ.Tobacco Control,2003(12):406-410.11 BUTRY D T,THOMAS D S.Cigarette fires involving upholstered furniture in resi

28、dences:the role that smokers,smoker behavior,and fire standard compliant cigarettes playJ.Fire Technology,2017,53与第一主成分的相关系数-12-10-8-6-4-2 0 2 4 6 8 1086420-2-4-6-8与第二主成分的相关系数GHY图 8主成分分析得分图Fig.8Scores of principal component analysis与第一主成分的相关系数-10-8-6-4-2 0 2 4 6 8 10543210-1-2-3-4-5-6与第二主成分的相关系数GY图

29、9偏最小二乘判别分析得分图Fig.9Partial least squares discriminant analysis score chart1268消防科学与技术2023年 9 月第 42 卷第 9 期(3):1123-1146.12 SMITH J,BULLEN C,LAUGESEN M,et al.Cigarette fires and burns in a population of New Zealand smokersJ.Tobacco Control,2009,18(1):29-33.13 LIU S J,XIE Y Y,SONG X M.Accurate and rapid

30、 discrimination of cigarette and household decoration material ash residues by negative chemical ionization TOFMS via acidenhanced evaporationJ.Scientific Reports,2020,10:5810.14 田兵.系统聚类法及其应用研究J.阴山学刊(自然科学版),2014,28(2):11-16.15 GONZALEZ-RODRGUEZ J,SISSONS N,ROBINSON S.Fire debris analysis by Raman sp

31、ectroscopy and chemometricsJ.Journal of Analytical and Applied Pyrolysis,2011,9(1):210-218.16 侯振雨,蔡文生,邵学广.主成分分析-支持向量回归建模方法及应用研究J.分析化学,2006,34(5):617-620.17 SINKOV N A,SANDERCOCK P M L,HARYNUK J J.Chemometric classification of casework arson samples based on gasoline contentJ.Forensic Science Interna

32、tional,2014,235:24-31.18 马丽,吕成文,唐炎.基于偏最小二乘法的土壤有机碳高光谱预测研究J.安徽师范大学学报(自然科学版),2016,39(2):164-167.19 罗批,郭继昌,李锵,等.基于偏最小二乘回归建模的探讨J.天津大学学报,2002,35(6):783-786.20 陆洪涛.偏最小二乘回归数学模型及其算法研究D.北京:华北电力大学,2014.21 任欢.偏最小二乘回归算法应用与改进D.天津:天津工业大学,2019.22 杨剑锋,乔佩蕊,李永梅,等.机器学习分类问题及算法研究综述J.统计与决策,2019,35(6):36-40.23 周志华.机器学习M.北京

33、:清华大学出版社,2016.Identification of cigarette ashes by timeoflight mass spectrometry combined with machine learningWang Jingtong1,Liu Shujun2,Yang Ming3,Xu Zhiqian2(1.College of Safety Engineering,Shenyang Aerospace University,Liaoning Shenyang 110136,China;2.Shenyang Fire Science and Technology Researc

34、h Institute of MEM,Liaoning Shenyang 110000,China;3.Dalian Institute of Chemical Physics,Chinese Academy of Sciences,Liaoning Dalian 116000,China)Abstract:In order to accurately and quickly identify cigarette ash from different brands and manufacturers,58 types of cigarettes,26 different interfering

35、 substances,and mixed cigarette ash samples from different brands and manufacturers were collected.The corresponding timeofflight mass spectrometry data was obtained through a timeofflight mass spectrometer,and then the timeofflight mass spectrometry data was classified through system clustering.The

36、 characteristic peaks of the mass spectrometry were compared.Finally,principal component analysis and partial least squares discriminant analysis methods of machine learning are used to establish discriminant analysis for different methods.The results of principal component analysis indicate that th

37、is model has good reliability and predictive ability;partial least squares discriminant analysis indicates that the model is reliable and has good ability to predict cigarettes and interfering substance smoke ash.In addition,the model was verified for 200 times,and the results showed that the partia

38、l least squares discriminant model did not have overfitting when it was established.Therefore,combining timeofflight mass spectrometry with two machine learning algorithms can help surveyors accurately and quickly identify and detect cigarette ash samples.Key words:cigarette ash;timeofflight mass spectrometry;machine learning;principal component analysis;partial least squares discriminant analysis作者简介:王靖童(1999-),女,辽宁锦州人,沈阳航空航天大学硕士研究生,主要从事火灾科学与飞机火爆防控方面的研究,辽宁省沈阳市沈北新区道义南大街 37号,110136。通信作者:刘术军(1977-),男,应急管理部沈阳消防研究所副研究员。收稿日期:2023-04-20(责任编辑:毛星)1269

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 综合论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报