收藏 分享(赏)

基于知识图谱的炒货食品抽检数据可视化系统研究_乔青青.pdf

上传人:爱文献爱资料 文档编号:13910361 上传时间:2023-05-06 格式:PDF 页数:4 大小:2.07MB
下载 相关 举报
基于知识图谱的炒货食品抽检数据可视化系统研究_乔青青.pdf_第1页
第1页 / 共4页
基于知识图谱的炒货食品抽检数据可视化系统研究_乔青青.pdf_第2页
第2页 / 共4页
基于知识图谱的炒货食品抽检数据可视化系统研究_乔青青.pdf_第3页
第3页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 123 研究探讨食品工业 2023 年第44卷第 2 期基于知识图谱的炒货食品抽检数据可视化系统研究乔青青1,郝莉花1*,马江涛2,罗莉1,仝莹莹11.河南省产品质量监督检验院(郑州 450000);2.郑州轻工业大学(郑州 450000)摘要为提高食品安全抽检数据的利用率,深入分析抽检数据,结合知识图谱,建立抽检信息间关联关系,以期发现潜在的食品安全风险。运用网络爬虫技术,将坚果与炒货食品抽检数据进行整合,并将数据存于Neo4j图数据库用于展示各数据之间的关系,深度挖掘数据间潜在的关联信息。结果表明,通过曲线图、折线图、节点图、地图,实现对食品安全态势、食品安全分析报告,对不合格抽检信息检

2、索、抽检数据关联关系的可视化显示。采用可视化的方式可实现抽检数据的直观展示,挖掘潜在食品安全风险,进而提高食品安全风险预警有效性。关键词知识图谱;食品安全抽检数据;可视化;食品安全风险预警Visualization Analysis of Food Safety Supervision Sampling Inspection of Roasted Seeds and Nuts Products Based on Knowledge GraphQIAO Qingqing1,HAO Lihua1*,MA Jiangtao2,LUO Li1,TONG Yingying11.Henan Institu

3、te of Quality Supervision and Inspection(Zhengzhou 450000);2.College of Food and Biological Engineering,Zhengzhou University of Light Industry(Zhengzhou 450000)Abstract In order to improve the utilization rate of food safety sampling data and analysis deeply,information correlation of food safety su

4、pervision sampling inspection was established by combining knowledge graph,so as to find potential food safety risks and to realize early warning in time.The data of roasted seeds and nuts products were collected and stored in Neo4j graph database,which was used to show the relationship between the

5、data and dig out the potential correlation information.The results showed that the visualization of food safety situation,food safety analysis report,unqualified sampling information retrieval and association of sampling data was realized by curve chart,and line chart,node chart and map were broken.

6、The visual display of sampling data was realized,the potential food safety risk was excavated,and then the effectiveness of food safety risk early warning was improved.Keywords knowledge graph;food safety sampling data;visualization;food safety risk early warning食品安全法明确提出我国对食品安全的管理由被动应对向主动预防转变,而预防机制

7、基础就是食品安全大数据的应用1。在我国,关于“十三五”时期加强食品药品监管网络安全和信息化建设的指导意见等多个文件2-4要求推进食品安全大数据建设。中共中央国务院关于深化改革加强食品安全工作的意见5中指出“完善抽检监测信息通报机制,模拟运输时的振动也会造成纸箱、隔断及衬板的轻微磨损,但包装容器及内部产品无明显变化,模拟运输后产品的气密性和均匀性符合标准要求。在现有的包装形式下,静载荷堆码不会对包装件及内部产品造成损坏。滚动时对外箱所有棱造成轻微损坏,即出现压痕,但不会对外箱各个面、包装容器及内部产品造成损坏。跌落时损坏程度比静载荷堆码及滚动大很多,外箱容易出现受损,内包装容器易出现轻微的磕痕,

8、但不会对内部产品造成损坏。采用实验室模拟运输和模拟装卸试验的结果与实际运输过程的结果相比趋近或破坏性更强,模拟产品装卸和运输过程中的危害因素具有可行性。参考文献:1 中华人民共和国国家卫生和计划生育委员会.食品安全国家标准 特殊医学用途配方食品通则:GB 299222013S.北京:中国标准出版社,2013.2 麻开香,张美萍,吴帅,等.特殊医学用途配方食品干法混合工艺研究及其与湿法工艺的对比J.现代食品科技,2019,35(1):6.3 刘宝华.特殊医学用途配方食品干法工艺中混合机最佳参数的试验研究J.中国乳业,2022(4):7.4 张长森.粉体技术及设备M.上海:华东理工大学出版社,20

9、07:254-257.5 International Safe Transit Association.Guidelines for selecting and using ISTA test procedures and projectsC.ISTA,2012.6 国家食品药品监督管理局药品认证管理中心编写.药品GMP指南:口服固体制剂M.北京:中国医药科技出版社,2011.食品工业 2023 年第44卷第 2 期 124 研究探讨依法及时公开抽检信息”,这也为大数据在食品抽检领域分析提供了政策支持。自食品安全抽检信息发布以来,目前已公布690万余批次的抽检结果6,但传统的数据分析较为简单7

10、-8,无法满足智能监管的需求。作为传统的休闲食品,近年来炒货制品的质量问题也受到广泛关注9-11。从公布的抽检结果看12-14,炒货食品的不合格率较高,加强对炒货食品监管尤为重要。网络爬虫技术可用于收集媒体网页中的数据,抓取有效信息并加以存储15。Neo4j数据库是一种以图的形式来存储信息的非关系存储数据库,相比传统数据格式,Neo4j数据库信息更加直观16-17。知识图谱(knowledge graph,KG)是以图的形式表现客观世界中的实体(概念、人、事物)及其之间关系的知识库18-20。此次研究以已公布炒货食品抽检数据为基础,建立基于Neo4j及Django食品可视化分析系统,为智能化监

11、管提供技术支持。1材料与方法1.1数据来源数据来源主要从以下网站获取:国家市场监管管理局,http:/ 16.04;开发语言为Python 3.5.2;数据库为Neo4j和MySql;服务器为Django 1.11.8;前端相关API为Echarts,font-awesome,ChinaMap,dataTable和bootstrap等;Python相关API为pymsql,py2neo,PyTorch,jieba,spark,pytz和geoip等。1.3系统模块设计系统主要包括的数据获取、数据清洗、数据质量控制、构建知识图谱、构建系统整体模块,见图1。系统结构见图2。图1系统整体模块结构图图

12、2系统整体结构图1.3.1获取数据模块获取的数据模块主要使用Scrapy爬虫收集食品安全相关信息,收集食安通、国家市场监督管理总局、各省份市场监督管理局等网站上的各年食品抽检不合格信息登记表。1.3.2数据清洗模块获取数据后,需要进行数据清洗。数据清洗模块包括删除无分析价值抽检数据(有些抽检数据缺失值过多,无分析价值)和清理与食品无关的脏值数据。在无分析价值的抽检数据处理时,抽检数据中不合格各项和检测结果缺失数据要进行删除,被抽检单位所在地缺失要进行填充,填充的方法为根据被抽检企业和发布单位数据条中进行地点抽取。与食品无关的脏值数据处理,直接删除即可。1.3.3数据质量控制模块数据质量控制需要

13、人工和程序共同完成,人工发现数据的质量出现问题,撰写程序进行再清洗。1.3.4构建知识图谱模块知识图谱构建要对数据清洗完成后的数据进行实体抽取、关系抽取、属性抽取、知识消歧、知识对齐、标准知识表示、知识验证、导入Neo4j数据库。1.3.5构建Django模块使用Python的第三方库django框架,构建django项目。从Mysql中调用构建好的数据集,并调用Neo4j中的数据接入项目接口。2结果与分析2.1Scrapy爬虫收集食品安全相关信息在数据搜集阶段项目借助Scrapy框架对食安通()、国家市场监督管理总局、各省*通信作者;基金项目:河南省重点研发与推广专项(科技攻关)项目(202

14、102310295),河南省市场监督管理局科技计划项目(项目编号:2021sj24,2020sj19,2020sj22)125 研究探讨食品工业 2023 年第44卷第 2 期市场监督管理局官网进行收集,共收集20162020年坚果与炒货食品抽检不合格信息登记表1 932条。2.2数据清洗与整理用scrapy框架收集到的坚果与炒货食品数据多为csv表格文件,其内容多包括标称生产企业名称、标称生产企业地址、被抽样单位名称、被抽样单位地址、食品名称、规格型号、商标、生产日期、不合格项目、检验结果、标准值、检验机构、备注等。根据分析需求,序号、商标、备注列没有分析价值,因此利用pandas库读取所有

15、收集到的csv文件并删除这3列。根据标称生产企业地址、被抽样单位地址这2列可以分析出产品的生产地址。根据不合格项目、检验结果、标准值可获得产品不合格项目的分类,因此增加2列,分别为不合格项目分类和产地。并对数据做进一步整理,得到包括产品名称、型号规格、不合格项目分类、不合格项、年份、产地的数据列。2.3数据导入数据库2.3.1数据导入Neo4j数据库该模块借助Neo4j数据库,对食品抽检信息分析模块中的数据进行节点和关系的提取,将基础数据整合成年份、产品类别、不合格产品、不合格项目、不合格项目分类、省份6个节点,依照节点间的关系生成知识图谱json文件,通过Ajax技术在浏览器端生成知识图谱,

16、可以借助图谱更加清晰地看到抽检不合格数据之间的联系。详见图3。图3坚果及炒货食品知识图谱图2.4可视化展示在这个模块中对数据按照地区、名称、年份、超标项目等维度进行统计处理,并且借助ChinaMap,Echarts等前端接口将统计结果以图表的形式返回给用户。从收集的坚果与炒货的数据看,不合格指标分为微生物、污染物、理化指标、食品添加剂4个类别。可视化展示分为7个模块,模块数据可动态更新。2.4.1不合格省份展示各省抽检不合格情况采用3种方式展示,分别为柱状图、地图、扇形图展示,详见图4和图5。从图4和图5中可以直观看出:坚果与炒货食品中不合格样品批次较多的省份为广东,其次为浙江、江苏;不合格样

17、品较多的省份主要集中于南部地区。图4生产省份抽检不合格柱形图图5生产省份抽检不合格扇形图2.4.2各年度不合格情况表该部分展示的为每年度的抽检情况及不合格占比。20162020年,不合格批次较多的为2018年度,其次为2016年度。详见图6。图6抽检不合格批次年度分布表2.4.3不合格产品排名展示该部分展示的为不合格批次较多的食品类别。从收集数据看,坚果与炒货食品不合格批次较多的为鱼皮花生、开心果、花生米等,详见图7。2.4.4超标项目类别排名展示通过此模块,可展示出不合格的主要指标分类,食品工业 2023 年第44卷第 2 期 126 研究探讨从目前收集数据看,坚果与炒货食品中不合格率最高为

18、理化指标,其次为微生物项目。详见图8。图7抽检不合格食品品种图图8抽检不合格项目分类图3结论与讨论通过系统的可视化展示,坚果与炒货食品不合格批次较多的省份主要为广东、浙江、江苏等南部省份,主要是由于南部省份气温较高,坚果与炒货食品作为高蛋白、高油脂的食品,在生产、运输、贮藏及销售过程中,若环境温度或保存不当,易造成酸价、过氧化值超标及微生物超标。从不合格样品看,不合格批次较多的为鱼皮花生。鱼皮花生是以花生、白糖、面粉为原料加工的食品,花生包裹在以面粉和白糖制作的外壳内。鱼皮花生不合格批次较多,有可能是由于该类产品在保存中易造成花生的品质下降,也有可能是生产者在加工时选用品质较差的花生,造成该类

19、产品不合格批次较多。参考文献:1 何欢,陈巧玲,胡康,等.大数据在美国食品安全监管中的应用研究及对我国的启示J.食品安全质量检测学报,2018,9(10):2541-2548.2 国家食品药品监督管理总局.关于“十三五”时期加强食品药品监管网络安全和信息化建设的指导意见Z.2016-07.3 胡芳.“十三五”,让百姓饮食用药安全无忧专访国家食品药品监督管理总局局长毕井泉EB/OL.2017-02-23.ttp:/ 科学技术部.“十三五”食品科技创新专项规划(国科发农2017143号)Z.2017-05-24.5 中华人民共和国中央人民政府.关于深化改革加强食品安全工作的意见EB/OL.2019

20、-05-20.http:/ 国家市场监督管理总局.深化改革创新强化监管服务努力建设适应新发展格局的现代化市场监管体系全国市场监管工作会议在京召开EB/OL.2021-01-08.http:/ 2021-01-20.7 国家市场监督管理总局.关于2020年第三季度食品安全监督抽检情况分析的通告2020年第28号EB/OL.2020-11-11.http:/ 中华人民共和国农业农村部.2020年食用农产品市场监管部门抽检不合格情况EB/OL.2021-01-15.http:/ 2021-01-25.9 曹扬,赵琴,俞淑.我国坚果炒货行业质量调研报告J.质量与标准化,2016(1):37-39.10

21、 申红梅,魏淑萍,李赟,等.食品安全监督抽检质量状况分析J.中国食品工业,2018(11):56-60.11 刘洋,段文锋,赵敏.我国坚果炒货食品质量安全管理现状与建议J.食品工业科技,2013,34(9):272279.12 刘敏,邢书霞,吕冰峰,等.20162018年坚果炒货食品国家食品安全监督抽检结果分析J.食品安全质量检测学报,2020,11(4):1338-1344.13 吕冰峰,吕卓,应雨晴,等.20162017年全国食品安全监督抽检结果分析J.食品安全质量检测学报,2018,9(11):2862-2867.14 韩世鹤,高媛,刘斯琪,等.2019年国家食品安全监督抽检不合格结果分

22、析J.食品安全质量检测学报,2020,11(14):4886-4893.15 祝福松.食品安全信息系统的设计与实现D.北京:北方工业大学,2021.16 易雅鑫,宋自林,尹康银.RDF数据存储模式研究及实现J.情报科学,2007(8):1218-1222.17 王余蓝.图形数据库NEO4J与关系据库的比较研究J.现代电子技术,2012,35(20):77-79.18 王鑫,邹磊,王朝坤,等.知识图谱数据管理研究综述J.软件学报,2019,30(7):2139-2174.19 于合龙,沈金梦,毕春光,等.基于知识图谱的水稻病虫害智能诊断系统J.华南农业大学学报,2021,42(5):105-116.20 肖乐,李家馨,葛亮,等.面向粮情决策支持的知识图谱构建研究J/OL.中国粮油学报,https:/

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 自然科学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报