1、ICS35.240CCS L 67山东省地方标准DB37/T 4220202037政务信息资源数据标准基本要求Government information resourceData standardBasic requirements2020 - 11 - 26 发布2020 - 12 - 26 实施山东省市场监督管理局发 布FORMTEXT DB37/T FORMTEXT 4220 FORMTEXT 2020I目次前言.II1范围.12规范性引用文件.13术语和定义.14总则.25数据元标准.26数据元值域代码标准.57数据集标准.7附录 A(资料性)大类和小类编码.9参考文献.10FORM
2、TEXT DB37/T FORMTEXT 4220 FORMTEXT 2020II前言本文件按照GB/T 1.12020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由山东省大数据局提出、归口并组织实施。本文件起草单位:山东省大数据局、山东省大数据中心、山东新一代标准化研究院有限公司、山东省计算中心(国家超级计算济南中心)。本文件主要起草人:都海明、王伟、石伟、杜晓飞、李德金、傅川、张荣光、李德生、赵一新、吴洪飞、张昭、相树志、张媛、史丛丛。FORMTEXT DB37/T FORMTEXT 4220
3、 FORMTEXT 20201政务信息资源数据标准基本要求1范围本文件规定了政务信息资源数据标准的内容结构和属性描述要求。本文件适用于政务信息资源数据元、数据元值域代码和数据集标准的制定与使用。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。 其中, 注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 2312信息交换用汉字编码字符集基本集GB/T 7408数据元和交换格式信息交换日期和时间表示法GB/T 19488.12004电子政务数据元第1部分:设计和管理规范3术语和定义下列术语和定义
4、适用于本文件。3.1政务信息资源government information resources政务部门在履行职责过程中制作或获取的,以一定形式记录、保存的各类信息资源。注:包括政务部门直接或通过第三方依法采集的、依法授权管理的和因履行职责需要依托政务信息系统形成的信息资源等。3.2数据data信息的可再解释的形式化表示,以适用于通信、解释或处理。注:可以通过人工或自动手段处理数据。来源:GB/T 5271.12000,01.01.023.3数据元data element用一组属性规定其定义、标识、表示和允许值的数据单元。来源:GB/T 18391.12009,3.3.83.4值域value
5、domain允许值的集合。来源:GB/T 18391.12009,3.3.383.5代码code表示特定事物或概念的一个或一组字符。注:这些字符可以是阿拉伯数字、拉丁字母或便于人和机器识别与处理的其他符号。FORMTEXT DB37/T FORMTEXT 4220 FORMTEXT 20202来源:GB/T 101132003,2.2.53.6数据集data set数据记录汇聚的数据形式。来源:GB/T 352952017,2.1.463.7约束constraint显示一个属性是始终出现还是有时出现的描述符。注:该描述符可以有两个取值:必选或可选,必选表示该属性必须出现,可选表示该属性可以出现
6、,也可以不出现。4总则政务信息资源数据标准主要包括数据元标准、数据元值域代码标准、数据集标准。数据元标准,规范政务信息资源的基础数据单元; 数据元值域代码标准, 规范政务信息资源中一个或多个数据项的允许值;数据集标准,规范政务信息资源各种属性和特征的数据集合。数据元标准、数据元值域代码标准应配套使用,共同支撑数据集标准的制定,并根据数据集标准扩展情况补充优化。标准间逻辑关系见图1。图 1标准间逻辑关系5数据元标准5.1内容结构数据元标准应包括封面、目次、前言、名称、范围、规范性引用文件、术语和定义、总则和各类数据元,内容结构见图2。其中,总则应给出数据元的属性描述,各类数据元应符合数据元的属性
7、描述要求,具体要求见5.2。FORMTEXT DB37/T FORMTEXT 4220 FORMTEXT 20203图 2数据元标准内容结构5.2数据元属性描述5.2.1概述数据元的属性描述统一规定采用7项属性,见表1。表 1数据元属性序号数据元属性名称约束1中文名称必选2数据元标识符必选3定义必选4数据类型必选5数据格式必选6值域必选7备注可选5.2.2中文名称中文名称是赋予数据元属性的标记,名称应唯一,以字符串形式表示。5.2.3数据元标识符数据元标识符采用四段式编码,编码结构见图3。FORMTEXT DB37/T FORMTEXT 4220 FORMTEXT 20204图 3数据元标识符
8、编码结构数据元标识符的编码规则如下:a)第一段:第 12 位,由 2 位大写字母“DE”组成,DE 是 Data Element 的缩写,标识数据元;b)第二段:第 35 位,由 3 位数字组成,标识数据元的大类类目,从 001 开始顺序编码,取值范围 001999;c)第三段:第 67 位,由 2 位数字组成,标识数据元的小类类目,编码范围 0199,如无分类,用 00 标识;d)第四段:第 810 位,由 3 位数字组成,标识数据元的顺序号,从 001 开始顺序编码,取值范围 001999。大类和小类编码参见附录A。5.2.4定义描述一个数据元的本质特性并使其区别于所有其他数据元的陈述。5
9、.2.5数据类型数据类型描述要求应符合GB/T 19488.12004中5.5.2,见表2。表 2数据类型数据类型说明字符型通过字符形式表达的值的类型数字型通过从“0”到“9”数字形式表达的值的类型日期型通过 YYYYMMDD 或 YYYY-MM-DD 的形式表达的值的类型,应符合 GB/T 7408日期时间型通过 YYYYMMDD hhmmss 或 YYYY-MM-DD hh:mm:ss 的形式表达的值的类型,应符合 GB/T 7408布尔型两个且只有两个表明条件的值,如 On/Off、True/False二进制上述无法表示的其他数据类型,如图像、音频、视频、文件等5.2.6数据格式数据格式
10、描述要求符合GB/T 19488.12004中5.5.3,见表3。FORMTEXT DB37/T FORMTEXT 4220 FORMTEXT 20205表 3数据格式符号符号说明a字母字符n数字字符an字母数字字符m(m 为自然数)定长 m 个字符(字符集默认为 GB/T 2312).ul长度不确定的文本.p,q(p,q 均为自然数)最长 p 个数字字符,小数点后 q 位.从最小长度到最大长度,前面附加最小长度,后面附加最大长度YYYYMMDD hhmmss 或 YYYY-MM-DDhh:mm:ss“YYYY”表示年份, “MM”表示月份, “DD”表示日期, “hh”表示小时, “mm”表
11、示分钟, “ss”表示秒,可视实际情况组合使用示例 1:an5(aannn)表示定长 5 个字母数字字符,前 2 个为字母字符,后 3 个为数字字符示例 2:n.17,2表示最长 17 个字符(不含小数点),其中小数点后 2 位示例 3:an3.8表示最大长度为 8,最小长度为 3 的不定长字母数字字符5.2.7值域根据相应属性中所规定的数据类型、数据格式而决定的数据元允许值的集合。5.2.8备注数据元的附加注释说明。6数据元值域代码标准6.1内容结构数据元值域代码标准应包括封面、目次、前言、名称、范围、规范性引用文件、术语和定义、总则和各类值域代码,内容结构见图4。其中,总则应给出数据元值域
12、代码的属性描述,各类值域代码应符合数据元值域代码的属性描述要求,具体要求见6.2。图 4数据元值域代码标准内容结构FORMTEXT DB37/T FORMTEXT 4220 FORMTEXT 202066.2数据元值域代码属性描述6.2.1概述数据元值域代码的属性描述统一规定采用4项属性,见表4。表 4值域代码属性序号值域代码属性名称约束1值域代码标识符必选2代码名称必选3说明必选4表示必选6.2.2值域代码标识符值域代码标识符采用四段式编码,编码结构见图5。图 5值域代码标识符编码结构值域代码标识符的编码规则如下:a)第一段:第 12 位,由 2 位大写字母“CS”组成,CS 是 Code
13、Set 的缩写,标识代码集合;b)第二段:第 35 位,由 3 位数字组成,标识值域代码的大类类目,从 001 开始顺序编码,取值范围 001999;c)第三段:第 67 位,由 2 位数字组成,标识值域代码的小类类目,编码范围 0199,如无分类,用 00 标识;d)第四段:第 810 位,由 3 位数字组成,标识值域代码的顺序号,从 001 开始顺序编码,取值范围 001999。大类和小类编码参见附录A。6.2.3代码名称代码名称是赋予值域代码的标记,名称应唯一,以字符串形式表示。6.2.4说明描述一个值域代码的本质特征并区别于所有其他值域代码的陈述。6.2.5表示描述值域代码的数据格式,
14、具体规定符合5.2.6。FORMTEXT DB37/T FORMTEXT 4220 FORMTEXT 202077数据集标准7.1内容结构数据集标准应包括封面、目次、前言、名称、范围、规范性引用文件、术语和定义、总则和各类数据集,内容结构见图6。其中,总则应给出数据集的属性描述,各类数据集应符合数据集的属性描述要求,具体要求见7.2。图 6数据集标准内容结构7.2数据集属性描述7.2.1概述数据集的属性描述统一规定采用7项属性,见表5。表 5数据集属性序号数据集属性名称约束1数据项名称必选2数据项定义必选3数据类型及格式必选4数据元标识符必选5值域代码标识符必选6数据来源必选7备注可选7.2.
15、2数据项名称数据项名称是赋予数据项属性的标记,名称应唯一,以字符串形式表示。7.2.3数据项定义描述一个数据项的本质特性并使其区别于所有其他数据项的陈述。7.2.4数据类型及格式FORMTEXT DB37/T FORMTEXT 4220 FORMTEXT 20208数据项的数据类型及数据格式说明,具体规定符合5.2.5和5.2.6。7.2.5数据元标识符数据元标准中,与该数据项对应的数据元标识符,具体规定符合5.2.3。7.2.6值域代码标识符数据元值域代码标准中,与该数据项对应的值域代码标识符,具体规定符合6.2.2。7.2.7数据来源数据项的来源单位或部门的简称,可参考鲁政办字201820
16、3号。7.2.8备注数据项的附加注释说明。FORMTEXT DB37/T FORMTEXT 4220 FORMTEXT 20209AA附录A(资料性)大类和小类编码大类和小类的类目名称及编码见表A.1。表 A.1 类目名称及编码序号类目代码类目说明1001人口200101出生登记信息300102户籍人口信息400103流动人口信息500104婚姻登记信息600105养老保险信息700106医疗保险信息800107失业保险信息900108工伤保险信息1000109生育保险信息1100110死亡信息1213002法人单位1400201企业登记信息1500202社会组织登记信息1600203机关事业单位登记信息171819999其他FORMTEXT DB37/T FORMTEXT 4220 FORMTEXT 202010参考文献1GB/T 5271.12000信息技术词汇第1部分:基本术语2GB/T 101132003分类与编码通用术语3GB/T 18391.12009信息技术元数据注册系统(MDR)第1部分:框架4GB/T 352952017信息技术大数据术语5国家发展改革委、中央网信办.关于印发的通知:发改高技20171272A/OL.(2017-6-30)2020-08-28.http:/