1、 ICS 35.020 L 78 DB52 贵州省地方标准 DB52/T 14072019 政府数据 开放数据核心元数据 Governmental data-Core metadata for open data 2019 - 04 - 30 发布 2019 - 11 - 01 实施贵州省市场监督管理局 发 布 DB52/T 14072019 I 目 次 前言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 缩略语 . 2 5 开放数据框架 . 2 6 基本信息 . 3 7 扩展信息 . 10 DB52/T 14072019 II 前 言 本标准按照GB/T
2、 1.12009标准化工作导则 第1部分:标准的结构和编写给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本标准由贵阳市大数据发展管理局提出。 本标准由贵州省大数据标准化技术委员会归口。 本标准起草单位:贵阳市信息产业发展中心、贵阳市大数据发展管理局、贵州省机械电子产品质量监督检验院、中国电子技术标准化研究院、云上贵州大数据产业发展有限公司、贵州中软云上数据技术服务有限公司、中电科大数据研究院有限公司、贵州师范大学、深圳太极云软技术股份有限公司。 本标准主要起草人:曹谦、黄明峰、刘军、林丽建、李祥、赵小创、张群、卫凤林、禹忠、秦晓东、陈贵平、耿
3、小璐、袁世智、戚婉君、熊娅孜、程序、刘春泉。 DB52/T 14072019 1 政府数据 开放数据核心元数据 1 范围 本标准规定了政府数据开放数据核心元数据的框架、基本信息和扩展信息。 本标准适用于贵州省政府数据开放数据的管理和应用。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。 凡是注日期的引用文件, 仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 7408 数据元和交换格式信息交换 日期和时间表示法 DB52/T 1123 政府数据 数据分类分级指南 DB52/T 1124 政府数据资源目录 第1部分:元数据描述
4、规范 RFC 2396 统一资源标识符:一般句法(Uniform resource identifiers(URI):Generic syntax) 3 术语和定义 下列术语和定义适用于本文件。 3.1 数据资源 information resource 在政治、经济和社会等各领域产生和使用、具有各种载体形式的信息内容。 3.2 元数据 metadata 定义和描述其他数据的数据。 GB/T 18391.12009,定义3.2.16 3.3 元数据元素 metadata element 元数据的基本单元。 GB/T 197102005,定义46 注:元数据元素在元数据实体中是唯一的。 DB52
5、/T 14072019 2 3.4 元数据实体 metadata entity 一组说明信息资源相关特性的元数据元素。 GB/T 197102005,定义47 注:可以包台一个或一个以上元数据实体。 3.5 核心元数据 core metadata 描述信息资源基本属性的元数据元素和元数据实体。 3.6 开放数据 open data 可为其他数据使用的数据。 GB/T 352952017,定义2.1.44 4 缩略语 下列缩略语适用于本文件。 API:应用程序编程接口(Application Programming Interface) 5 开放数据框架 5.1 元数据属性 开放数据的元数据属性
6、包括:标识符、中文名称、字段名称、定义、数据类编号、数据类名称、数据类型、表示格式、值域、提供方式和备注,属性定义应符合DB52/T 1124的规定。 5.2 标识符命名规则 标识符由数据类编号和顺序码共8位数字组成。数据类编号由一级代码和二级代码共5位数字组成,顺序码由3位数字组成。标识符命名规则图见图1。编码规则如下: a) 一级代码:由 2 位数字组成,06 代表开放数据; b) 二级代码:由 3 位数字组成,000 代表基本信息、100 代表扩展信息; c) 顺序码:由 3 位数字组成,范围 001999,代表数据资源序号。 DB52/T 14072019 3 图1 标识符命名规则图
7、5.3 关系图 开放数据分为基本信息和扩展信息两大类。基本信息中的数据类编号为06000,扩展信息中的数据类编号为06100。开放数据关系图见图2。 图2 开放数据关系图 6 基本信息 6.1 数据资源标识符 标识符:06000001。 中文名称:数据资源标识符。 字段名称:SJZYBSF。 定义:数据资源的唯一标识。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.2 数据集名称 标识符:06000002。 中文名称:
8、数据集名称。 开放数据 06 基本信息 06000 扩展信息 06100 顺序码,3 位数字 二级代码,3 位数字 一级代码,2 位数字 DB52/T 14072019 4 字段名称:SJJMC。 定义:开放数据集的名称。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.3 摘要 标识符:06000003。 中文名称:摘要。 字段名称:ZY。 定义:对信息资源内容进行概要说明的文字。 数据类编号:06000。 数据类名称
9、:基本信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.4 关键字 标识符:06000004。 中文名称:关键字。 字段名称:GJZ。 定义:描述信息资源主题的词语。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.5 主题分类 标识符:06000005。 中文名称:主题分类。 字段名称:Z
10、TFL。 定义:数据资源按主题的归类。 数据类编号:06000。 数据类名称:基本信息。 DB52/T 14072019 5 数据类型:字符串。 表示格式:c.100。 值域:采用DB52/T 1123中的分类。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.6 行业分类 标识符:06000006。 中文名称:行业分类。 字段名称:HYFL。 定义:数据资源按行业的归类。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.100。 值域:采用DB52/T 1123中的分类。 提供方式:包括
11、但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.7 服务分类 标识符:06000007。 中文名称:服务分类。 字段名称:FWFL。 定义:数据资源按服务的归类。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.100。 值域:采用DB52/T 1123中的分类。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.8 资源提供单位名称 标识符:06000008。 中文名称:资源提供单位名称。 字段名称:ZYTGDWMC。 定义:数据资源
12、提供单位名称。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 DB52/T 14072019 6 备注:无。 6.9 资源提供单位编码 标识符:06000009。 中文名称:资源提供单位编码。 字段名称:ZYTGDWBM。 定义:数据资源提供方的单位编码。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接
13、” “推送”或“交换库”。 备注:无。 6.10 资源提供单位地址 标识符:06000010。 中文名称:资源提供单位地址。 字段名称:ZYTGDWDZ。 定义:数据资源提供单位的实际地址。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.50。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.11 资源提供单位联系电话 标识符:06000011。 中文名称:资源提供单位联系电话。 字段名称:ZYTGDWLXDH。 定义:数据资源提供单位的联系电话。 数据类编号:06000。
14、数据类名称:基本信息。 数据类型:字符串。 表示格式:c.20。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.12 资源维护单位名称 标识符:06000012。 DB52/T 14072019 7 中文名称:资源维护单位名称。 字段名称:ZYWHDWMC。 定义:负责数据资源维护的单位名称。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.30。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6
15、.13 开放属性 标识符:06000013。 中文名称:开放属性。 字段名称:KFSX。 定义:数据资源对外开放的属性。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.5。 值域:“无条件开放”“依申请有条件开放”“不予开放”。 提供方式:包括但不限于“API 获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.14 开放方式 标识符:06000014。 中文名称:开放方式。 字段名称:KFFS。 定义:数据资源对外开放的形式。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.5。 值
16、域:“主动开放”“依申请开放”。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.15 更新频率 标识符:06000015。 中文名称:更新频率。 字段名称:GXPL。 定义:数据资源更新的频率。 数据类编号:06000。 DB52/T 14072019 8 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.5。 值域:实时、周、月、季度、半年、年、不定期、不更新。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.16 最新修改日期 标识符:060
17、00016。 中文名称:新修改日期。 字段名称:XXGRQ。 定义:最近一次修改信息资源的日期。 数据类编号:06000。 数据类名称:基本信息。 数据类型:日期。 表示格式:d8。 值域:采用GB/T 7408规定的日历日期。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:按年、月、日顺序,格式为8位定长、全数字表示(YYYYMMDD)。年用4位数字表示,月、日各用2位数字表示,彼此之间没有分隔符。 6.17 发布日期 标识符:06000017。 中文名称:发布日期。 字段名称:FBRQ。 定义:发布信息资源的日期。 数据类编号:
18、06000。 数据类名称:基本信息。 数据类型:日期。 表示格式:d8。 值域:采用GB/T 7408规定的日历日期。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:按年、月、日顺序,格式为8位定长、全数字表示(YYYYMMDD)。年用4位数字表示,月、日各用2位数字表示,彼此之间没有分隔符。 6.18 所属行政事项 标识符:06000018。 中文名称:所属行政事项。 字段名称:SSXZSX。 定义:采集或产生数据涉及的行政职权。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 DB52/T 14072019
19、 9 表示格式:c.10。 值域:行政许可、行政处罚、行政强制、行政征收、行政给付、行政检查、行政确认、行政奖励、行政裁决、其他权利、公共服务、无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.19 资源状态 标识符:06000019。 中文名称:资源状态。 字段名称:ZYZT。 定义:数据资源所处的生命周期阶段。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.5。 值域:激活、历史、失效。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交
20、换库”。 备注:无。 6.20 语言 标识符:06000020。 中文名称:语言。 字段名称:YY。 定义:数据资源的语言种类。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.20。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.21 文件大小 标识符:06000021。 中文名称:文件大小。 字段名称:WJDX。 定义:数据资源的存储容量大小。 数据类编号:06000。 数据类名称:基本信息。 数据类型:数值。 表示格式:n。 值域:无。 提供方式:包括但不限于“API获
21、取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 DB52/T 14072019 10 备注:无。 6.22 所属行政区域 标识符:06000022。 中文名称:所属行政区域。 字段名称:SSXZQY。 定义:采集或产生数据涉及的行政区域。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.10。 值域:贵州省行政区划。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 6.23 数据资源格式 标识符:06000023。 中文名称:数据资源格式。 字段名称:SJZYGS。 定义
22、:数据资源的对外发布的格式类型。 数据类编号:06000。 数据类名称:基本信息。 数据类型:字符串。 表示格式:c.10。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:格式包括xls、csv、xml、json、rdf、zip、txt、jpg等。 7 扩展信息 7.1 资源链接地址 标识符:06100001。 中文名称:资源链接地址。 字段名称:ZYLJDZ。 定义:可以获取数据资源的有效网络地址。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:无。 值域:自由文本,按RFC 2396
23、规定。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 DB52/T 14072019 11 7.2 关联业务事项 标识符:06100002。 中文名称:关联业务事项。 字段名称:GLYWSX。 定义:采集或产生该数据的业务名称。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:无。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 7.3 采集依据 标识符:06100003。 中文名称:采集依据。 字段名称:CJYJ。
24、定义:数据采集或产生依据的相关政策。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:无。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 7.4 参照标准及指标 标识符:06100004。 中文名称:参照标准及指标。 字段名称:CZBZJZB。 定义:原始数据建立参照的相关国家、行业标准或相关指标。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:无。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或
25、“交换库”。 备注:无。 7.5 来源系统 标识符:06100005。 中文名称:来源系统。 DB52/T 14072019 12 字段名称:LYXT。 定义:数据集来源的应用系统名称。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:无。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 7.6 时间范围 标识符:06100006。 中文名称:时间范围。 字段名称:SJFW。 定义:数据集在时间上的跨度。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:日期。 表示格式:d
26、8。 值域:采用GB/T 7408规定的日历日期。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:按年、月、日顺序,格式为8位定长、全数字表示(YYYYMMDD)。年用4位数字表示,月、日各用2位数字表示,彼此之间没有分隔符。 7.7 空间范围 标识符:06100007。 中文名称:空间范围。 字段名称:KJFW。 定义:数据集在空间上的跨度。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送
27、”或“交换库”。 备注:无。 7.8 文件数量 标识符:06100008。 中文名称:文件数量。 字段名称:WJSL。 定义:数据集包含的数据文件数量。 数据类编号:06100。 DB52/T 14072019 13 数据类名称:扩展信息。 数据类型:数值。 表示格式:n。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 7.9 条目数量 标识符:06100009。 中文名称:条目数量。 字段名称:TMSL。 定义:数据集包括的结构化数据的条目数量。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:数值。
28、 表示格式:n。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:无。 7.10 数据量 标识符:06100010。 中文名称:数据量。 字段名称:SJL。 定义:数据集的容量或者价值量。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:c.10。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:通过“行列”来计算,即“数据行数数据字段数”,体现数据价值密度的值。 7.11 数据项中文名称 标识符:06100011。 中
29、文名称:数据项中文名称。 字段名称:SJXZWMC。 定义:数据项的中文名称。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 DB52/T 14072019 14 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:描述电子表格、数据库、以及具有结构化数据内容的各数据项的标题。 7.12 数据项字段名称 标识符:06100012。 中文名称:数据项字段名称。 字段名称:SJXZDMC。 定义:数据项的字段名称缩写。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符
30、串。 表示格式:c.50。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:结构化数据。 7.13 数据项定义 标识符:06100013。 中文名称:数据项定义。 字段名称:SJXDY。 定义:数据项的定义描述。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:结构化数据。 7.14 数据项数据类型 标识符:06100014。 中文名称:数据项数据类型。 字段
31、名称:SJXSJLX。 定义:数据项的数据类型。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:结构化数据。 DB52/T 14072019 15 7.15 数据项值域 标识符:06100015。 中文名称:数据项值域。 字段名称:SJXZY。 定义:数据项的取值范围。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:结构化数据。 7.16 数据项表示格式 标识符:06100016。 中文名称:数据项表示格式。 字段名称:SJXBSGS。 定义:数据项的表示格式。 数据类编号:06100。 数据类名称:扩展信息。 数据类型:字符串。 表示格式:c.100。 值域:无。 提供方式:包括但不限于“API获取” “数据库封装” “文件” “网页链接” “推送”或“交换库”。 备注:结构化数据。 _ DB52/T 1407-2019