收藏 分享(赏)

WST 305—2023 卫生健康信息数据集元数据标准.pdf

上传人:wrn 文档编号:22745761 上传时间:2024-07-25 格式:PDF 页数:29 大小:364.03KB
下载 相关 举报
WST 305—2023 卫生健康信息数据集元数据标准.pdf_第1页
第1页 / 共29页
WST 305—2023 卫生健康信息数据集元数据标准.pdf_第2页
第2页 / 共29页
WST 305—2023 卫生健康信息数据集元数据标准.pdf_第3页
第3页 / 共29页
WST 305—2023 卫生健康信息数据集元数据标准.pdf_第4页
第4页 / 共29页
WST 305—2023 卫生健康信息数据集元数据标准.pdf_第5页
第5页 / 共29页
亲,该文档总共29页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、ICS 11.020CCS C07中 华 人 民 共 和 国 卫 生 行 业 标 准WS/T 3052023代替 WS/T 305-2009卫生健康信息数据集元数据标准Metadata specification of health information dataset2023-08-07 发布2024-02-01 实施中华人民共和国国家卫生健康委员会发布WS/T 305-20231前言本标准为推荐性标准。本标准代替WS/T 3052009 卫生信息数据集元数据规范。与WS/T 3052009相比,主要为编辑性修改。本标准由国家卫生健康标准委员会卫生健康信息标准专业委员会负责技术审查和技术咨

2、询,由国家卫生健康委统计信息中心负责协调性和格式审查,由国家卫生健康委规划发展与信息化司负责业务管理、法规司负责统筹管理。本标准起草单位:中国人民解放军总医院、国家卫生健康委统计信息中心、中国人民解放军空军军医大学。本标准主要起草人:刘丽华、王珊、张黎黎、李林、王霞、刘建超、胡建平。WS/T 305-20231卫生健康信息数据集元数据标准1范围本标准规定了数据集元数据内容框架、卫生健康信息数据集核心元数据、卫生健康信息数据集参考元数据、引用信息与代码表。本标准适用于作为卫生健康信息数据集属性的统一规范化描述,也可用于卫生健康领域针对数据集制定专用元数据标准的依据。2规范性引用文件下列文件中的内

3、容通过文中的规范性引用而构成本标准必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本标准;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本标准。GB/T 2260中华人民共和国行政区划代码GB/T 7408数据元和交换格式信息交换日期和时间表示方法WS/T 306卫生健康信息数据集分类与编码规则RFC 2396统一资源定义符:通用语法3术语和缩略语下列术语和缩略语适用于本标准。3.1术语3.1.1元数据metadata定义和描述其他数据的数据。3.1.2数据集dataset具有一定主题,可以标识并可以被计算机化处理的数据集合。3.1.3元数据元素metadata el

4、ement元数据的基本单元。3.1.4元数据实体metadata entity一组说明数据相同特性的元数据元素。可以包含一个或若干个元数据实体。3.1.5元数据子集metadata section元数据的子集合,由相关的元数据子集和元数据元素组成。3.1.6数据元data elementWS/T 305-20232用一组属性规定其定义、标识、表示和允许值的数据单元。3.2缩略语XML:可扩展标记语言(Extensible Markup Language)4数据集概述4.1数据集基本概念对数据集概念的详细解释可见WS/T 306。4.2卫生健康信息数据集对卫生健康信息数据集的阐述可见 WS/T

5、306。5卫生健康信息数据集元数据概述5.1元数据内容组成卫生健康信息数据集元数据规定了两个层次的元数据内容的集合:核心元数据与参考元数据,其中参考元数据包含了核心元数据,它们之间的内容包含关系见图 1。图 1 核心元数据与参考元数据的内容包含关系5.2元数据结层次构元数据结构:元数据元素、元数据实体和元数据子集。元数据元素是元数据的最基本的信息单元。例如,数据集名称、数据集标识符、元数据创建日期等,是最基本的属性信息单元,用元数据元素来表示。元数据实体是同类元数据元素的集合,用于一些需要组合若干个更加基本的信息来表达的属性。例如“数据集提交和发布方”需要“单位名称”、“联系人”、“联系电话”

6、、“通讯地址”等若干个基本信息来说明,而数据集“关键词说明”需要“关键词”和“词典名称”来说明,对于“数据集提交和发布方”和“关键词说明”这类属性用元数据实体来表示。元数据子集由共同说明数据集某一类属性的元数据元素与元数据实体组成,例如标识信息、内容信息、分发信息等。5.3元数据的摘要描述5.3.1元数据的摘要描述符主要采用摘要描述方法定义和描述卫生健康信息数据集的元数据内容。摘要描述的方法通过表1所列的描述符针对元数据的元素、实体与子集进行定义。“约束”表示一个描述符是“必选”(M),还是“条件选”(C),或者是“可选”(O),摘要描述符见表1。WS/T 305-20233表 1摘要描述符描

7、述符约束备注中文名称M定义M英文名称M数据类型M取值规则C描述元数据元素时必选,描述元数据子集、实体时不选短名M子元素C描述元数据子集、实体时必选,描述元数据元素时不选注解M5.3.2中文名称元数据子集、实体或元素的中文名称,即为核心元数据的元数据实体或元数据元素的中文名称。5.3.3定义描述元数据子集、实体或元素的基本内容,是卫生健康信息数据集某个属性和特征的概念与说明。5.3.4英文名称元数据子集、实体或元数据元素的英文名称,一般使用英文全称。英文名称中,词汇均采用无缝连写。元数据子集与实体英文名称的每个词汇的首字母均为大写,元数据元素英文名称的首词汇全部小写,其余词汇的首字母采用大写。5

8、.3.5数据类型对元数据的有效值域和允许对该值域内的值进行有效操作的规定。元数据实体与元数据子集的数据类型为复合型,元数据元素的数据类型包括为数值型、布尔型、字符串、日期型和复合型等。当元数据元素的数据类型为复合型的时候,表明该元数据元素使用了引用信息中的引用数据类型。引用数据类型是由一组元素组成、能被重复引用的元素集合。例如,“数据集提交和发布方”和“元数据维护方”两个属性,要共同用到“单位名称”、“联系人”、“联系电话”、“通讯地址”、“邮政编码”和“电子邮件地址”这一组子元素来表示,为了表达的方便,卫生健康信息元数据定义了一个叫做“负责方”的数据类型见本标准 9.1.1 条款,供“数据集

9、提交和发布方”和“元数据维护方”进行引用。5.3.6取值规则元数据子集、实体或元素取值方式的说明。5.3.7短名元数据元素、实体或子集的英文缩写名称,具体缩写规则如下:a)短名在本标准范围内必须唯一。b)对存在国际或行业惯用英文缩写词汇的元数据元素或元数据实体,采用惯用英文缩写作短名。c)对于根据英文名称或自定义的短名,在可以保证其(本标准范围中的所有短名范围内)唯一性的情况下取每个词汇的前 3 位字母作为其短名,当如此取词时发现不能够保证短名标识的唯一性时,应当延展取词的位数,通常增加 1 位。如果仍然不能满足唯一性要求,则照此顺延。d)元数据子集、元素和元数据实体的短名中,词汇均采用无缝连

10、写。元数据子集与实体短名WS/T 305-20234中每个词汇的首字母均为大写;元数据元素短名的首词汇全部小写,其余词汇的首字母采用大写。5.3.8子元素子元素是通过一定的表示规则以确定一个元数据实体中包含的下一级的元数据实体或元数据元素。表示规则为:“标识符=表达式”。表达式中各符号的含义见表 2。表 2 表达式的符号含义符号含义=由替换、生成,由组成+与|或(选择)在由“|”分开的两项之中选择其一0a1表示中的元数据元素 a 为可选/条件必选项,且最大出现次数为 1;若为条件必选项,约束/条件参见其注解0an表示中的元数据元素 a 为可选/条件必选项,且最大出现次数为 N;若为条件比选项,

11、约束/条件参见其注解a表示元数据元素 a 为必选项,且最大出现次数为 11an表示中的元数据元素 a 为必选项,且最大出现次数为 N在子元素表示中,中均使用元数据元素或实体的中文名称。例如:子元素:关键词说明=1关键词n+0词典名称15.3.9注解对元数据子集、实体或元素的含义的进一步解释,包括该元数据的约束/条件(必选、可选或条件必选)和最大出现次数。当该元数据为条件必选时,应注明其约束条件。5.3.9.1约束/条件以“必选项”、“可选项”、“条件可选”等文字说明元数据子集、实体或元素是“必须(M)”、“可选(O)”或者“条件可选(C)”。可选元数据子集或元数据实体可以有必选元数据实体或元素

12、。但这些必选的实体或元素只有当上一级的可选子集或实体被选用时才成为必选的;如果上一级的可选元数据子集或实体未被选用,则其所包含的必选实体或元素也不选用。5.3.9.2最大出现次数说明元数据子集、实体或元素可以重复出现的次数。只允许出现一次的用“1”表示,允许重复出现(但重复的次数不是固定值)的用“N”表示。不为 1 的固定出现次数用相应的数字表示,如“2”、“3”、“4”等。5.4适用功能5.4.1数据集元数据著录对具体的卫生健康信息数据集选择元数据内容进行描述时,以核心元数据作为著录(根据必选、可选等约束条件)的基础,然后根据需要可以选择参考元数据的内容进行著录,见图 2:WS/T 305-

13、20235图 2 直接作为著录标准的使用方式用户针对卫生健康信息数据集进行元数据著录的示例,可参照本标准附录 A(以只著录核心元数据内容为例)。5.4.2制定专用标准的依据在卫生健康领域内,以数据集为对象制定专用的元数据标准时,可依照本标准进行制定。所制定的数据集专用元数据标准,必须包含核心元数据的内容,同时将参考元数据的内容作为扩展内容的参考,使用方式见图 3:图 3 作为制定专用标准依据时的使用方式要在卫生健康信息参考元数据的基础上继续进行元数据内容的扩展时,应当符合附录 B 的要求。6元数据内容框架卫生健康信息数据集元数据的全集,即参考元数据的内容规定了7个元数据子集,分别如下:a)元数

14、据标识信息(子集):包含元数据本身的基本信息,如名称、维护方、创建日期等。b)数据集标识信息(子集):包含元数据所描述的数据集的基本信息,包括名称、标识符、提交或发布方等。c)内容信息(子集):内容信息提供数据内容特征的描述信息,包括摘要、特征数据元等。d)分发信息(子集):分发信息包含有关资源分发者的信息以及用户获取资源的途径。e)数据质量信息(子集):数据生产者有关数据集数据志信息的一般说明。f)限制信息(子集):包含对数据集和元数据进行访问和使用的限制信息。g)维护信息(子集):包含关于元数据或数据集的更新频率及更新范围的信息。参照UML类图中聚集关系与依赖关系的表示方法,概要描述了卫生

15、健康信息数据集参考元数据的内容框架(见图4)。WS/T 305-20236图 4 卫生健康信息参考元数据内容构成7个子集是参考元数据这一整体的组成部分,在图4中标记出了各自的可出现次数。元数据标识信息(子集)、数据集标识信息(子集)、限制信息(子集)和维护信息(子集)中有元数据元素使用到了引用信息中由本标准定义的数据类型,所以它们对引用信息存在依赖关系。7卫生健康信息数据集核心元数据7.1概述卫生健康信息核心元数据包括8个必选元数据元素或实体,10个可选元数据元素与实体。卫生健康信息数据集核心元数据内容见表3,其中的第四列“约束”是指该元数据元素或元数据实体是“必选(M)”,或者是“可选(O)

16、”,第五列是说明核心元数据在参考元数据中的相应位置。表 3 卫生健康信息数据集核心元数据内容序号核心元数据内容元素与实体约束在参考元数据中的位置1数据集名称元素M数据集标识信息子集2数据集标识符元素M数据集标识信息子集3数据集摘要元素M内容信息子集4数据集提交或发布方元素M数据集标识信息子集5关键词说明实体M数据集标识信息子集6数据集语种元素M数据集标识信息子集7数据集特征数据元元素O内容信息子集8数据集发布日期元素O发布信息子集9数据集发布格式实体O发布信息子集10在线访问地址元素O发布信息子集11数据集分类实体O数据集标识信息子集12相关环境说明元素O数据集标识信息子集13元数据创建日期元

17、素M元数据标识信息子集14元数据标识符元素M元数据标识信息子集15元数据负责方元素O元数据标识信息子集16元数据标准名称元素O元数据标识信息子集17元数据标准版本元素O元数据标识信息子集18元数据更新日期元素O元数据标识信息子集WS/T 305-202377.2摘要描述7.2.1数据集名称(必选)定义:能够简要描述卫生健康信息数据集主题与内容的标题英文名称:datasetTitle数据类型:字符串取值规则:自由文本短名:dataTitle注解:必选项;最大出现次数为 17.2.2数据集标识符(必选)定义:卫生健康信息数据集的唯一标识符英文名称:datasetIdentifier数据类型:字符串

18、取值规则:按照“提交机构-编号-版本号”的命名规则进行赋值。提交机构使用机构标准名称,版本号用一位整数加两位小数的表示方式,例如“2.10”(版本)。短名:dataID注解:必选项;最大出现次数为 17.2.3数据集摘要(必选)定义:数据集内容的简单说明英文名称:abstract数据类型:字符串取值规则:自由文本短名:abstract注解:必选项;最大出现次数为 17.2.4数据集提交或发布方(必选)定义:提交或发布数据集,并对数据集的真实性、正确性负责的单位或部门英文名称:datasetContact数据类型:复合型取值规则:负责方(见本标准 9.1.1)短名:dataContact注解:必

19、选项;最大出现次数为 N7.2.5关键词说明(必选)定义:关键词种类、类型和参考资料英文名称:DescriptiveKeywords数据类型:复合型短名:DescKeys子 元 素:关键词说明=1关键词n+0词典名称1注解:必选项;最大出现次数为 N7.2.5.1关键词定义:用于描述数据集主题的通用词、形式化词或短语英文名称:keyword数据类型:字符串WS/T 305-20238取值规则:自由文本短名:keyword注解:必选项;最大出现次数为 N7.2.5.2词典名称定义:正式注册的词典名,或类似的权威关键词资料名称英文名称:thesaurusName数据类型:字符型取值规则:自由文本短

20、名:thesaName注解:可选项;最大出现次数为 17.2.6数据集语种(必选)定义:数据集采用的语言英文名称:datasetLanguage数据类型:字符串取值规则:语种代码(见本标准 9.2.1)短名:dataLang注解:必选项;最大出现次数为 N7.2.7数据集特征数据元(可选)定义:卫生健康信息数据集中,能够表达数据集核心内容与特征资源的数据元列举英文名称:characteristicDataElement数据类型:字符串取值规则:自由文本,数据元之间使用英文状态下的逗号分开短名:charaDataEle注解:可选项;最大出现次数为 17.2.8数据集发布日期(可选)定义:卫生健康

21、信息数据集进行提交或发布的日期英文名称:datasetPublicationDate数据类型:日期型取值规则:按照 GB/T 7408-2005 规定,格式应当为 YYYY-MM-DD短名:dataPubDate注解:可选项;最大出现次数为 17.2.9数据集分发格式(可选)定义:分发数据的格式说明英文名称:DistributionFormat数据类型:复合型短名:DistFormat子 元 素:分发格式=分发格式名称+0版本1注解:可选项;最大出现次数为 N7.2.9.1分发格式名称定义:数据集分发格式名称英文名称:formatNameWS/T 305-20239数据类型:字符串取值规则:自

22、由文本,默认为文件扩展名称短名:formName注解:必选项;最大出现次数为 17.2.9.2版本定义:数据集分发格式所对应的软件版本(日期、版本号等)英文名称:formatVersion数据类型:字符串取值规则:自由文本短名:formVer注解:可选项;最大出现次数为 17.2.10在线访问地址(可选)定义:可以对数据集进行在线访问或获取的信息英文名称:online数据类型:字符型取值规则:自由文本,按照 RFC 2396 规定填写短名:online注解:可选项;最大出现次数为 N7.2.11数据集分类(可选)定义:数据集的分类信息英文名称:DatasetCategory数据类型:复合型短名

23、:DataCat子 元 素:数据集分类=类目名称+类目编码+分类标准注解:可选项;最大出现次数为 N7.2.11.1类目名称定义:对应于所使用的某种分类方法所得到的具体类目名称英文名称:categoryName数据类型:字符串取值规则:自由文本短名:cateName注解:必选项;最大出现次数为 17.2.11.2类目编码定义:类别名称对应的编码英文名称:categoryCode数据类型:字符串取值规则:自由文本短名:cateCode注解:必选项;最大出现次数为 17.2.11.3分类标准WS/T 305-202310定义:所依据的分类标准名称英文名称:categroyStandard数据类型:

24、字符串取值规则:自由文本短名:cateStd注解:必选项;最大出现次数为 17.2.12相关环境说明(可选)定义:说明数据集生产的处理环境,包括软件、计算机操作系统、文件名和数据量等英文名称:environmentDescription数据类型:字符串取值规则:自由文本短名:envirDesc注解:可选项;最大出现次数为 17.2.13元数据创建日期(必选)定义:创建、采集元数据的日期英文名称:metadataDateStart数据类型:日期型取值规则:按照 GB/T 7408-2005 规定,格式应当为 YYYY-MM-DD短名:mdDateStart注解:必选项;最大出现次数为 17.2.

25、14元数据标识符(必选)定义:元数据的唯一标识英文名称:metadataIdentifier数据类型:字符串取值规则:在 7.2.2 的数据集标识符取值前加“MD-”字样。短名:mdID注解:必选项;最大出现次数为 1;标识符须唯一、由字母含下划线(_)短划线(-)点(.)斜线(/)逗号(,)和空格()或数字组成7.2.15元数据负责方(可选)定义:提交元数据并对元数据负责的部门和单位英文名称:metadataContact数据类型:复合型取值规则:负责方(见本标准 9.1.1)短名:mdContact注解:可选项;最大出现次数为 N7.2.16元数据标准名称(可选)定义:执行的元数据标准名称

26、英文名称:metadataStandardName数据类型:字符串取值规则:自由文本短名:mdStdName注解:可选项;最大出现次数为 17.2.17元数据标准版本(可选)WS/T 305-202311定义:执行的元数据标准版本英文名称:metadataStandardVersion数据类型:字符串取值规则:自由文本短名:mdStdVer注解:可选项;最大出现次数为 17.2.18元数据更新日期(可选)定义:更新元数据的日期英文名称:metadataDateUpdata数据类型:日期型取值规则:按照 GB/T 7408-2005 规定,格式应当为 YYYY-MM-DD短名:mdDateUpd

27、注解:可选项;最大出现次数为 18卫生健康信息数据集参考元数据8.1元数据根实体卫生健康信息参考元数据由 7 个元数据子集构成,继续采用 5.3 中的规则来对参考元数据的各个子集、实体和元素进行摘要描述。卫生健康信息参考元数据的根实体描述如下:中文名称:元数据(根实体)定义:卫生健康信息数据集参考元数据的根实体英文名称:Metadata数据类型:复合型短名:Metadata子 元 素:元数据=元数据标识信息子集+数据集标识信息子集+内容信息子集+0分发信息子集1+0数据质量信息子集n+0限制信息子集n+0维护信息子集18.2元数据子集8.2.1元数据标识信息子集定义:关于元数据本身的基本信息英

28、文名称:MetadataIdentificationInfo数据类型:复合型短名:MdIDInfo子 元 素:元数据标识信息子集=元数据创建日期+元数据标识符+0元数据负责方n+0元数据更新日期1+0元数据标准名称1+0元数据标准版本1+注解:必选项,最大出现次数为 18.2.1.1元数据创建日期WS/T 305-202312定义:创建、采集元数据的日期英文名称:metadataDateStart数据类型:日期型取值规则:按照 GB/T 7408-2005 规定,格式应当为 YYYY-MM-DD短名:mdDateSt注解:必选项;最大出现次数为 18.2.1.2元数据标识符定义:元数据的唯一标

29、识英文名称:metadataIdentifier数据类型:字符串取值规则:在 7.2.2 的数据集标识符取值前加“MD-”字样。短名:mdID注解:必选项;最大出现次数为 1;标识符须唯一、由字母含下划线(_)短划线(-)点(.)斜线(/)逗号(,)和空格()或数字组成8.2.1.3元数据负责方定义:提交元数据并对元数据负责的部门和单位英文名称:metadataContact数据类型:复合型取值规则:负责方(见本标准 9.1.1)短名:mdContact注解:可选项;最大出现次数为 N8.2.1.4元数据更新日期定义:更新元数据的日期英文名称:metadataDateUpdata数据类型:日期

30、型取值规则:按照 GB/T 7408-2005 规定,格式应当为 YYYY-MM-DD短名:mdDateUpd注解:可选项;最大出现次数为 18.2.1.5元数据标准名称定义:执行的元数据标准名称英文名称:metadataStandardName数据类型:字符串取值规则:自由文本短名:mdStdName注解:可选项;最大出现次数为 18.2.1.6元数据标准版本定义:执行的元数据标准版本英文名称:metadataStandardVersion数据类型:字符串取值规则:元数据标准版本的规范写法短名:mdStdVer注解:可选项;最大出现次数为 18.2.2数据集标识信息子集WS/T 305-20

31、2313定义:元数据所描述的数据集的基本信息英文名称:DatasetIdentificationInfo数据类型:复合型短名:dataIdInfo子 元 素:数据集标识信息子集=数据集名称+数据集标识符+0目的1+0可信度n+1数据集提交或发布方n+1关键词说明n+1数据集语种n+1数据集分类n+0相关环境说明1注解:必选项,最大出现次数为 18.2.2.1数据集名称定义:能够简要描述卫生健康信息数据集主题与内容的标题英文名称:datasetTitle数据类型:字符串取值规则:自由文本短名:dataTitle注解:必选项;最大出现次数为 18.2.2.2数据集标识符定义:卫生健康信息数据集的唯

32、一标识符英文名称:datasetIdentifier数据类型:字符串取值规则:按照“提交机构-编号-版本号”的命名规则进行赋值。提交机构使用机构标准名称,版本号用一位整数加两位小数的表示方式,例如“2.10”(版本)。短名:dataID注解:必选项;最大出现次数为 18.2.2.3目的定义:数据集开发的目的说明英文名称:purpose数据类型:字符串取值规则:自由文本短名:Purp注解:可选项;最大出现次数为 18.2.2.4可信度定义:对数据集中数据内容可靠性的说明英文名称:credit数据类型:字符串取值规则:自由文本短名:Credit注解:可选项;最大出现次数为 NWS/T 305-20

33、23148.2.2.5数据集提交或发布方定义:提交或发布数据集,并对数据集的真实性、正确性负责的单位或部门英文名称:datasetContact数据类型:复合型取值规则:负责方(见本标准 9.1.1)短名:dataContact注解:必选项;最大出现次数为 N8.2.2.6关键词说明定义:关键词种类、类型和参考资料英文名称:DescriptiveKeywords数据类型:复合型短名:DescKeys子 元 素:关键词说明=1关键词n+0词典名称1注解:必选项;最大出现次数为 N8.2.2.6.1关键词定义:用于描述数据集主题的通用词、形式化词或短语英文名称:keyword数据类型:字符串取值规

34、则:自由文本短名:keyword注解:必选项;最大出现次数为 N8.2.2.6.2词典名称定义:正式注册的词典名,或类似的权威关键词资料名称英文名称:thesaurusName数据类型:字符型取值规则:自由文本短名:thesaName注解:可选项;最大出现次数为 18.2.2.7数据集语种定义:数据集采用的语言英文名称:datasetLanguage数据类型:字符串取值规则:语种代码(见本标准 9.2.1)短名:dataLang注解:必选项;最大出现次数为 N8.2.2.8数据集分类定义:数据集的分类信息英文名称:DatasetCategory数据类型:复合型短名:DataCat子 元 素:数

35、据集分类=类目名称+WS/T 305-202315类目编码+分类标准注解:可选项;最大出现次数为 N8.2.2.8.1类目名称定义:对应于所使用的某种分类方法所得到的具体类目名称英文名称:categoryName数据类型:字符串取值规则:自由文本短名:cateName注解:必选项;最大出现次数为 18.2.2.8.2类目编码定义:类别名称对应的编码英文名称:categoryCode数据类型:字符串取值规则:自由文本短名:cateCode注解:必选项;最大出现次数为 18.2.2.8.3分类标准定义:所依据的分类标准名称英文名称:categroyStandard数据类型:字符串取值规则:自由文本

36、短名:cateStd注解:必选项;最大出现次数为 18.2.2.9相关环境说明定义:说明数据集生产的处理环境,包括软件、计算机操作系统、文件名和数据量等英文名称:environmentDescription数据类型:字符串取值规则:自由文本短名:envirDesc注解:可选项;最大出现次数为 18.2.3内容信息子集定义:卫生健康信息数据集内容特征的描述信息英文名称:Content数据类型:复合型短名:Cont子 元 素:内容信息子集=数据集摘要+0 数据集特征数据元1+0 数据获取手段 1+0 数据描述对象 n+注解:必选项,最大出现次数为 18.2.3.1数据集摘要WS/T 305-202

37、316定义:数据集内容的简单说明英文名称:abstract数据类型:字符串取值规则:自由文本短名:abstract注解:必选项;最大出现次数为 18.2.3.2数据集特征数据元定义:卫生健康信息数据集中,能够表达数据集核心内容与特征资源的数据元列举。英文名称:characteristicDataElement数据类型:字符串取值规则:自由文本,数据元之间使用英文状态下的逗号分开。短名:charaDataEle注解:可选项;最大出现次数为 18.2.3.3数据获取手段定义:数据集产生的手段、途径,包括监测、流调、电子病历等英文名称:dataFrom数据类型:字符串取值规则:自由文本短名:data

38、From注解:可选项;最大出现次数为 18.2.3.4数据描述对象定义:数据集所描述的对象,包括环境、食品药品、人群、人体、器官等英文名称:dataTarget数据类型:字符串取值规则:自由文本短名:dataTarget注解:可选项;最大出现次数为 N8.2.4分发信息子集定义:提供数据集的分发格式和分发方式的信息英文名称:DistributionInfo数据类型:复合型短名:DistInfo子 元 素:分发信息子集=0数据集发布格式n+0数据集发布日期n+0在线访问地址n+0离线发布介质n注解:可选项;最大出现次数为 18.2.4.1数据集分发格式定义:分发数据的格式说明英文名称:Distr

39、ibutionFormat数据类型:复合型短名:DistFormat子 元 素:分发格式=WS/T 305-202317分发格式名称+0版本1注解:可选项;最大出现次数为 N8.2.4.1.1分发格式名称定义:数据集分发格式名称英文名称:formatName数据类型:字符串取值规则:自由文本,默认为文件扩展名称短名:formName注解:必选项;最大出现次数为 18.2.4.1.2版本定义:数据集分发格式所对应的软件版本(日期、版本号等)英文名称:formatVersion数据类型:字符串取值规则:自由文本短名:formVer注解:可选项;最大出现次数为 18.2.4.2数据集发布日期定义:卫

40、生健康信息数据集进行提交或发布的日期英文名称:datasetPublicationDate数据类型:日期型取值规则:按照 GB/T 7408 规定,格式应当为 YYYY-MM-DD短名:dataPubDate注解:可选项;最大出现次数为 18.2.4.3在线访问地址定义:可以对数据集进行在线访问或获取的信息英文名称:online数据类型:字符型取值规则:自由文本,按照 RFC 2396 规定填写短名:online注解:可选项;最大出现次数为 N8.2.4.4离线发布介质定义:数据集进行离线发布所使用的介质名称英文名称:mediaName数据类型:字符串取值规则:介质名称代码(见本标准 9.2.

41、2)短名:medName注解:可选项;最大出现次数为 18.2.5数据质量信息子集定义:提供数据集质量的总体评价信息英文名称:DataQualityInfo数据类型:复合型短名:DataQuaInfo子 元 素:数据质量信息子集=数据志说明WS/T 305-202318注解:可选项;最大出现次数为 N8.2.5.1数据志说明定义:数据集生产者对数据源和处理步骤的一般说明英文名称:statement数据类型:字符串取值规则:自由文本短名:statement注解:必选项;最大出现次数为 18.2.6限制信息子集定义:对数据集和元数据进行访问和使用的限制信息英文名称:Data Constraints

42、数据类型:复合型短名:DataConst子 元 素:限制信息子集=0数据集限制信息n+0元数据限制信息n+注解:可选项;最大出现次数为 N8.2.6.1数据集限制信息定义:提供数据集和元数据进行访问和使用的限制信息英文名称:dataset Constraints数据类型:复合型取值规则:限制信息(见本标准 9.1.2)短名:dataConst注解:可选项,最大出现次数 N8.2.6.2元数据限制信息定义:对元数据进行访问和使用的限制信息英文名称:metadata Constraints数据类型:复合型取值规则:限制信息(见本标准 9.1.2)短名:mdConst注解:可选项,最大出现次数 N8

43、.2.7维护信息子集定义:对数据集或元数据进行更新与维护的有关信息英文名称:Maintenance Info数据类型:复合型短名:MaintInfo子 元 素:维护信息=0数据集维护信息1+0元数据维护信息1注解:可选项;最大出现次数为 18.2.7.1数据集维护信息定义:对数据集进行更新与维护的有关信息英文名称:dataset Maintenance Info数据类型:复合型取值规则:数据维护信息(见本标准 9.1.3)WS/T 305-202319短名:dataMaint注解:可选项,最大出现次数为 18.2.7.2元数据维护信息定义:元数据更新与维护的相关信息英文名称:metadataM

44、aintenance数据类型:复合型取值规则:数据维护信息(见本标准 9.1.3)短名:mdMaint注解:可选项,最大出现次数为 19引用信息与代码表9.1引用信息9.1.1负责方定义:负责单位或联系人的相关信息英文名称:Responsible Party数据类型:复合型短名:RespParty注解:可选项;最大出现次数为 N子 元 素:负责方=负责单位名称+0联系人姓名n+0联系电话n+0负责方地址 1+0邮政编码 1+0电子邮件地址 n9.1.1.1负责单位名称定义:负责单位名称英文名称:responsible Organization Name数据类型:字符串取值规则:自由文本短名:r

45、pOrgName注解:必选项;最大出现次数为 19.1.1.2联系人姓名定义:联系人姓名英文名称:responsible Individual Name数据类型:字符串取值规则:自由文本短名:rpIndName注解:可选项;最大出现次数为 N9.1.1.3联系电话定义:可以与负责人或负责单位联系的电话号码英文名称:contact Phone数据类型:字符串取值规则:自由文本短名:cntPhoneWS/T 305-202320注解:可选项;最大出现次数为 N9.1.1.4通讯地址定义:能够进行邮政联系的详细地址英文名称:postalAddress数据类型:字符串取值规则:自由文本短名:postA

46、ddr注解:可选项;最大出现次数为 19.1.1.5邮政编码定义:邮政编码英文名称:postal Code数据类型:字符串取值规则:按 GB/T 2260 的规定短名:postCode注解:可选项;最大出现次数为 19.1.1.6电子邮件地址定义:联系人或负责单位的电子邮件地址英文名称:electronic MailAddress数据类型:字符串取值规则:自由文本短名:eMailAdd注解:可选项;最大出现次数为 N9.1.2限制信息定义:对数据集和元数据的访问、使用以及安全施加的限制和约束英文名称:Constraints数据类型:字符串短名:Consts子 元 素:限制信息=1访问限制|使用

47、限制n+安全限制分级注解:条件必选项;最大出现次数为 N;当不选用“使用限制”时为必选9.1.2.1访问限制定义:为保护隐私权或知识产权,对访问元数据施加的限制和约束英文名称:access Constraints数据类型:字符串取值规则:限制代码(见本标准 9.2.3)短名:accessConsts注解:条件必选项;最大出现次数为 N;当不选用“使用限制”时为必选9.1.2.2使用限制定义:为保护隐私权或知识产权,对使用元数据施加的限制和约束英文名称:use Constraints数据类型:字符串取值规则:限制代码(见本标准 9.2.3)短名:useConsts注解:条件必选项;最大出现次数为

48、 N;当不选用“访问限制”时为必选WS/T 305-2023219.1.2.3安全限制分级定义:对元数据处理限制的名称英文名称:security Classification数据类型:字符串取值规则:安全限制分级代码(见本标准 9.2.4)短名:secuClass注解:必选项;最大出现次数为 19.1.3数据维护信息定义:对数据进行更新与维护的有关信息英文名称:Data Maintenance数据类型:复合型短名:DataMaint子 元 素:数据维护信息=维护和更新频率+0更新范围说明 n+0维护注释n+0维护方联系信息n9.1.3.1维护和更新频率定义:在数据集初次完成后,对其进行修改和补

49、充的频率英文名称:maintenanceAnd Update Frequency数据类型:字符串取值规则:维护频率代码(见本标准 9.2.5)短名:mainFreq注解:必选项;最大出现次数为 19.1.3.2更新范围说明定义:数据集内容更新范围的说明英文名称:update Scope Description数据类型:字符串取值规则:范围代码(见本标准 9.2.6)短名:upScpDesc注解:可选项;最大出现次数为 N9.1.3.3维护注释定义:有关对数据集维护更新的特殊需求信息英文名称:maintenance Note数据类型:字符串取值规则:自由文本短名:maintNote注解:可选项;

50、最大出现次数为 N9.1.3.4维护方联系信息定义:联系负责维护数据集的人和单位的标识和方法英文名称:contact数据类型:复合型WS/T 305-202322取值规则:负责方(见本标准 9.1.1)短名:maintCont9.2代码表9.2.1语种代码表名称(中文)名称(英文)域代码定义语种代码LanguageCodeLangCd1zh-HKzh-HK0 x0C04中文-中国香港特别行政区2zh-MOzh-MO0 x1404中文-中国澳门特别行政区3zh-CNzh-CN0 x0804中文-中国4zh-CHSzh-CHS0 x0004中文(简体)5zh-SGzh-SG0 x1004中文-新加

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 工程资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报