xx主题数据库介绍(举例).ppt
文本预览下载声明
公用数据元目录 通过公用数据元目录标准的研制: 规范和统一领域内基础性、通用性的数据元; 规范、推动和促进科学数据在语义层面上的共享; 解决数据共享工程中的数据一致性问题; 为建立规范化的领域数据元目录提供方法和实例。 公用数据元目录(医药卫生领域) 一、领域公用数据元目录内容框架 一、领域公用数据元目录内容框架 公用数据元目录(医药卫生领域) 二、数据元描述与标识 二、数据元描述与标识 二、数据元描述与标识 二、数据元描述与标识 二、数据元值的表达方式 公用数据元目录(医药卫生领域) 三、数据元值的表达方式 三、数据元值的表达方式 三、数据元值的表达方式 三、数据元值的表达方式 三、数据元值的表达方式 公用数据元目录(医药卫生领域) 收集本专业数据元(在公共部分之外) 执行数据元的标准化定义(待审核) 制定公用数据元目录的本专业部分 建议补充领域公共数据元 目前,公用数据元目录(1.0版)只完成了公共部分 需要各个专业数据中心的合作完成和补充 * * 医药卫生科学数据共享网总中心 国家科技基础条件平台 医药卫生科学数据共享网 资源体系建设与标准规范建设培训 张业武 资源体系建设课题组 标准规范建设课题组 2008年11月29日 北京 胡 凯 普通用户 定义一个数据元 进行数据元 的属性著录 提交数据元 审核注册机构 完成一个数据元的定义 审核 有问题返回给用户 通过标准化 审核与注册 标准化 数据元库 公用 数据元目录 意义:相同含义的数据元直接使用公用数据元目录中的定义,保证数据的一致性 领域公用数据元目录内容框架 数据元描述与标识 数据元值的表示方法 领域公共数据元目录 与各数据中心的合作与分工 基础是遵循和参考科学数据共享工程的公用数据元目录 去掉与医药卫生领域无关的数据元 增加了医药卫生领域多个专业共同使用的数据元 领域公共 数据元 药学公用 数据元 。。。。。。 基础医学公用 数据元 临床医学 公用数据元 公共卫生公用 数据元 中医药学公用 数据元 内容框架 领域公用数据元目录内容框架 数据元描述与标识 数据元值的表示方法 领域公共数据元目录 与各数据中心的合作与分工 标识符:在数据元目录中,为数据元分配的与语言无关的惟一标识。 名称:数据元的中文名称,是标识数据元的主要手段。 英文名称:数据元的英文全称。 说明:关于数据元的含义和基本特性的说明,并使之区别于其他数据元。 表示:数据元值的数据类型及字符长度的组合表示格式。参见 5。 值域:数据元取值范围或相关内容的说明。如所采用的代码标准,或通过枚举的等方式 给出所有可能的取值。 同义名称:本数据元的其他许用名称。(可选) 相关环境:产生或使用数据元的应用环境的说明。(可选) 版本:数据元所在数据元目录的版本标识。 备注:对数据元的补充说明(可选) 本标准中,数据元是通过标识符、名称、英文名称、说明、表示、值域、同义名称、相关环境、版本、备注这些属性来表达的 1、摘要表示的描述符 2、数据元标识码分配 XX XX XXXX 数据元的大类(公共、基础医学、临床医学等) 数据元的组号(公共数据元中的组,机构人员等) 数据元流水号(最后一位的奇偶代表是否为代码型) 1)数据元大类编号分配 2、数据元标识码分配 MC - 代表医药卫生公共数据元 BM –代表基础医学公用数据元 CM –代表临床医学公用数据元 PH –代表公共卫生公用数据元 TM –代表中医药学公用数据元 PM –代表药学公用数据元 2)组号分配 2、数据元标识码分配 各个大类分别单独分组,排序赋予两位组序号。 对每一个大类的数据元目录来说,保留组号99为其它组。 3)流水号分配 2、数据元标识码分配 使用4 位数字作为数据元的流水号 其中最后一位码的奇偶性决定数据元是否为代码型,非代码型数据元采用偶数标识,紧随其后的奇数用来标识同一概念的代码型数据元。 如:MC010506 代表数据元: 性别 MC010507 代表代码型数据元:性别代码 领域公用数据元目录内容框架 数据元描述与标识 数据元值的表示方法 领域公共数据元目录 与各数据中心的合作与分工 1、数据类型表示方式 表 1 数据类型表示法 采用GB/T7408中规定的 YYYYMMDD、YYYYMMDDThhmmss 格式 日期时间性 T 数字形式表示的数值 数值型 N 可以包含汉字(中、国……等)、字母字符(a-z,A-Z)、数字字符等。(默认 GB 2312 信息交换用汉字编码字符集 基本集) 字符型 S 说明 数据类型 表示符 2、字符长度表示方式 表 2 字符长度表示方式 按固定长度或可
显示全部