您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 原子能技术 > 核心元数据标准及其应用
核心元数据标准(SDBCM)及其应用胡良霖中科院计算机网络信息中心2004.8.25北京科学数据库技术培训目录•科学数据库元数据框架体系•科学数据库核心元数据标准(SDBCM)•科学数据库核心元数据标准的应用1.科学数据库元数据标准框架体系核心元数据标准特定资源类型标准学科领域标准建库单位应用方案学科相关资源类型相关科学数据库元数据标准框架1.科学数据库元数据标准框架体系•科学数据库元数据标准体系研究成果–科学数据库核心元数据标准•三个版本:1.0版、1.1版、2.0版–基于SDBCM的主体数据库元数据应用方案1.0版–生态研究元数据标准1.1版•生态研究元数据国家标准进行中–大气数据元数据标准1.0版–多媒体元数据标准•图像通用元数据规范(草案)•视频资源元数据规范(进展中)•音频资源元数据规范(进展中)学科相关应用方案类型相关应用方案2.科学数据库核心元数据标准•SDBCM发展历程•SDBCM的内容–修订内容–唯一标识符命名规范–数据集元数据–服务元数据2.科学数据库核心元数据标准•SDBCM发展历程时间工作2001.06-2002.06调研,启动前期准备工作2002.06-2002.09研究启动,并提出草案2002.10-2003.05草案完善,发布标准1.0版2003.06-2003.08修订1.0版,发布标准1.1版2004.03-2004.08修订1.1版,发布标准2.0版2.科学数据库核心元数据标准•标准的研究、修订完善思路–科学数据库项目的需求–对国内外元数据成果和发展趋势的研究–融合信息技术领域的最新研究成果–兼顾标准在高于项目层面上的普遍使用性•本次修订前有目的的进行了用户调查–调查对象为项目内各单位–调查内容全面–反馈结果•总体上肯定了前述标准的实用性,但也反映了存在的问题2.科学数据库核心元数据标准•本次修订主要内容–规范了数据集URI命名规则、服务URI命名规则–增加“质量信息”模块–在“范围信息”模块中增加了“垂向信息”–独立描述服务元数据•服务描述通用模型•科学数据库数据集服务实例–增删了个别元素,修订了部分元素的有关属性2.科学数据库核心元数据标准•数据集唯一标识命名规则–基础事实•在线服务资源均有注册的Internet域名•项目内各主体数据库已拥有注册分配的域名–方法•把已注册的网络域名“反向”解析构造其数据集标识主部,而后续辅部可以根据需要灵活的自主为资源命名–标识字符组成:•26个英文字母,不区分大小写;•0,1,2,3,4,5,6,7,8,9十个数字;•“-”(英文中的连词号)。2.科学数据库核心元数据标准DatasetURI:=顶级域名标识.二级域名标识…终级域名标识[.数据集实体标识]•科学数据库项目内数据集URI命名:DatasetURI:=cn.csdb.三级域名[.数据集实体标识]标识符主部标识符辅部标识符主部标识符辅部2.科学数据库核心元数据标准•项目内三级域名标识均已注册,并分配使用•辅部(四级及以下级别)标识即数据集实体标识,有注册用户单位内部控制使用–保证内部标识唯一,不冲突–向科学数据库中心备案•示例–纳米科技基础主体数据库的数据集URI为“cn.csdb.nano”–化学专业主体库中药物与天然产物数据子库下的专利信息子集的数据集URI可为“cn.csdb.organchem.medicament.patent”。2.科学数据库核心元数据标准•服务标识命名规则–采取和数据集唯一标识命名规则同样的思路•科学数据库项目内数据集URI命名:ServiceURI:=sdbs://+IdentityofServiceProvider/service/Service-type/Service-namesdbs标识服务的归属来源,表示科学数据库项目内所定义的各种服务统一分配的项目内所有主体数据库的域名服务类型,当前有dbms、、iddleware、grid、ftp五类服务提供者自行命名,可以是由“/”分隔的层次名字空间示例:微生物所的网格服务之数据查询服务标识可命名为:sdbs://micro.csdb.cn/service/grid/dataquery2.1SDBCM总体结构和说明数据集描述信息数据集质量信息数据集分发信息元数据参考信息服务参考信息结构描述信息覆盖信息联系信息辅助模块2.1SDBCM总体结构和说明XMLSchema描述:xs:elementname=DataSetxs:complexTypexs:sequencexs:elementref=DatasetDescriptionInfo/xs:elementref=DQInfominOccurs=0/xs:elementref=DistributionInfominOccurs=0/xs:elementref=MetadataReferenceInfo/xs:elementref=ServiceReferenceInfominOccurs=0/xs:elementref=StructureDescriptionInfominOccurs=0//xs:sequence/xs:complexType/xs:element描述信息元数据数据集描述信息数据集名称数据集中文名称中国水资源属性数据库数据集别名TabularWaterResourcesDatabaseofChina数据集标识cn.csdb.naturalresources.water主题学科主题词主题词降水主题词地表水::主题词水资源评价主题词水资源利用主题词表《资源科学主题词典》(施慧中主编,中国科学技术出版社,1991年出版)自由关键词降水自由关键词水资源::自由关键词水利工程自由关键词径流•记录科学数据库数据集资源基本的内、外部特征•引用“范围信息”模块•可与DC、CSDGM通过映射交换元数据描述中国水资源属性数据库记录了中国全国范围内分省区、流域、城市、水资源利用分区、流域、水利工程和水文站的水文水资源数据,包括水资源数量、水资源开发利用情况、水利工程情况、水文径流等资料......目的水是一种可重复使用的重要的自然资源,人口增长和经济发展对水资源的需求不断扩大。我国部分地区,特别是北方地区,水资源供求矛盾日益严重,水资源供给短缺已经成为我国可持续发展的一大瓶颈。建立中国水资源数据库对于了解我国水资源现状、分布、开发利用状况、实现社会经济的可持续发展具有重要意义......类型关系型数据库数据量记录数21669存储量10M数据来源中华人民共和国水利部;中华人民共和国建设部;《水资源研究》;相关课题。数据集提供者地理科学与资源研究所数据集贡献者中华人民共和国水利部(数据源);中华人民共和国建设部(数据源);《水资源研究》(数据源);相关课题(数据源);李泽辉(数据集设计、数据源选择及数据采集);向世芳(数据录入)更新频率每年数据集时间创建时间1987-12-31最近修改时间2003-08-10语种汉语url关联数据集关联数据集名称中国自然资源数据库关联类型父数据集关联URL*本实例参考了中科院地理所李泽辉老师提供的元数据记录数据集质量信息元数据数据日志质量报告日志联系人日志描述处理步骤处理因由处理描述处理时间数据集质量信息元数据•数据志(数据采集、生产、整理等过程中有关信息的日志记录)–数据志描述–处理步骤•理由•处理描述•处理时间–日志联系人•数据质量报告链接指向数据集的数据质量评测行为或评测结果等有关信息、文档等的地址信息数据集分发信息元数据•帮助用户了解如何访问和获取所需的数据集资源及其他相关信息元数据参考信息元数据•帮助用户了解与元数据记录有关的信息•帮助元数据维护人员进行元数据的修改与维护•有效支持互操作服务参考信息元数据服务描述信息元数据=服务元数据+服务参考信息元数据为用户或者系统提供指向服务元数据引用的链接信息服务元数据实现对有关服务信息的详细描述服务参考信息元数据•实例–指示信息•服务唯一标示:sdbs://nano.csdb.cn/service/grid/dataquery•服务名称:纳米网格服务之数据查询–指示信息•服务唯一标示:sdbs://micro.csdb.cn/service/•服务名称:中国生物信息检索引擎结构信息元数据•数据集存储实体的结构的描述信息•主要是指关系数据库中的数据表及其属性信息结构描述信息元数据•检索点:数据库中做为检索起点的主表或视图•实体:数据集存储实体的基本信息–实体名称:实体的存储名称–实体类型:–实体定义–主键–属性•属性名称•属性中文标签•属性类型•存储长度•计量单位•精度•默认值•属性描述•关联实体•关联类型•是否只读•可否空值•关系•关联实体•关联实体属性•关联子实体•关联子实体属性•关联类型检索点数据表Jive实体一实体名称jiveattachment实体中文标签数据表Jive实体类型数据表实体描述数据表Jive是××××主键附件标识属性一属性名称ATTACHMENTID属性中文标签附件标识属性类型文本类型属性长度100计量单位精度默认值属性描述附件的唯一标识符关联实体jiveattachmentpro关联属性一对多是否空是是否只读是属性二属性名称MESSAGEID属性中文标识信息标识属性类型未指定类型属性长度50计量单位精度默认值关联实体关联属性属性描述信息的唯一标识符是否空是是否只读是实体二实体名称jiveattachmentprop实体中文标签附件属性实体类型数据表实体描述附件文件的属性主键属性附件标识属性一属性名称ATTACHMENTID属性中文标识附件标识属性类型文本类型结构描述信息元数据实例属性描述附件文件的名称关联实体关联属性是否空否是否只读是关系关联实体jive关联实体属性ATTACHMENTID关联子实体jiveattachmentprop关联子实体属性ATTACHMENTID关联类型一对多属性长度100计量单位精度默认值属性描述附件的唯一标识符关联实体Jive关联属性一对一是否非空否是否只读是属性二属性名称NAME属性中文标识附件名称属性类型文本类型属性长度50计量单位精度默认值结构描述信息元数据实例覆盖范围信息元数据•辅助模块•描述数据资源内容所归属的分类、跨越的时间和覆盖的空间范围的信息覆盖范围信息元数据地理范围信息联系信息元数据•辅助模块•与描述对象有关的个人和组织的联系信息服务元数据•服务–为满足顾客的需要,供方与顾客接触的活动和供方内部活动所产生的结果。*–在科学数据库,服务可理解为网格信息服务系统为其各节点(包括数据节点和功能节点)提供的各种功能•服务标准–规定一项服务应满足的要求,以确定其对用途的适应性的标准。#•服务元数据–(项目内)访问节点为获取服务与被访问节点交互中需要“提交”的参数的描述•*定义摘自ISO9004-2:199l《质量管理和质量体系要素之第2部分:服务指南》•#定义摘自ISO/IEC第2号导则(1991年第6版)服务元数据模型数据集连接服务元数据数据库连接服务名称:IAPConn数据库连接服务唯一标识符:sdbs://iap.csdb.cn/service/dbms/IAPConn数据集连接服务描述:数据库系统:Oracle数据库系统版本:9i数据库连接主机IP:159.226.3.113端口号:1521数据库名称:iap用户名:admin密码:sysadmin关联数据集URI:cn.csdb.iap.dataset.iap2中间件服务网格服务名称:纳米数据访问中间件服务网格服务URI:sdbs://nano.csdb.cn/service/middleware/dataaccess网格服务描述:此服务描述了获取纳米数据库的数据访问中间件中间件服务主机地址:http:
本文标题:核心元数据标准及其应用
链接地址:https://www.777doc.com/doc-1084122 .html