论文欣赏

您现在的位置:网站首页>> 论文欣赏>> 其它论文

基于元数据的异构数据集整合方案

本文导读:此文由期刊论文发表网编辑整理,期刊论文发表网立足江苏常州,服务全国,9年来助数万的学子顺利毕业就业,助数万职员顺利晋升,如需论文发表服务请联系客服人员。这是一篇关于基于元数据的异构数据集整合方案的文章,目前,医疗日趋信息化、区域化方向发展,当前医疗部门中的大量异构数据的管理成为亟待解决的问题。由于医疗数据存放在各医疗机构的的本地数据库,具有..

    目前,医疗日趋信息化、区域化方向发展,当前医疗部门中的の大量异构数据的の管理成为亟待解决的の问题。由于医疗数据存放在各医疗机构的の的の本地数据库,具有异构分布性,且不同数据库设计各异,具有数据异构性,医疗数据形成了一个个信息孤岛。基于区域医疗信息共享平台,通过注册机制的の方式,来实现不同数据模型之间的の转换,以达到数据的の“无缝连接”。因此,如何注册数据元是需要解决的の问题。

   1 医疗平台的の元数据分析

   元数据(Metadata)是指一种数据单元,用来对数据进行描述,用来描述信息资源或者信息数据的の定义、特征、属性、值的の有效性等。

   基于 SOA 体系架构的の区域医疗数据共享平台主要分为三个部分:区域医疗基础信息系统、专题信息系统、综合信息系统,其中基础信息系统是各医疗机构基础数据的の产生层,该三部分通过服务注册的の方式进行数据共享和交换。在系统中,元数据主要用来描述基础信息系统中的の基础数据,如户籍信息、居民健康信息、医疗资源信息、卫生信息、配置信息、知识库数据等。通过元数据信息数据管理,极大地方便了的の数据的の交换和共享,同时为决策管理提供支持。

   2 元数据管理流程

   在异构分布式的の区域医疗平台下,元数据的の类型具有多样性。如何管理各系统中格式各异的の基础数据,是元数据管理模块中需要解决的の问题。元数据管理系统中,引入元数据的の互操作性能够较好的の解决医疗信息数据的の格式等的の转换,为数据的の交换和共享提供统一的の接口。

   在分布式环境下,通过将各个模块集成以服务的の方式进行注册和发布,供平台用户发布、注册和检索,实现动态更新和获取数据。元数据的の注册方式包括向上注册方式和向下注册方式两种。其中向上注册方式,主要是由数据产生者对数据进行描述和定义,而向下注册方式是由共享平台中心统一对数据进行描述,并提供给数据生产方,要求其按照统一的の标准进行元数据注册。但由于区域医疗系统的の复杂性,以向上注册的の方式为主,对部分数据采用向下注册的の方式。

   元数据的の管理流程如图 1 所示。数据产生者将各种异构数据进行理描述解、研究,以准确的の定义来表示元数据,通过注册的の方式将元数据存储在元数据库中。当用户需要在区域医疗共享平台中检索数据时,同时向元数据管理系统中获取查询内容的の元数据,通过元数据库提供的の元数据进行解析,获取不同系统中异构数据,最后将查询的の异构结果再次结合元数据解析,得到标准化的の查询结果。

   3 XML结构化数据存储

   XML 作为一种可扩展标记语言,其设计的の主旨是用来传输数据,具有自我描述性的の特点,不依赖于平台。面对结构复杂、数据各异的の医疗信息,元数据与 XML 技术相结合,为用户进行元数据注册过程中,正确定义元数据提供较好的の描述和表示方式,每一个 XML 文档作为一条元数据进行存储。

   XML 格式保存的の文档数据时动态变化的の,但仅保存了元数据的の基础信息,没有数据分析的の功能,因此还需要保存解析数据的の结构化数据。因此,在元数据管理中还需要提供数据分析和转换的の功能机制。

   4 基于映射机制的の数据转换

   映射机制是指通过一定的の规则或映射关系将元数据库中的の基础元数据和特殊分类的の元数据联系起来。当用户需要获取数据时,可通过映射转换算法将源数据和目标数据进行关联和转换。

   映射机制中包括源数据和目标数据的の定义、映射模型、映射规则和算法、转换策略等,屏蔽了数据内部的の表现形式和内容。映射机制中有不同的の映射关系,其中映射关系是指在特定领域内,存储不同数据的の数据库之前的の对应关系。对应关系主要包括:数据库间对应关系、表间对应关系以及属性对应关系。

   映射的の过程可描述如下:先确定映射关系,再确定数据转换规则,调用转换规则函数,实现映射机制的の自动处理。前提条件是要存在映射关系的の集合即映射表,有输入数据 Es{A1,A2,…An} 和输出数据 ET{B1,B2,…   Bn},输入数据中的の Ai 和 Bi 之间存在不同的の映射关系,记作mi,遍历库中的の映射规则函数,如果存在规则与 mi 的の模式信息 modi 匹配,则调用该函数进行数据转换,依次循环遍历,遍历一遍后结束。

   面对区域医疗信息数据的の分布性、异构性等特点,在面向服务的の共享平台中,通过元数据管理的の方案,对系统中的の数据进行定义、描述、并进行集中管理与元数据库中。以向上和向下注册等方式对用户元数据进行管理,并以结构的の方式进行数据存储。在元数据管理系统中加入映射机制,通过医疗行业领域专家建立的の映射的の表、框架等,对异构数据进行解析、关联和转换,以实现数据的の融合。

   参考文献

   [1] 肖珑 , 赵亮 . 中文元数据概论与实例 [M].北京 : 北京图书馆出版社 ,2007.

   [2] 张字 , 蒋东兴 , 刘启新 . 基于元数据的の异构数据集整合方案 [J]. 清华大学学报 :自然科学版 ,2009,49(7):1037-1040.

  [3] 张智海 , 张晓清 , 潘清 . 分布式海量数据管理系统 Hypertable 元数据表分析 [J].计算机与现代化 ,2009,(8):113-115.

   [4] 王海燕 , 周思方 , 支建飞 . 基于 XML 元数据交换的の电子试卷管理系统 [J]. 计算机工程 ,2009(10):272-273,276.

 

 
期刊论文发表网论文发表网)是提供论文发表、论文投稿、职称论文发表、学术论文发表、教育论文发表等各种论文发表服务的专业网站,为您职称评定提供一站式服务。
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
投稿信箱:china@city28.com
联系电话:15366664644
客服QQ:279067288
网站: http://www.9icar.cn/
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★