【A39】标准元数据资源库与异构信息系统映射关系建立【华质卓越】
发布时间: 2022-11-24 18:13:34

本届A类赛题可通过以下方式提问与交流:

1、大赛官网团队账号-赛题答疑区提问,组委会定期收集问题提交至企业解答后公布;

2、可前往赛题答疑论坛(PC端点击链接):https://mastergo.com/file/77782156635006?utm_source=fwwb&utm_medium=saitishouce&utm_campaign=&utm_term=&utm_content=提问或交流,企业定期回复。



1.命题方向

企业服务+智能计算

2.题目类别

应用类

3.题目名称

标准元数据资源库与异构信息系统映射关系建立

4.背景说明

【整体背景】

随着大数据行业的兴起,数据的重要性不言而喻,对数据进行应用的工具层出不穷,带来了巨大的经济效益。然而,现阶段“数据孤岛”、“数据烟囱”等诸多问题制约了数据应用的持续发展,使得数据治理工作越来越受到各个企业的重视。

数据标准是进行数据标准化的主要依据,构建一套完整的数据标准体系是开展数据标准管理工作的良好基础,有利于打通数据底层的互通性,提升数据的可用性。简述之,即数据标准是指保障数据的内外部使用和交换的一致性和准确性的规范性约束。

大部分企业现有系统建设大多依据业务实际需求,各个系统由不同的厂商和产品搭建,各业务部门间缺乏整体的规划,没有考虑是否与其它相关信息系统的功能或数据存在重复的问题。因此不同信息系统之间数据的不一致性难以避免,造成多种数据问题。例如数据存储结构不一致,调用多系统的数据时,由于某些数据在不同系统中数据存储结构不同,导致数据无法直接关联,影响不同系统之间的数据共享;数据定义不一致,不同系统对数据的命名、业务含义、取值范围等定义不同,比如同名不同义、同义不同名等;数据理解不一致,不同人员对数据的理解不一致,导致在数据使用时浪费很多时间来进行沟通。

因此,需对企业中不同信息系统现状进行梳理,参考现有国家标准(GB)、行业标准(HB)、企业标准,建立统一标准元数据资源库,建立各异构多源信息系统数据库与标准元数据资源库的映射关系,实现数据的标准统一、共享流通与分析应用。

【公司背景】

华质卓越公司成立于2004年,是国家高新技术企业,是航空工业生产力促进中心、航空工业高技术人才培训基地,航空工业集团编码中心,军工标准体系服务部的运营主体。华质卓越公司以数据技术为手段,以促进航空产业协同、提升装备研制效能、服务装备高质量发展为目标,打通设计仿真、制造装配、试验鉴定、综合保障、维修大修、循环利用等装备研制全过程数据链路,提升装备全生命周期状态智能管理与追溯水平。核心业务是提供数据应用解决方案,以数据标准、数据治理、数据挖掘、数据分析为技术主线,围绕装备在设计仿真、试验检测、综合保障、维修大修等全生命周期环节,形成系列数据与知识服务产品与解决方案。已为航空、航发、航天、中电、兵器、船舶、核工业、政府、科研院所、民营企业等在内的3500余家客户提供基于场景需求的数据技术综合解决方案。拥有数据可视化分析系统、标准电子地图软件系统、通用条码标引、航空产品统一代码注册系统、航空产品履历信息管理系统、数据交换共享平台等40余项软著、专利。拥有北京市科学技术委员会颁发的高新技术企业证书,中关村高新技术企业证书,武器装备科研生产单位二级保密资格、武器装备质量管理体系等10余项资质。获北京市经济和信息化委员会“北京市中小企业服务平台”的称号。承接了多个重大重点国家级、行业级、集团级项目和工程,涉及范围包括:数据标准制修订、数据治理、数据仓库建设、数据模型+知识图谱开发及数据管理软件平台建设,为国家及军工行业提供有效支撑。

【业务背景】

华质卓越公司在数据治理领域持续深耕,通过构建数据标准规范体系,引领航空装备数智化转型升级,搭建CORMD元数据核心技术应用平台。借鉴航空行业成功经验,以元数据核心技术(“融融芯”)作为软件或平台内嵌模块,联合产业伙伴开展数据技术服务,衍生数据技术公共服务,包括数据资产化、数据质量评价、数据价值评估、培训、数据包及数据类产品测评和认证、数据产权交易和服务平台等。

5.项目说明

【问题说明】

通过对大量基于本文数据标准的元数据提取,并按元数据规则进行相应的赋值,形成统一的数据标准元数据资源库。标准元数据资源库与异构系统映射关系的建立,旨在通过统一的数据标准元数据资源库,将各异构多源信息系统数据库中的元数据与标准元数据资源库中的规范元数据建立映射关系,打破信息系统间的数据壁垒,实现各信息系统间数据内容的标准统一、交互流通与共享使用。

【用户期望】

针对异构信息系统存在数据标准不统一、数据格式及定义不一致的问题,以及存在数据管理、交换、共享困难现象,利用人工智能、大数据、云计算等先进的智能技术,使各异构多源信息系统数据库与数据标准元数据资源库建立映射关系,实现各信息系统数据流通共享利用。

6.任务要求

【开发说明】

需实现元数据资源库和异构系统数据库字段项之间的映射,完成异构系统的元数据和元数据资源库中元数据之间建立映射关系并能够较好的进行可视化展示。

【技术要求与指标】

实现元数据资源库和异构系统数据库字段项准确建立映射关系,并能够较好的完成可视化展示。开发语言可选择java、C++、python。

1)构建元数据库标签和异构系统数据库中元数据标签映射准确率要高;

2)可以运行在intel CPU机器上;

3)系统运行顺畅无卡顿,无闪退等严重BUG;

4) UI界面美观、逻辑简单、交互友好;

5) 如果引用了开源代码,作品中标明哪些部分使用了开源代码及出处

【提交材料】

1)项目概要介绍;

2)项目简介PPT;

3)项目详细方案;

4)项目演示视频;

5)企业要求提交的材料:

1算法思路及其效果展示

6)团队自愿提交的其他补充材料。

【任务清单】

1)进行赛题相关需求的分析;

2)设计算法;

3)编码开发与功能实现;

4)测试验证主要功能和创新成果;

5)探索应用场景落地。

【开发工具与数据接口】

开发工具自选(例如: IntelliJ IDEA、VScode等),开发语言可选java、python、c++等

7.其他

8.参考信息

9.评分要点

赛题评分要点见附件A 类企业命题初赛统一评分标准。




订阅号