本届A类赛题可通过以下方式提问与交流:
1、大赛官网团队账号-赛题答疑区提问,组委会定期收集问题提交至企业解答后公布;
2、可前往赛题答疑论坛(PC端点击链接):https://mastergo.com/file/77782156635006?utm_source=fwwb&utm_medium=saitishouce&utm_campaign=&utm_term=&utm_content=提问或交流,企业定期回复。
1.命题方向
智能计算
2.题目类别
计算类
3.题目名称
基于本体的军事知识图谱自动化构建技术
4.背景说明
【整体背景】
军事领域是敏感度、机密系数较高的一个领域,其数据价值很高,获取相关军事数据并提供一个便捷的人机交互方式具有重要的战略意义。军事中的装备信息,军事基地信息,军事作战部队之间的关联信息,以图谱的形式组织,能够在作战策略推荐,军事人员培训上起到重要作用。目前,公开的军事资料不多,收录较全的方式主要有环球军事网,其中的人物,战役,兵器库,术语库等网站,还有一些来自专家编制的书本常以word、excel和pdf的形式存储。
因此围绕军事研报知识图谱的自动化图谱构建展开,评测从预定义图谱模式(Schema)和少量的种子知识图谱开始,从非结构化的文本数据(主要的是书本转化的PDF)中构建知识图谱,在给定图谱模式和种子知识图谱的条件下,评测内容为自动地从研报文本中抽取出符合图谱模式的实体、关系和属性值,实现军事知识图谱的自动化构建。评测本身不限制各参赛队伍使用的模型、算法和技术,构建各类无监督、弱监督、远程监督、半监督等系统,迭代地实现知识图谱的自动化构建,共同促进知识图谱技术的进步。
【公司背景】
江苏万维艾斯网络智能产业创新中心有限公司由江苏省高等学校优秀科技创新团队(南京大学人工智能推理与学习团队)与南京科创投资(国资)共同投资。公司是国内首批以人工智能技术创新为核心价值的高新技术企业,旨在提高人工智能产业的自主创新能力,努力打造一个集国际技术转移、技术研发、国际合作、科技创业、咨询培训功能于一体的创新创业平台。
【业务背景】
图谱构建是江苏万维艾斯网络智能产业创新中心有限公司的一个业务方向。当前存在这样一个知识图谱构建任务,需要从pdf文本中抽取出符合图谱模式的实体、关系和属性值,实现军事知识图谱的自动化构建。
5.项目说明
【问题说明】
PDF数据包括表格、文本和图片。如图1所示。
图1 表格图片示例
最终需要的输出效果为三元组形式,如图2所示。
图2 算法输出效果示例
【用户期望】
通过设计的算法,在pdf上自动、准确的找出所有三元组形式。
6.任务要求
【开发说明】
通过甲方提供的舰艇损管书本(pdf)设计算法进行三元组抽取,实现军事知识图谱的自动化构建。实现方法不限。
【技术要求与指标】
举办方通过书本设置30道题,分为简单问答10题;推导题20题;通过pdf抽取的三元组进行结果回答,得分高的说明三元组抽取的覆盖面广并且质量高以此为评判标准,最后运用于该三元组进行军事知识图谱自动化构建。
【提交材料】
(1) 项目概要介绍;
(2) 项目简介PPT;
(3) 项目详细方案;
(4) 项目演示视频;
(5) 团队自愿提交的其他补充材料。
【任务清单】
(1)完成算法设计与实验;
(2)完成提交材料内容。
【开发工具与数据接口】
(1)开发工具不限;
(2)数据接口待定。
7.其他
无
8.参考信息
无
9.评分要点
赛题评分要点见附件一:A 类企业命题初赛统一评分标准。