1.命题方向
智能计算
2.题目类别
计算类
3.题目名称
基于“折线/曲线图”数据抽样方法研究
4.背景说明
【整体背景】
折线/曲线图数据是数据走向展示中常用的方法,常见于股票、心电图、仿真软件、学术文章中等等。其展示效果便于用户观察其中数据趋势,线上一个点由横坐标x值、纵坐标y值所定位,即点(x,y),折线图通常由众多点数据构成。
由于展示图片目标是反映数据情况,而对于数据复用难度较大。从折线/曲线图中得到点的横纵坐标需要大量人力,且具有机械重复性。由折线/曲线图重建、抽样数据对于学术研究、工程实践具有重大意义。
【公司背景】
江苏万维艾斯网络智能产业创新中心有限公司由江苏省高等学校优秀科技创新团队(南京大学人工智能推理与学习团队)与南京科创投资(国资)共同投资。公司是国内首批以人工智能技术创新为核心价值的高新技术企业,旨在提高人工智能产业的自主创新能力,努力打造一个集国际技术转移、技术研发、国际合作、科技创业、咨询培训功能于一体的创新创业平台。
【业务背景】
机器视觉是江苏万维艾斯网络智能产业创新中心有限公司的一个业务方向。当前存在这样一个机器视觉任务,需要从大量图片形式的图表数据中提取数值信息。由于图表的样式,坐标轴尺度多样,所以提取存在一定的难度。
5.项目说明
【问题说明】
来自不同类型的折线/曲线图训练数据有6200张,测试数据1000张,其图片大小、背景颜色、背景有无网格、线条颜色、线条粗细等非数据因素会有多种样式。图片中保证折线只有一条,有横纵坐标值但范围不定。折线图上无其他干扰因素,如图例、标注信息、表头等,坐标原点为左下角,为(0,0)如图1所示。
图1-折线图示例
对应每张训练图片,会有标签(label)文件和对应的mask。标签内容是,从折线左侧起点开始,在线条所属x轴范围均匀抽取5个y轴坐标值。对应图1中,抽取x坐标为(0,2,4,6,8),标签为:
(5,2,12,9,7)
|
图2-标签可视效果图
同时,用户可以自己添加训练数据,增强效果。
【用户期望】
能够实现通过算法,在折线/曲线图上自动、准确抽样数据。
6.任务要求
【开发说明】
设计算法,完成对输入折线/曲线图的数据抽样。实现方法不限,可以通过工程手段增强效果。
在测试数据中,计算每条数据的d值,进行累加。值越小,排名越靠前。
【提交材料】
(1)项目概要介绍;
(2)项目简介 PPT;
(3)项目详细方案;
(4)项目演示视频;
(5)企业要求提交的材料:
1提供可验证的深度模型和测试代码,防止手动标记作弊
(6)团队自愿提交的其他补充材料。
【任务清单】
(1)完成算法设计与实验;
(2)完成提交材料内容。
【开发工具与数据接口】
(1)开发工具不限;
(2)数据下载地址链接:https://pan.baidu.com/s/1LSPt_86RVvsKYgZ8Nf2HdA
提取码:weba
(3)数据组织形式:
--大学生服务外包创新创业大赛数据
-训练数据
-曲线数据
-折线数据
-测试数据
-曲线数据
-折线数据
7.其他
8.参考信息
9.评分要点
赛题评分要点见附件四:A类初决赛阶段评分表。