【A32】基于大数据统计分析对微型空气站浓度类监控因子进行动态校验【蓝创智能】
发布时间: 2022-11-24 17:29:05

本届A类赛题可通过以下方式提问与交流:

1、大赛官网团队账号-赛题答疑区提问,组委会定期收集问题提交至企业解答后公布;

2、可前往赛题答疑论坛(PC端点击链接):https://mastergo.com/file/77782156635006?utm_source=fwwb&utm_medium=saitishouce&utm_campaign=&utm_term=&utm_content=提问或交流,企业定期回复。


1.命题方向

智能计算

2.题目类别

应用类

3.题目名称

基于大数据统计分析对微型空气站浓度类监控因子进行动态校验

4.背景说明

【整体背景】

数据资产作为政府、企业的一项重要资产,需要最大化地挖掘数据资产价值。习近平总书记一直十分重视生态环境保护,十八大以来多次对生态文明建设作出重要指示,在不同场合反复强调,“绿水青山就是金山银山”。如何保护好生态环境,污染源头管控尤为重要。以江苏省为例,全省申领排污许可证单位30000 余家,如何保证监测数据的准确性,面对海量监测数据,通过数据模型分析,对企业排放行为进行实时风险评估,杜绝企业污染排放违法行为及污染事件的发生。

为全面严厉打击环境违法行为,江苏省生态环境厅强化科技支撑,希望充分发挥多系统协同优势,精准锁定重点区域、重点企业,精准指挥调度,有针对地开展执法检查,有效解决以前眉毛胡子一把抓、遍地撒网式的执法检查方式,通过系统对企业实现污染排放实时在线监控、违法行为风险评估,对污染排放违法行为实现精准打击。

【公司背景】

江苏蓝创智能科技股份有限公司于 2009 年 5 月在江苏无锡创立,公司致力于成为国内领先的环境污染精准防治数据运营商,在智慧环保、城市安全等领域提供基于 IoT 的数据采集及 AI 数据分析算法的整体解决方案。

公司持续深化 AI、IoT、大数据、区块链等技术创新与产业应用,经过十余年的研发,蓝创智能构建了“Squirrel 云平台+终端+服务”的业务布局,推动生态治理数字化、管理精准化、决策智能化转变,以“一张网”、“一平台”、“多应用”为核心,打造新基建下互联互通新生态,促进生态安全数据产业链深度融合发展,为坚决打赢污染防治攻坚战、确保实现生态环境质量总体改善目标贡献力量。

【业务背景】

公司着重通过 AI 数据模型对海量生态安全数据进行挖掘,为生态环境监管部门、应急管理部门、化工园区、排污企业等提供综合化业务场景应用分析。借助先进技术构建全方位、多层次、全覆盖的生态安全监测网络,推动环境监测向自动化、标准化、智能化、信息化转变,形成生态安全数据一本台账、一张网络、一个窗口,确保监测数据客观真实、准确有效、指标全面,实现环境信息资源的高效、精准应用,达成让“感知更透彻,互联更快捷,智能更深入,决策更科学” 的生态环境信息化建设目标,以更加精细、精准和动态的方式辅助生态安全监督与决策的智慧管理。

5.项目说明

【问题说明】

在此项目中,微型空气监测站,也称大气网格化微型空气站,与大型空气站一样,主要用于监测空气中污染物六参与气象五参等指标,但与传统大型空气站的光学原理相比,微型站采用电化学传感器,成本与价格相对较低。而电化学气体传感器的特性受很多的因素影响,如温度、电源波动、湿度等。在这些因素的影响下,势必会出现数据偏移。这样必定会导致气体传感器的准确性下降,造成监测数据异常或无效,给环境执法等相关工作带来较大的困扰。因此如何利用数学模型、算法、人工智能等手段解决微型站中的数据飘移、交叉干扰等问题,对于企业、园区、环境执法部门等来说都是亟需解决的。

【用户期望】

1)对现有收集数据完成数据预处理等相关工作;

2)通过模型算法,可以快速、准确的将微站数据特征进行分类,根据不同的特征对各微站数据进行校准,最终使全部微站的总体误差达到可接受范围内;

3)给出模型的调参机理与相关技术说明。

6.任务要求

【开发说明】

1)在此项目中,按照课题要求自行(进行)数据的采集、扩充、清洗等处理;

2)用于训练的数据数量自定,建立合适的数学模型进行训练,针对大气微站数据的准确度和修正效果进行参数调整、模型优化;

3)完成算法的开发,要求可以调研设计的算法模型性能,能实现较为准确的数据修正,能保证模型的强适应性与自我学习能力,并将其工程化部署,提供可交付的 PC 端可执行程序。

【技术要求与指标】

模型大小

不超过 100M

算法性能指标

经算法拟合后,r2≧0.95

算法调试指标

有完善的调参流程与相关技术说明

算法学习指标

随着数据的增多能主动发现异常数据及将其标记,以及实现拟合精度的逐步提升。

【提交材料】

1)项目概要介绍;

2)项目简介 PPT;

3)项目详细方案;

4)项目演示视频;

5)企业要求提交材料:

①项目简介 PPT(与(2)内容合并),包括:项目执行思路介绍;所使用的算法模型、优化方案、项目工程化过程介绍;算法及模型的优劣势、技术指标达成情况介绍,以及结果展示等;

②项目详细技术方案文档(与(3)内容合并),包括详细描述算法实现的技术方案及原理;

③可执行程序及完整文档。

6)团队自愿提交的其他补充材料

【任务清单】

1)明确业务需求定义,根据定义收集、筛选或数据增强的方式整合可训练数据集;

2)熟悉电化学传感器相应的工作原理与出现误差的原因;

3)采用深度学习模型调研、设计和训练;

4)模型优化改进(模型效果改进或模型压缩加速等);

5)模型的效果评估以及处理效率;

6)模型大小、处理所用时间、总体参数量(Params)和计算量(Flops);

7)模型工程化,提交版本可进行验证的包含全部依赖的工具包和说明文档;

8)给出后续系统再度优化推进建议。

【开发工具与数据接口】

7.其

8.参考信息

9.评分要点

赛题评分要点见附件A 类企业命题初赛统一评分标准。

除此之外,企业还会重点关注:

1)标准制定:结合参考信息,针对排污违法行为制定的数据衡量标准覆盖精准到位、符合实际情况、具备应用价值;主要针对以下三大类违法行为种类开展数据标准制定(每个大类都涉及很多可能的数据情况,以下仅举例,具体由参赛团队结合实际情况制定):

①校准精度,校准完毕以后,利用测试集进行模拟验证的过程中应当有r2≧0.95;

②数据清洗能力,该模型需要能自动标记并识别“可校准数据”与“异常数据”。其中异常数据包括但不限于,微站出现异常、微站损坏等;

③模型适应与特征匹配能力,面对不同的大气微站能快速的发现他们各自的误差特征,能根据其特征选用最优的校准方法;

④算法调参清单,给出不同参数对模型的影响特征,与调参方向。

2)算法创新:算法创新描述详细、清晰,不限于数据预处理、 模型改进、模型加速等技术的创新;

3)算法实现与交付:算法设计方案可行性高,算法的性能和效果可行可用,项目完成度好,展示效果好。



订阅号