《A类赛题手册》下载地址:https://www.fwwb.org.cn/news/show/598
1.命题方向
智能计算
2.题目类别
计算类
3.题目名称
基于低空无人机视觉的桥梁表观病害精细化智能检测算法开发
4.背景说明
【整体背景】
交通基础设施是国家经济发展的命脉。据统计,我国公路桥梁总数超过100万座,铁路桥梁超过20万座。随着使用年限增长,大量桥梁进入“老龄化”阶段,裂缝、露筋、锈蚀等病害频发。传统的桥梁巡检主要依靠人工驾驶检测车或搭建脚手架,存在效率低、盲区多、高空作业风险大、严重阻碍交通等问题。
“十四五”规划明确提出要推动交通基础设施数字化、网联化升级。利用低空无人机(UAV)搭载高分辨率相机进行非接触式巡检,已成为行业发展趋势。然而,无人机巡检会产生海量图像数据,依靠人工回看照片进行病害标注不仅耗时耗力,且容易漏检。
【单位背景】
杭州师范大学数学学院拥有深厚的学术底蕴,其数学学科不仅是浙江省一流学科,更稳居ESI全球排名前1%,拥有数学一级学科博士学位授权点,为数据科学与人工智能专业领域的发展奠定了坚实的理论基石。在此基础上成立的大数据科学研究院,是学校响应国家大数据战略、对接杭州“数字之城”产业需求的科研特区,现已成为长三角地区具有重要影响力的数据智能创新高地。
在数据科学与人工智能领域,学院与研究院坚持“基础理论引领,应用落地驱动”的科研路线。依托省部级科研平台,科研团队在运筹优化、机器学习理论、复杂数据分析及智能计算等核心领域取得了一系列突破性成果,在顶刊、顶会发表大量高水平论文。同时,单位积极推动产学研深度融合,将AI技术广泛应用于智慧医疗、智慧教育及杭州城市大脑优化中,有效解决了多个行业关键共性技术难题,社会服务成效显著。
学校层面给予了该领域前所未有的大力支持。作为学校优先发展的战略高地,研究院实行“人才特区”政策,大力引进海内外顶尖人才,组建了多支高水平、国际化的创新团队。此外,学校持续加大在高性能计算平台、大数据中心等硬件设施上的投入,提供了充足的科研经费和一流的实验环境,全力保障从算法创新到场景应用的无缝衔接。杭州师范大学数学学院、大数据科学研究院将继续依托杭州数字经济、低空经济、具身智能等产业优势,深耕人工智能基础数学理论,赋能数据要素价值释放,致力于建设成为国内一流的数据科学人才培养基地与科技创新引擎。
【业务背景】
目前,本命题单位已在全国多地开展无人机自动化桥梁巡检业务和研究,积累了海量的桥梁外观影像数据。但在实际业务落地中,面临以下技术瓶颈:
复杂环境干扰:桥底光线阴暗、水面反光、树木遮挡、涂鸦污渍等背景噪声极大影响识别准确率。
微小病害检测:高空拍摄视角下,微细裂缝等病害在图像中占比极小,极易被忽略。
量化需求迫切:仅“框出”病害不够,工程养护需要知道病害的具体长度、宽度,锈蚀的面积占比,以评估桥梁健康等级。
因此,本单位急需开发一套高精度、高效率的视觉AI算法系统,能够自动处理无人机影像,实现病害的像素级分割与量化。
5.项目说明
【问题说明】
参赛团队需要针对无人机采集的桥梁(包括高架、跨江大桥、铁路桥等)高分辨率图像,设计并实现一套深度学习算法系统。该算法系统需要解决以下核心问题:
多类别病害检测:精准识别混凝土裂缝、剥落/掉块、钢筋裸露、钢结构锈蚀、泛碱(渗水)等常见病害。
抗干扰能力:能够有效区分真实的病害与污渍、阴影、接缝、爬墙虎等干扰物。
像素级分割:不仅要考虑目标检测,还需考虑实例分割,以便后续计算病害的几何参数。
【用户期望】
用户期望获得一个核心算法模块/系统,能够输入无人机原始图像,输出包含病害类别、掩膜(Mask)及置信度的结果文件。
该算法应具备“快、准、细”的特点:在主流显卡上具备准实时处理能力;对微小病害的召回率高;分割边缘贴合度高,能够支撑后续生成桥梁检测报告。
6.任务要求
【开发说明】
建议参赛团队完成以下核心任务:
(1)算法模型构建:选择并改进主流的计算机视觉模型(如YOLO系列、Mask R-CNN、Swin Transformer等),针对桥梁病害的小目标和长宽比极端(如细长裂缝)特性进行网络结构优化。
(2)数据增强与处理:利用图像处理技术解决桥下光照不均、运动模糊等问题,通过数据增强提升模型泛化能力。
(3)量化计算模块:在分割结果基础上,设计算法估算病害的物理长度和最大宽度(需结合给定的像素-物理尺寸转换系数)。
【技术要求与指标】
(1)算法开发环境:推荐使用 Python 3.8+, PyTorch 1.8+或TensorFlow 2.x。
(2)目标类别:需检测至少3类桥梁病害。
(3)性能指标:
以下指标只作为衡量模型在可参考数据集上的效果对比,但比赛评审打分不局限于这些指标,还要看实际应用效果的展示情况。
①检测和分割精度:建议在参考测试数据集上的病害分类精度(mAP@0.5:0.95)和病害区域的交并比(IoU)不低于现有基于YOLO或Transformer等的基线模型。
②运行效率:在常规消费级GPU(如RTX4090)上,单张4K分辨率图像的推理耗时不超过200ms。
【提交材料】
(1)项目概要介绍;
(2)项目简介PPT;
(3)项目详细方案;
(4)项目演示视频;
(5)企业要求提交的材料:
① 项目技术方案文档:建议包含算法原理、模型架构图、创新点、训练策略及实验对比分析等;
② 演示视频:建议展示算法对无人机视频流或测试图片的实时处理效果;
(6)团队自愿提交的其他补充材料。
7.参考信息
可参考数据集资源:本赛题数据集可自行收集或基于以下数据集进行筛选和适配。(如有其它数据集亦可,在参赛提交文档中需注明数据集来源)
(1) GYU-DET桥梁病害检测数据集:
https://www.scidb.cn/detail?dataSetId=68827df9f367442c8be0c283e60ed3b7
(2) COCO-Bridge-2021-plus桥梁病害检测数据集:
https://github.com/beric7/COCO-Bridge-2021-plus/tree/main?tab=readme-ov-file
可参考论文:
(1) Multi-defect type beam bridge dataset: GYU-DET:
https://pmc.ncbi.nlm.nih.gov/articles/PMC12215046/#CR20
(2) Deep Learning Models for UAV-Assisted Bridge Inspection: A YOLO Benchmark Analysis:https://arxiv.org/abs/2411.04475
8.评分要点
赛题评分要点见附件一:A类企业命题初赛统一评分标准。