大学生服务外包创新创业大赛--【A02】基于百度飞桨的3D医疗数据智能解析平台【百度】

【A02】基于百度飞桨的3D医疗数据智能解析平台【百度】

发布时间： 2022-11-24 14:55:36

本届A类赛题可通过以下方式提问与交流：

1、大赛官网团队账号-赛题答疑区提问，组委会定期收集问题提交至企业解答后公布；

2、可前往赛题答疑论坛（PC端点击链接）：https://mastergo.com/file/77782156635006?utm_source=fwwb&utm_medium=saitishouce&utm_campaign=&utm_term=&utm_content=提问或交流，企业定期回复。

1.命题方向

人工智能+医疗

2.题目类别

应用类

3.题目名称

基于百度飞桨的3D医疗数据智能解析平台

4.背景说明

【整体背景】

为进一步加强新一代智能技术与医学的深度融合，响应“健康中国”国家发展战略，百度在第十四届“中国大学生服务外包创新创业大赛”中首次设立了“基于百度飞桨的3D医疗数据解析平台”的企业赛题，将来自智慧医疗产业一线的系统建设需求，与高校赛训内容相结合，以助力高校复合交叉型AI人才培养，更好促进我国未来智慧医疗产业的健康发展。

【公司背景】

百度是拥有强大互联网基础的领先AI公司，是全球为数不多的提供AI芯片、软件架构和应用程序等全栈AI技术的公司之一，被国际机构评为全球四大AI公司之一。百度以“用科技让复杂的世界更简单”为使命，坚持技术创新，致力于“成为最懂用户，并能帮助人们成长的全球顶级高科技公司”。百度以技术创新为信仰，在创新投入、研发布局、人才引进方面均走在国际前列。2020年，百度核心研发费用占收入比例达21.4%，研发投入强度位于中国大型科技互联网公司前列。百度全球AI专利申请量已超过1万件，其中中国专利9000多件，位列中国第一，并在深度学习技术、智能语音、自然语言处理、自动驾驶、知识图谱、智能推荐等多个领域排名国内第一。

【业务背景】

为了更好地使用前沿AI技术辅助医生快速阅片分析、帮助患者更快地获得影像检查结果，百度飞桨联合百度智慧医疗部、广州第一人民医院南沙医院放射科及其他社区开发者基于PaddleSeg正在探索全流程 3D 医学图像分割工具，从而更好地实现从数据处理、模型训练、可视化验证到部署的全流程，方便医疗从业者快速构建医疗识别模型，高效进行医疗影像分析。

5.项目说明

【问题说明】

医学影像是临床疾病诊断的重要方式，高效精准的从影像中识别出器官结构或病变，是医学影像学中重要的课题之一。根据成像原理，医疗影像可以粗略分为两类：

2D成像：一种是在可见光下获取的RGB彩照，如眼底彩照、皮肤彩照等。

3D成像：借助非可见光或其它物理效应，由计算机辅助成像，如CXR/DR(X-Ray)、CT、核磁共振(MRI)等。如CT与MRI数据是多个2D切片沿第三个空间维度堆叠而成的。

其中，3D影像能够更直观辅助医生提升诊断效率。但医疗影像的读片工作对专业知识要求高，这样繁重且重复性较高的阅片工作，仅能由专业的影像科医生完成。另一方面，医疗影像在医学检查中愈发常见，对阅片专家的需求也在增加。随着深度学习技术的发展，我们看到了使用AI技术辅助医生快速分析阅片、减轻阅片工作负担的可能性。

【用户期望】

为更好满足医疗从业者快速构建医疗识别模型及高效进行图像分析的需求，参赛选手需利用深度学习和软件开发技术实现以下两部分内容：

（1）算法部分：要求选手基于PaddlePaddle，在官方指定数据集上进行打榜，实现在验证集上，给定任一3D医疗数据，准确地完成医学数据的分割任务，并且在新的、未进行过训练的数据集上能够获得较好的泛化性能。

（2）软件部分：要求选手实现基于飞桨的3D医疗数据解析平台，其中包含医疗数据的导入、分割、可视化和数据分析功能四大基础功能，选手可设计更多相关场景的附加功能，通过稳定的软件功能和优秀的人机交互，为非AI专业人员提供良好用户体验。

6.任务要求

【开发说明】

算法部分：要求选手基于国产化人工智能框架——百度飞桨PaddlePaddle框架进行开发，使用百度AI Studio平台进行训练；选手将代码及数据按照规定的格式，提交至 AI Studio，后台将自动得到各项指标分数，并在公开榜单进行实时排名；

软件部分：要求选手基于web实现3D医疗数据解析平台，其中模型可在本地或云端部署进行推理。

【技术要求与指标】

（1）算法部分

提交要求

本次比赛要求选手必须使用paddlepaddle2.2及以上版本生成端到端深度学习模型，比赛结束后会要求选手提交相关模型及预测代码作为复核材料；

选手需要提交最终的预测结果，提交结果中包含测试集的预测结果，文件格式为.ii.gz。

评分规则本次比赛使用dice系数作为评价标准，其计算方法如下式，最后使用15个前景类别的平均dice系数最为评分指标

（2）软件部分-数据读取与推理：

①导入数据：

A.图像支持格式包含nii、nii.gz、mhd、raw、dcm 等常见格式；

B.标签支持本软件标注导出的标签（最好和图像格式一致）和原数据集对应的标签。

②加载模型和分割预测：支持模型加载；建立推理按钮，点击后可以基于导入模型展示该模型的分割效果并作为标签

③标签管理：支持标签的增删、修改和颜色的切换；支持标签的导出保存

④预标注效果修改：支持使用笔刷、橡皮擦、提取最大连通域等方式对模型推理分割结果进行优化，并将结果在三视图和 3D 渲染效果中展示

（3）软件部分-数据展示：

①原图和标签支持3D可视化

②三视图展示原图和标签显示，每个视图支持鼠标拖动进行切片切换、鼠标拖动带动3D原点的变化

③支持缩放和窗宽窗位调整

（4）软件部分-数据分析：

①测量：基于spacing等参数，获取测量分割目标在x, y, z切面上的直径、面积和目标体积等结果

②计数：基于现有分割结果，统计不同类别数据的个数，例如某类病灶的计数

③自定义数据分析：基于用户上传的后处理脚本返回结果进行合理的展示和分析（可以规定后处理的返回内容和方式）

④统计结果展示：针对用户上传的所有医疗数据进行上述分析，并对分析结果进行图标展示；并支持显示所有符合筛选要求的数据索引。

（5）软件部分-附加功能

基于更多类型数据，结合医疗影像中实际需求，设计并开发更多功能的数据分析维度与交互式展示效果。

①例如指定数据集为腹部多器官，计数统计功能均统计为器官数量1，若替换计数功能下数据为肺结节数据，则可以计算图中有多少肺结节，更能发挥计数功能；

②除了技术和测量功能，选手可拓展其他分析分割结果的功能，有实际应用需求支撑为佳。

【提交材料】

（1）项目概要介绍;

（2）项目简介 PPT;

（3）项目详细方案;

（4）项目演示视频;

（5）企业要求提交的材料：

①完整可交互的软件系统；

②系统设计文档；

③软件交互录屏与解说视频；

④备赛历程中的飞桨学习路线与心得等。

⑤【技术要求与指标】算法部分提交要求。

（6）团队自愿提交的其他补充材料。

【任务清单】

（1）飞桨学习与练习；

（2）算法训练与AI Studio打榜；

（3）软件设计、开发和部署；

（4）制作项目提交材料；

（5）准备演讲。

【开发工具与数据接口】

要求选手基于国产化人工智能框架——百度飞桨PaddlePaddle框架进行开发，使用百度AI Studio平台进行训练，可尝试飞桨 MedicalSeg工具和现有模型。

7.其他

如果有具体的客户案例或经过客户实际场景测试，在不涉及知识产权的情况下，可以提供产学研使用证明或试用说明文档。

8.参考信息

官方数据集https://aistudio.baidu.com/aistudio/datasetdetail/179474

9.评分要点

赛题评分要点见附件一：A 类企业命题初赛统一评分标准。

分赛区