《A类赛题手册》下载地址:https://www.fwwb.org.cn/news/show/598
1. 命题方向
智能计算
2. 题目类别
计算类(重点围绕船舶装备故障诊断智能问答系统的核心模块开发,考察知识工程与自然语言处理能力)
3. 题目名称
船舶装备故障诊断智能问答系统
4. 背景说明
【整体背景】
随着航运业智能化转型加速,船舶关键装备(如发动机、导航系统、甲板机械等)的故障诊断与维护成为保障航行安全、降低运营成本的核心环节。传统故障处理依赖人工经验,存在知识传递效率低、专家资源稀缺、故障响应滞后等问题。
检索增强生成(RAG)技术通过将知识库检索与生成式AI结合,能够精准匹配专业知识并生成结构化解答,为工业设备故障诊断提供了新范式。本命题旨在探索轻量化RAG技术在船舶装备领域的应用,构建兼具专业深度与交互友好性的智能问答系统,推动船舶运维向知识驱动型转型。
【单位背景】
大连海事大学是交通运输部直属的唯一高校,是国家首批“211工程”和“双一流”建设高校。学校因海而生,其发展历史是中国高等航海教育建设发展成就的缩影。学校1960年被确定为全国重点大学,1963年经国务院批准实施半军事管理。学校现有全日制本科生18142人、研究生8451人、外国留学生及成人高等教育2526人;专任教师1711名,国家级高层次人才62人次,国家级创新团队3个。学校设立54个本科专业,80%直接服务于海事产业链。拥有一级学科博士学位授权点10个、一级学科硕士学位授权点25个,博士专业学位授权点2个、硕士专业学位授权点16个,博士后流动站7个。交通运输工程入选国家“双一流”建设学科,船舶与海洋工程等5个学科入选辽宁省一流学科。工程学、计算机科学、一般社会科学、环境科学/生态学、材料科学、化学、地球科学等学科进入ESI全球前1%,其中工程学进入ESI全球前1‰。学校拥有2艘远洋教学实习船(“育鲲”轮、“育鹏”轮)以及1艘融远程遥控、自主航行与教学实训于一身的智能研究与实训两用船(“新红专”轮)。学校坚持科技创新向海,坚定服务国家战略和行业地方发展需求。聚焦交通强国、海洋强国等重大战略,扎实推进交通强国建设试点任务,在新一代海上通信、无人船、船舶污染防控、海底工程等领域,形成了一批具有自主知识产权的创新技术和具有重大影响力的原创性成果,解决了一批关键核心技术,围绕氢能船舶、载运装备、智能港口、深海装备等领域牵头国家重大重点项目203项。学校拥有1个全国重点实验室,2个国家级工程研究中心,2个国家级国际科技合作基地,3个国家学科创新引智基地,1个国家级协同创新中心,1个国家级创新人才培养示范基地,1个国家级科普教育基地,51个省部级重点科研平台和基地(自然科学类),省级人文社科基地7个,省级重点新型智库9个。
【业务背景】
船舶关键装备(四机一炉、甲板机械等)的故障诊断需要融合机械工程、流体力学、电子控制等多学科知识。目前一般的企业、高校等积累的故障案例、维修方案等专业知识分散在纸质手册、工程师笔记、维修报告等载体中,形成"信息孤岛"。一线船员在海上作业时难以快速获取精准指导。
本项目旨在通过RAG技术构建标准化知识体系,开发轻量化智能问答系统,实现故障现象与解决方案的精准匹配,缩短平均故障响应时间,同时沉淀企业知识资产,为船员培训、新船设计提供数据支撑。
5. 项目说明
【问题说明】
开发一套面向船舶装备故障诊断的智能问答系统,需解决以下核心问题:
(1)知识结构化难题:将非结构化的故障案例、维修手册转化为机器可理解的结构化知识,建立船舶装备领域知识图谱。
(2)精准检索挑战:实现故障现象描述与解决方案的语义级和结构化知识匹配,克服船舶术语专业性强、表述多样化的问题。
(3)轻量化部署需求:适配船舶网络环境限制,开发可离线运行的轻量化系统,满足海上无网络场景使用。
(4)解答可靠性保障:确保系统输出的维修建议可追溯、有依据,避免误导性内容。
【用户期望】
参赛团队需开发兼具实用性与创新性的智能问答原型系统,具体期望包括:
(1)知识覆盖度:支持船舶发动机、液压系统、电气设备等至少3类关键装备的常见故障诊断,知识图谱构建能覆盖提供的业务面。
(2)问答准确率:对典型故障问题的语义检索和知识图谱检索融合结果召回率不低于90%,最终解答准确率不低于80%(以领域专家评估为准)。
(3)响应性能:单轮问答响应时间不超过3秒,支持文本输入与关键词检索两种交互方式。
(4)知识可视化:提供知识图谱可视化界面,展示故障原因-解决方案的关联关系。
(5)可扩展性:系统架构应支持新增装备类型与故障案例的快速导入。
6. 任务要求
【开发说明】
参赛团队需完成从知识构建到系统部署的全流程开发,具体包括:
(1)知识体系设计:
① 设计船舶装备故障知识的本体结构(至少包含故障现象、故障原因、维修步骤、零部件、注意事项等核心实体)。
② 制定知识表示规范,统一故障描述术语与维修流程表述。
(2)知识图谱构建:
① 基于提供的船舶故障案例,完成知识抽取与清洗。
② 使用开源工具构建小型知识图谱。
(3)RAG系统开发:
① 选择合适的开源语言模型(如Llama 3、GLM-4等)作为基础模型。
② 实现检索增强模块,支持基于关键词与语义向量的混合检索。
③ 开发问答交互界面,支持历史对话管理与答案导出功能。
(4)系统优化与测试:
① 针对提供的测试问题优化检索策略,提升答案准确率。
② 完成系统轻量化处理,确保在普通PC端可流畅运行。
【技术要求与指标】
(1)核心技术栈要求:
① 知识图谱构建:Neo4j/GraphDB(二选一)
② 自然语言处理:Python+LangChain框架
③ 前端开发:推荐Streamlit/Flask+HTML,可以使用其他框架
④ 模型选择:限用开源模型(参数规模≤7B),使用公网API调用方式需注明来源
(2)性能指标:
① 知识图谱规模:实体数≥500,关系数≥80
② 问答准确率:在测试集上Top1答案准确率≥75%(精确匹配)
③ 系统资源占用:内存使用≤8GB,启动时间≤30秒
④ 离线运行能力:完全离线环境下可正常提供问答服务
【提交材料】
(1)项目概要介绍;
(2)项目简介PPT;
(3)项目详细方案;
(4)项目演示视频;
(5)企业要求提交的材料:
① 知识图谱设计文档(含本体结构、实体关系定义)
② 源代码调用关系图(关键代码请截图)
③ 可执行程序包(Windows环境,无需安装依赖)
④ 测试报告(含提供的测试问题及系统响应结果)
⑤ 3分钟系统演示视频(展示知识图谱可视化与问答流程)
(6)团队自愿提交的其他补充材料。
【任务清单】
(1)需求分析与技术选型报告
(2)知识图谱设计与数据处理
(3)完成提供的故障案例的实体抽取与关系标注
(4)构建知识图谱并导入数据
(5)RAG系统开发
(6)开发交互界面
(7)系统测试与优化
(8)文档撰写与成果封装
【开发工具与数据接口】
(1)命题单位提供船舶故障案例、机海损案例、维修方案、维护手册等知识数据支持
(2)推荐开发工具清单:
① 知识图谱:Neo4j Desktop(免费社区版)
② 模型训练与推理:Hugging Face Transformers库、llama factory
③ 界面开发:Streamlit(Python库,无需前端经验)
所有工具均为开源或免费版本,无需额外采购。命题单位提供链接用于数据下载(链接将在比赛启动后公布)。
7. 其他
参赛团队允许使用公开的通用语言模型权重文件,但需在技术报告中注明模型来源与版本。系统开发过程中需遵守数据安全规范,不得泄露或传播命题单位提供的原始数据。
8. 参考信息
开源知识图谱构建工具:Neo4j官方文档(https://neo4j.com/docs/)
RAG技术实践:LangChain官方教程(https://python.langchain.com/docs/get_started/introduction)
船舶工程参考资料:《船舶电气设备维护与修理》(人民交通出版社)
评估指标参考:信息检索领域标准指标(Precision@k、MRR、NDCG)
9.评分要点
赛题评分要点见附件一:A类企业命题初赛统一评分标准。