大学生服务外包创新创业大赛--【A34】医学文献智能识别与检索系统设计【慧逊科技】

【A34】医学文献智能识别与检索系统设计【慧逊科技】

发布时间： 2022-11-24 17:46:10

本届A类赛题可通过以下方式提问与交流：

1、大赛官网团队账号-赛题答疑区提问，组委会定期收集问题提交至企业解答后公布；

2、可前往赛题答疑论坛（PC端点击链接）：https://mastergo.com/file/77782156635006?utm_source=fwwb&utm_medium=saitishouce&utm_campaign=&utm_term=&utm_content=提问或交流，企业定期回复。

1.命题方向

智能计算

2.题目类别

商业类

3.题目名称

医学文献智能识别检索系统设计

背景说明

【整体背景】

医药行业医药代表的日常工作中，不仅要向客户提供产品注册证等资质文件，也同时需要提供更多专业性文献资料。这些医学文献不仅数量巨大，渠道众多，而且文件中含有大量的医学图片，普通的检索功能难以满足医药代表和医生的日常工作需求。为了医疗企业的合规性要求，更及时地服务于内外部，进一步推进企业的数智化转型，打造全新的医学文献智能识别检索系统迫在眉睫。

【公司背景】

上海慧逊科技有限公司隶属于慧博云通科技集团，凭借前沿的人工智能技术持续为企业客户提供创新和高价值解决方案，致力于为全球客户提供人工智能项目落地实施服务，目前已在汽车、医疗、零售、旅游行业中拥有大量应用。

慧逊科技在企业智能对话方面有卓越的实施落地能力，特别是搭建行业和特定场景的对话机器人脑库、应用的语音交互以及搭建行业和特定场景的识别机器人。

【业务背景】

医学文献作为医疗企业的核心资料，工作人员需要向医药代表快速且精准提供相关医学信息与文献已经成为日常工作，借助人工智能技术打造医学文献识别检索系统势在必行。

5.项目说明

【问题说明】

当前医疗行业中医学文献检索的痛点：

（1）大量的医学文献依靠工作人员人工阅读记录并筛选，效率低下，且造成巨大的人力消耗与浪费。

（2）对于工作人员有极高的专业判断水平要求。

（3）常规系统的检索功能无法识别到医学影像图片中的文字，导致大量的重要医学文献与信息无法及时提供。

【用户期望】

为解决当前医学文献检索的痛点，期望借助图像文字识别技术（OCR）打造"医学文献智能识别检索系统"，实现对大量有医学影像图片的医学文献进行智能识别与管理，精准快速地获取医药代表与医生所需的文献资料。

6.任务要求

【开发说明】

可以基于目前行业主流智能图像识别与检索引擎等技术进行设计，以达到更好的体验，使用H5设计方案进行演示。围绕前述医学文献智能识别与检索的场景，解决用户真实使用场景的痛点，自主拟定聚焦问题并定义相应的用户场景和设计场景模式，完成完整的场景演示。

【技术要求与指标】

使用智能图像识别技术，将图像中的文字进行精准识别。

技术指标：医学影像中的文字识别准确率92%；

【提交材料】

（1）项目概要介绍；

（2）项目简介PPT；

（3）项目详细方案；

（4）项目演示视频；

（5）企业要求提交的材料：

①提交内容参考【技术要求与指标】。

（6）团队自愿提交的其他补充材料。

【任务清单】

（1）可批量导入医学文献（医学文献格式：PDF）。

（2）输入需要检索的关键信息，精准查询到所有相关的医学文献，包括能够识别到医学文献的影像图片中含有对应关键信息。

（3）通过单个医学文献的“查看详情”功能，可以查看该医学文献中关键信息所在位置的摘要信息，并可进一步查看文献PDF中关键信息所在页的详细内容。

（4）支持PC端和手机端，同时支持医学文献PDF的下载功能。

【开发工具与数据接口】

由团队自主模拟测试环境。

7.其他

无

8.参考信息

https://help.aliyun.com/product/252763.html

人工智能文字识别技术

9.评分要点

赛题评分要点见附件一：A 类企业命题初赛统一评分标准。

同时企业还重点关注以下要点：

（1）能够上传任意PDF进行归档。

（2）开发文字识别模型。

（3）通过搜索栏，可以将包含搜索内容（包括图片中的文字）的文档搜索出来，搜索结果精确到该内容在PDF中的页数，并且摘要命中段落，段落长度50字左右。

（4）对搜索结果计算命中得分，命中得分高（命中频次越多，搜索得分越高）排序靠前。

（5）搜索结果展示总分以及各搜索维度的得分情况。

（6）搜索的文献可以在线阅读，也可以进行下载。

分赛区