【A22】基于AI大语言模型的情感陪护虚拟数字人系统【江苏大学】
发布时间: 2026-02-12 16:30:49

《A类赛题手册》下载地址:https://www.fwwb.org.cn/news/show/598

1.命题方向

智能计算

2.题目类别

计算类

3.题目名称

基于AI大语言模型的情感陪护虚拟数字人系统

4.背景说明

【整体背景】

随着我国60岁以上人口突破3亿大关,空巢老人占比超50%,老年群体面临"物质保障充足但精神孤独突出"的显著矛盾。传统家庭养老模式因代际分离、子女异地工作等现实因素逐渐式微,而现有养老服务体系在情感陪伴维度存在显著缺口:医疗机构日均接待陪诊需求超3000人次,养老机构中98.3%的失能老人存在持续性情感支持需求,传统陪护服务因标准化不足、专业人才短缺等问题难以满足深层情感诉求。

【单位背景】

江苏大学是2001年8月经教育部批准,由原江苏理工大学、镇江医学院、镇江师范专科学校合并组建的重点综合性大学,是江苏省人民政府和教育部、农业农村部共建高校,以及首批江苏省高水平大学建设高校、全国本科教学工作水平优秀高校、首批全国50所毕业生就业典型经验高校、全国创新创业典型经验高校、首批全国来华留学质量认证高校、全国“三全育人”综合改革试点高校。

江苏大学计算机科学与通信工程学院有控制科学与工程(模式识别与智能系统)一级博士点建设方向及硕士点,计算机科学与技术、网络空间安全、信息与通信工程、集成电路科学与工程(通信与信息处理集成电路方向)4个一级学科硕士点,另有电子信息(计算机技术、软件工程、人工智能、通信工程4个专业领域)全日制专业学位硕士点和工程硕士授予权。近5年先后承担并完成了国家自然科学基金重点及其它各类项目、国家重点研发计划、国防重大项目等一批国家及省部级高新技术课题,获省部级科技进步奖20余项,出版学术著作、教材30余部,发表高质量学术论文1000余篇。

5.项目说明

【问题说明】

系统需要构建以数字人为核心的“感知-认知-干预”主动闭环,构建一个数据驱动、智能决策、人机协同的主动式闭环业务流程,实现对用户心理状态的评估、引导/干预、再评估的闭环。

【用户期望】

选手需深入研究相关AI技术,构建智能化、个性化心理健康完全自主数字人干预体系,实现“可陪伴、可引导、可持续”的心理健康、情感支持服务模式的新升级。

6.任务要求

【开发说明】

系统需要实现的目标如下:

1、 交互与服务

a) 需提供表现力丰富的2D/3D数字人形象,支持自然流畅的语音对话(TTS)、精准的口型同步(Lip-sync)、丰富的面部表情和适度的肢体动作,支持文本和语音两种主流交互模式,确保交互过程自然、低延迟。

b) 多模态数据采集,系统集成摄像头、麦克风等设备,实时采集用户信息,用于后续分析用户心理、情感状态。

2、 智能与驱动

a) 基于大语言模型(LLM)与心理学知识库,开发或集成针对焦虑倾向、抑郁倾向、双向情感障碍风险等的专用AI模型,生成富有共情力和专业性的对话内容。

b) 对视频、语音、文本特征进行时空对齐与语义融合,解决模态冲突,形成统一、稳健的心理状态理解。

c) 构建数字人面部行为驱动模型,实时驱动数字人的表情、口型、动作,确保音画同步。

【技术要求与指标】

1、多模态数据采集技术要求与指标:参赛队伍需构建语音识别模型,模型的词错率(WER)≤10%:

  

句错率(SER)≤40%:

   

2、大语言模型技术要求与指标:大语言模型使用语音识别的文本作为模型的输入,并具备上下文感知能力,支持≥10轮连续对话,可依输入语境生成非预设、非模板化的连贯自然语言解释,兼具追问响应、语义澄清及内容总结功能,保障对话逻辑连贯无脱节、交互稳定无中断闪退。模型上下文窗口长度≥8k tokens,单个样本推理响应时间≤60秒。

3、数字人面部行为驱动模型的技术要求与指标:参赛队伍需要构建数字人面部行为驱动模型,并利用指定的训练集对该模型进行评估。评估体系涵盖核心指标与个性化任务两大维度。其中核心指标包括合适性FRCorr/FRdist、多样性FRDiv/FRDvs/FRVar、真实性FRRea、同步性FRSyn共7项细分指标,个性化任务为PMAFRG任务(以FRCorr*为评估指标),作为扩展评估指标。该项综合总评分(S)计算公式如下:

  

若评估过程中某一指标无对应数据,该指标对应分值按0分计取。针对多个数字人场景,面部反应生成水平评估最终得分取各数字人评估分数的最大值。

【提交材料】

1)项目概要介绍;

2)项目简介PPT;

3)项目详细方案;

4)项目演示视频;

5)企业要求提交的材料:

可执行的参赛作品docker镜像或软件安装包

可执行的数字人面部行为驱动模型工程文件

可执行的语音识别模型工程文件

6)团队自愿提交的其他补充材料。

【任务清单】

包括但不限于以下功能:

1、 提供不少于2个表现力丰富的2D/3D数字人形象,该形象需由数字人面部行为驱动模型驱动,具备自然流畅的语音对话、精准的口型同步(Lip-sync)、丰富的面部表情和适度的肢体动作,确保交互过程自然、低延迟。

2、 系统基于大语言模型(LLM)与心理学知识库,开发或集成针对焦虑倾向、抑郁倾向、双向情感障碍风险等的专用AI模型,生成富有共情力和专业性的对话内容。

3、 系统需对视频、语音、文本特征进行时空对齐与语义融合,解决模态冲突,形成统一、稳健的心理状态理解。

【开发工具与数据接口】

7.其他

8.参考信息

1、数字人面部行为驱动模型的评估训练集:待补充

9.评分要点

赛题评分要点见附件一:A 类企业命题初赛统一评分标准。

除以上评分要点内容外,企业还重点关注以下内容:技术要求与指标达成度。
订阅号