《A类赛题手册》下载地址:https://www.fwwb.org.cn/news/show/598
1.命题方向
智能计算
2.题目类别
应用类
3.题目名称
基于多源数据的大学生行为分析与干预模型设计
4.背景说明
【整体背景】
党的二十届三中全会指出:推进数字化教育,赋能学习型社会建设,习近平总书记在2024年全国教育大会指出:深入实施国家教育数字化战略,扩大优质教育资源受益面,提升终身学习公共服务水平。数据是教育高质量发展的核心要素。教育高质量发展以数智化为重要着力点充分释放数据要素的内生动力,搭建数字赋能平台,以数据流引领技术流、资金流、物资流、人才流 ,让数智增强成为推进教育数字化转型发展的新动能。教育大数据是整个教育活动过程中所产生的以及根据教育需要采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合。通过对教育大数据的分析,激活数据价值、打破数据“黑箱”,发挥数据智能,深度理解大学生行为与认知规律,可以有的放矢地制定、执行教育政策,将“千人千面”的教学与服务从愿景转化为现实,为教育数字化转型提供有力的技术支撑。
【公司背景】
三六零数字安全科技集团有限公司是国内领先的数字安全与人工智能企业,核心业务覆盖数字安全、大数据智能分析、人工智能应用等领域,依托“安全 + AI” 双轮驱动战略,构建了从数据采集、处理、分析到智能决策的全链条技术体系。360拥有全球领先的大数据存储与分布式计算平台、数据分析和挖掘技术、智能分析算法引擎,以及拥有从算力纳管到模型训推、以及基于知识库和智能体的AI应用等全链条人工智能技术等核心技术,拥有近万件原创技术专利;同时,360是国家人工智能标准化大模型专题组组长单位、中国人工智能产业发展联盟副理事长单位、工信部认可的AI安全链主企业,以及拥有国家级大数据协同安全技术国家工程研究中心、国家新一代人工智能开放创新平台,360深耕智慧教育、数字政务等多个垂直领域,致力于通过数智化能力赋能教育行业高质量发展,推动教育数字化转型,助力学习型社会建设。
【业务背景】
360数字安全集团重点发展云计算、大数据、人工智能等新一代信息技术,在数字安全方面,积极投身产业数字化,为政府、企业、城市和中小微企业数字化、智能化转型保驾护航。人工智能方面布局“两翼齐飞”策略,加速自研大模型的行业落地和赋能,同时打造原生AI应用“纳米AI搜索”,发布三个月内,下载量超2000万,日活和用户增长速度远超同类应用。在大数据分析领域,包括基于对象模型的多源数据标准化和内容智能推荐技术、海量多级数据收敛聚合技术、基于多维度行为的关联画像技术;在人工智能领域,发布了全球首个L4级智能体、纳米AI多智能体蜂群首个上线,包括智能编辑器、智能体“蜂群”引擎、Agent运行客户端、安全保障体系等完备功能,以及集成模型训层、基础模型与算力、数据与知识搜索,和集成5万多个专家智能体、几百种MCP工具、Deep Search服务、Deep Research服务、幻觉治理等服务,形成真正的SEAFactory超级智能体工厂。利用智能体工厂卓越的智能应用构建、L4级多智能体蜂群、人在回路支持、零代码搭建GUI智能应用、异构智能体纳管、全面的智能体安全、智能体全生命周期调优等能力,可很好支撑多用户、大数据量、高性能的智能数据挖掘和分析工作。
5.项目说明
【问题说明】
高校数字化校园建设积累了海量多源异构的学生行为数据,为精准分析学业影响因素、预测成效提供了坚实基础。传统大学生学业研究多依赖问卷调查、小样本实验等方法,存在滞后性、主观性强等缺陷,难以全面揭示学业影响的复杂机制。针对上述问题,基于学生客观行为痕迹,挖掘认知与学业发展规律,助力智慧教育从“事后补救”向“事前预警、过程干预”转型。
【用户期望】
(1) 基于多源数据的学生画像生成与更新
(2) 学业轨迹演化模式挖掘与关键行为分析
(3) 面向教育大数据可视化叙事模型设计
(4) 学业风险动态感知与预警模型构建
(5) 基于归因解释与知识增强提示的个性化报告生成
6.任务要求
【开发说明】
通过对基于多源数据进行关联分析和数据挖掘,建立学生行为分析模型,输出学习行为数据分析成果,生成个性化报告。
样本数据包含学生的基本信息、一卡通交易流水、上网日志明细、在线学习平台访问记录、线上学习数据、考试提交记录、作业提交记录、一卡通账户信息表、选课信息、读者行为、图书馆借阅记录、图书馆借阅历史、课堂任务参与、讨论记录、成绩记录、综合测评、跑步打卡数据、奖学金获奖信息、就业信息等信息。
【技术要求与指标】
开发完成程度指标:基于样本数据,输出8~10个学生行为数据分析成果,生成个性化评价报告(必须包含学生个体画像和群体画像,其他成果可自定义)。至少能发现学生的4类模式,相关预测模型的AUC不低于80%,对关键问题提供不少于3个维度的解释。
【提交材料】
(1)项目概要介绍;
(2)项目简介PPT;
(3)项目详细方案;
(4)项目演示视频;
(5)企业要求提交的材料:
①开发过程遇到的困难及解决过程简要描述;
②可运行的 Demo 实现程序;
(6)团队自愿提交的其他补充材料。
【任务清单】
(1)数据采集:建立数据采集规则,对样本数据进行采集。(可根据需要,
自行扩充样本数据的数量)
(2)数据清洗:自定义规则,把数据中的脏数据进行过滤,把多个数据源中同一个属性的描述统一表示。原始库中的数据经过数据清洗会保存到标准库中。
(3)数据建模:设计并建立用户行为的分析模型。
(4)数据分析:基于分析模型,对清洗过的样本数据进行分析,输出8~10个学习行为数据分析成果(其他成果可自行定义)
(5)成果展示:建立数据展示看板,对分析成果进行展示,生成可解释性报告。
【开发工具与数据接口】
开发工具及开发平台不限,可以借助开源工具,需基于开源工具进行创新。
7.其他
无
8.参考信息
无
9.评分要点
赛题评分要点见附件一:A类企业命题初赛统一评分标准。