【A01】基于百度飞桨和文心大模型的桌面微缩剧场多智能体演绎系统设计【百度】
发布时间: 2026-02-12 15:17:13

《A类赛题手册》下载地址:https://www.fwwb.org.cn/news/show/598

1.命题方向

智能计算

2.题目类别

应用类

3.题目名称

基于百度飞桨和文心大模型的桌面微缩剧场多智能体演绎系统设计

4.背景说明

【整体背景】

随着生成式人工智能、机器人技术与具身智能(Embodied Intelligence)的快速发展,AI 正从“工具型执行系统”向“具备角色认知、叙事能力与群体表达能力的智能体系统”演进。

在传统机器人应用中,智能体更多关注任务完成效率,而在新兴的人机互动、数字内容创作、智能玩具与沉浸式展陈等场景中,“是否像角色”“是否有表达”“是否能协同演绎” 正成为衡量智能系统先进性的重要维度。

在这一背景下,桌面级微缩空间为具身智能提供了一个低门槛、高表现力、可控性强的真实世界实验场。多个微型机器人在同一物理桌面中进行移动、互动与协作,犹如在演绎《玩具总动员》/《汽车总动员》,承载着“角色—剧情—舞台—演绎”的表达结构,成为探索多智能体叙事、协作与行为生成的重要载体。

本赛题聚焦于“桌面微缩剧场”这一应用形态,鼓励参赛团队构建一个由大模型驱动、多智能体协同演绎的交互系统,实现从文本理解 剧情生成 多智能体决策 实体机器人行为执行 视觉反馈与即兴调整的完整技术闭环。

【公司背景】

百度是拥有强大互联网基础的领先AI公司,是全球为数不多的提供AI芯片、软件架构和应用程序等全栈AI技术的公司之一,被国际机构评为全球四大AI公司之一。百度以“用科技让复杂的世界更简单”为使命,坚持技术创新,致力于“成为最懂用户,并能帮助人们成长的全球顶级高科技公司”。百度以技术创新为信仰,在创新投入、研发布局、人才引进方面均走在国际前列。2020年,百度核心研发费用占收入比例达21.4%,研发投入强度位于中国大型科技互联网公司前列。百度全球AI专利申请量已超过1万件,其中中国专利9000多件,位列中国第一,并在深度学习技术、智能语音、自然语言处理、自动驾驶、知识图谱、智能推荐等多个领域排名国内第一

【业务背景】

飞桨(PaddlePaddle)是由百度研发的开源深度学习平台,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。

文心是百度自主研发的产业级知识增强大模型,以创新性的知识增强技术为核心,从单模态大模型到跨模态、从通用基础大模型到跨领域、跨行业持续创新突破,构建了模型层、工具与平台层,大幅降低人工智能开发和应用门槛,加快人工智能大规模产业化进程并拓展人工智能技术边界。

5.项目说明

【问题说明】

1)剧情理解与角色建模问题

如何基于用户输入的抽象主题,生成结构完整、角色清晰、关系合理的短剧剧情,并将文本叙事转化为可执行的智能体行为指令,是系统设计的核心挑战之一

2)多智能体协同决策问题

在同一物理桌面空间内,多个机器人需要在共享规则下进行协同走位、互动与群体演绎,如何保持秩序并符合剧情需要,对多智能体决策与协作提出较高要求

3)文本到实体行为映射问题

如何将剧情文本中的情绪、语义与动作提示,映射为机器人可执行的运动参数、姿态变化或灯光反馈,是具身智能落地的关键工程问题

4)系统稳定性与即兴调整问题

在真实桌面环境中,机器人执行误差、环境扰动等情况不可避免,系统需要具备一定的感知反馈与动态调整能力,保证演绎过程的连续性与安全性

【用户期望】

面向具身智能与多机器人系统领域,我们希望参赛团队能够基于飞桨和文心大模型,构建一个兼具工程完整性、表达能力与观赏价值的桌面微缩剧场具身智能系统,可以理解为:一个基于多智能体合作的角色创建和剧本生成软件和一套用于演绎多智能体剧本的桌面机器人(可自己DIY,参见《汽车总动员》)。

6.任务要求

【开发说明】

本命题要求参赛团队围绕“桌面微缩剧场”场景,构建一套由大模型统一调度、多机器人协同演绎的具身智能系统,整体需体现如下技术范式:

具身智能体 = 感知(视觉) + 认知(大模型叙事) + 决策(多智能体思考) + 生成(内容生成)+ 执行(桌面机器人行为演绎) + 反馈(虚实同步与即兴调整)

【技术要求与指标】

(一)大模型认知与叙事生成

l 基于文心大模型完成剧情脚本生成;

l 自动生成角色设定、关系与剧情节奏。

(二)多智能体决策与协同

l 支持不少于 3 台机器人协同演绎;

l 支持群体走位、互动与站位控制。

(三)执行与实体演绎

l 将决策结果映射为实体机器人的运动与交互行为;

l 保证演绎过程的稳定性与安全性。

(四)可视化与交互

l 提供剧情生成与演绎过程的可视化界面;

l 鼓励虚拟剧情与现实机器人演绎的对照展示。

【提交材料】

1)项目概要介绍;

2)项目简介PPT;

3)项目详细方案;

4)项目演示视频;

5)企业要求提交的材料:

① 产品使用说明文档(系统架构与流程说明);

② 虚拟到现实部署说明与对比分析;

③ 项目分工、开发过程与训练记录文档;

6)团队自愿提交的其他补充材料。

【任务清单】

包括但不限于以下功能:

1)剧情与角色生成

l 基于文心大模型,根据用户输入主题生成短剧脚本;

l 自动完成角色设定、角色关系与剧情节奏划分。

2)实体机器的对话与动作

l 从剧情文本中提取情绪标签与动作提示;

l 建立“情绪—运动”映射规则,驱动实体机器人完成对话与互动。

3)多机器人协同演绎

l 支持不少于 3 台机器人协同参与演绎;

l 实现追逐、围合、对话站位等群体舞台行为。

4)剧情可视化系统

l 提供剧情生成与演绎过程的可视化面板;

l 建议包含虚拟剧情与现实机器人演绎的对照展示。

【开发工具与数据接口】

深度学习及强化学习:PaddlePaddle

大模型及智能体:文心大模型

仿真:unity/ Isaac Sim

【实体硬件】

本赛题所涉及的实体硬件系统,参赛团队可选择以下方式完成实体系统搭建:

n 自主 DIY:参赛团队可自行设计并搭建符合赛题要求的硬件系统;

n 官方示范系统方案

7. 其他

仿真示例系统将在2026年3月进行开放。

8. 参考信息:暂无

9. 评分要点

赛题评分要点见附件一:A类企业命题初赛统一评分标准

订阅号