【A02】基于文心大模型的多Agent合作模拟系统设计【百度】
发布时间: 2024-12-12 16:07:21

1.命题方向

智能计算

2.题目类别

应用类

3.题目名称

基于文心大模型的多Agent合作模拟系统设计

4.背景说明

【整体背景】

随着人工智能技术的不断进步,通过在数字世界模拟人类社会复杂行为,来推动通用人工智能构建(AGI)发展,已成为研究热点。通过构建多智能体系统,并在虚拟场景中模拟复杂的人类合作型活动,可以深入探索智能体的协作关系、项目运作逻辑以及社会行为模式。

【公司背景】

百度是拥有强大互联网基础的领先AI公司,是全球为数不多的提供AI芯片、软件架构和应用程序等全栈AI技术的公司之一,被国际机构评为全球四大AI公司之一。百度以“用科技让复杂的世界更简单”为使命,坚持技术创新,致力于“成为最懂用户,并能帮助人们成长的全球顶级高科技公司”。百度以技术创新为信仰,在创新投入、研发布局、人才引进等方面均走在国际前列。2020年,百度核心研发费用占收入比例达21.4%,研发投入强度位于中国大型科技互联网公司前列。百度全球AI专利申请量已超过1万件,其中中国专利9000多件,位列中国第一,并在深度学习技术、智能语音、自然语言处理、自动驾驶、知识图谱、智能推荐等多个领域排名国内第一。

【业务背景】

飞桨(PaddlePaddle)是由百度研发的开源深度学习平台,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。

文心(ERNIE)是百度自主研发的产业级知识增强大模型,以创新性的知识增强技术为核心,从单模态大模型到跨模态、从通用基础大模型到跨领域、跨行业持续创新突破,构建了模型层、工具与平台层,大幅降低人工智能开发和应用门槛,加快人工智能大规模产业化进程并拓展人工智能技术边界。2024年8月22日消息,文心大模型日均调用量超6亿次,日均处理Tokens文本约1万亿,均为国内最高。

当前,智能体是重要的发展方向,智能体是在基础模型上,进一步进行思考增强训练,包括思考过程的有监督精调、行为决策的偏好学习、结果反思的增强学习,进而得到思考模型。智能体的思考模型像人一样,会阅读说明书,学习工具的使用方法,进而可以调用工具来完成任务。

如在文心大模型4.0工具版上,提问“我要到大湾区出差一周。想了解一下天气变化,好决定带什么衣服。请帮我查一下未来一周北京和深圳的温度,告诉我出差应该带什么衣服,并整理成表格。”智能体就像人一样,通过思考、规划,把用户需求拆解成多个子任务,首先调用“高级联网”工具来查询天气信息,然后调用“代码解释器”画温度趋势图,根据未来一周的天气情况,选择了合适的衣物,最后对结果进行思考、确认,并自动汇总成一个表格。

这样的复杂任务“拆解”、“串联”与“协同”,具有广泛的真实意义。我们希望选手在Unity的虚拟世界中,围绕某一领域,基于文心大模型,构建一套多Agent协作系统,选取某个特定主题,进行复杂合作任务的完成。

5.项目说明

【问题说明】

(1)社会行为复杂性:人类社会行为涉及多个智能体的协作、沟通和决策,如何准确模拟这些行为并体现其复杂性是一个挑战;

(2)可视化展示效果:如何将模拟过程和结果以直观、清晰的方式展示出来,使用户能够方便地查看任务进度、Agent行为和整体任务完成情况;

(3)交互方式设计:如何设计合理的交互方式,使用户能够方便地设计任务、搭建虚拟场景、管理知识库与Agent成员、追踪任务进度并进行数据统计。

【用户期望】

面向科研、教育和娱乐等领域,我们希望选手能够基于文心大模型和Unity的能力,面向某一特定主题,小到晚会举办、开办公司,大到城市管理、行业,打造出一个能够模拟人类社会合作行为、具备过程可视化和结果可靠输出的多Agent社会行为模拟系统。

6.任务要求

【开发说明】

本命题要求选手深入理解社会行为模拟的需求,结合文心大模型和Unity,开发一个可云端或本地部署的软件系统。

【技术要求与指标】

1)模型使用要求:使用文心大模型进行Agent的开发,Agent具备分析、理解、决策和交流等能力;

2)场景搭建要求:使用Unity进行虚拟场景的搭建,包括场地布局、建筑物、设备等元素,以模拟真实世界中的环境;

3)协作关系建模:选取针对性的场景主题,构建不同Agent之间的协作关系和交互过程,包括策划、沟通、冲突解决、成果输出、反思等尽可能全面的流程;

4)可视化展示:设计直观、清晰的可视化界面,展示Agent的活动过程和结果,以及虚拟场景的状态和整体任务完成情况;

5)交互方式设计:提供便捷的交互方式,使用户能够设计任务、微调场景、追踪与查看进度、检索信息、检查成果和进行数据统计与复盘;

6)任务监管:实现对Agent行为的监管,确保模拟的社会行为符合社会主流价值观;

7)部署要求:系统应能够部署在云端或本地上,优先能够在云端允许多用户同时访问和使用;

8)附加功能:获取真实世界信息,如地理位置、天气系统、实时股票、公开资料等辅助Agent世界的建构。选手也可发挥想象力,通过摄像头、麦克风等输入,通过飞桨深度学习感知模型,把真实世界的特征加入Agent协作过程,增强人机交互丰富性。

【提交材料】

1)项目概要介绍;

2)项目简介 PPT;

3)项目详细方案;

4)项目演示视频;

5)企业要求提交的材料:

①产品使用手册:包括产品功能架构、使用流程图和典型学习示例;

②产品交互演示:对产品的交互过程进行录制、Agent如上线请附上链接;

③项目的详细分工及过程文档:对团队成员的角色、分工、排期和过程进行记录。

6)团队自愿提交的其他补充材料。

【任务清单】

包括但不限于以下功能:

1)集成文心大模型,确保Agent具备所需能力;

2)使用Unity构建特定的虚拟场景;

3)设计Agent间的协作关系和角色职责;

4)开发直观的可视化界面展示Agent活动和场景状态;

5)打造满足上文技术要求的交互方式;

6)本地或云端部署;

7)利用感知模型增强人机交互,探索AR/VR等创新方式(可选);

8)打通真实世界与虚拟场景,增强人机交互丰富性(可选)。

【开发工具与数据接口】

大模型能力调用指定平台:要求通过千帆SDK进行文心大模型的调用。

深度学习平台:PaddlePaddle

 

7.其他

命题方可为选手提供Unity基础世界模板。

8.参考信息

千帆:https://qianfan.cloud.baidu.com/

飞桨:https://www.paddlepaddle.org.cn/ 

Unity:https://unity.com/

9.评分要点

赛题评分要点见附件一:A 类企业命题初赛统一评分标准。

订阅号