【A02】文心一言插件设计与开发【百度】
发布时间: 2023-12-27 13:54:24

1.命题方向

智能计算

2.题目类别

应用类

3.题目名称

文心大模型插件设计与开发

4.背景说明

【整体背景】

大规模语言模型相继发布,生成式人工智能技术及产品的快速迭代重塑着千行百业,带动了人工智能产业的快速发展。插件机制作为一种新的大模型应用形态,旨在拓展大模型能力边界,更适应场景需要。

在大模型生态的建设过程中,高校学子是创新的重要力量。繁荣的插件生态,是大模型应用生态的重要组成部分,开发者基于大模型打造的具有场景价值的插件,能够更具体地在某个领域产生价值。我们希望通过本命题,吸引并孵化更多高校学子开发具有落地价值的插件,推动国产大模型生态的繁荣。

【公司背景】

百度是拥有强大互联网基础的领先AI公司,是全球为数不多的提供AI芯片、软件架构和应用程序等全栈AI技术的公司之一,被国际机构评为全球四大AI公司之一。百度以“用科技让复杂的世界更简单”为使命,坚持技术创新,致力于“成为最懂用户,并能帮助人们成长的全球顶级高科技公司”。百度以技术创新为信仰,在创新投入、研发布局、人才引进方面均走在国际前列。2020年,百度核心研发费用占收入比例达21.4%,研发投入强度位于中国大型科技互联网公司前列。百度全球AI专利申请量已超过1万件,其中中国专利9000多件,位列中国第一,并在深度学习技术、智能语音、自然语言处理、自动驾驶、知识图谱、智能推荐等多个领域排名国内第一。

【业务背景】

如果说文心一言是一个智能中枢大脑,插件就是文心一言的耳、目、手。插件将“文心一言”AI能力与外部应用相结合,既能丰富大模型的能力和应用场景,也能利用大模型的生成能力完成此前无法实现的任务。举几个例子:

1)信息增强

这类插件可以帮助用户获取更具时效性和专业性的信息,例如文心一言接入的百度搜索插件,使文心一言能够搜索全网的实时信息;此外还有帮助用户检索专业领域信息的插件,找房、找车、找法条、找股票等。即你的插件可以调用外部API的信息。

2)交互增强

帮助文心一言理解PDF、图片、语音等多模态的输入,帮助文心一言生成思维导图、视频等多模态的输出。例如,支持用户上传文档,并基于文档进行问答的插件等。即你的插件可以有较为全面的模态交互。

3)服务增强

这类插件可以帮助用户自动化执行一些常见的任务,例如订机票、发邮件、管理日程、创建调查问卷等;也可以是利用模型能力,大大提升现有服务的体验,例如可以让模型基于用户的简历及岗位要求信息,生成面试问题,结合TTS/ASR,为用户打造一场真实而独特的模拟面试。即你的插件可以和外部的应用/API服务打通。

5.项目说明

【问题说明】

本命题欢迎选手基于自身对用户需求和痛点的洞察,通过插件设计来扩展大模型的能力边界,增强大语言模型在专业领域信息(如特定的学科,实现大模型+X专业)、实时数据(如新闻、股票、天气)、以及多模态技术(如可视化图表/PPT/H5生成、图像、音频与视频分析和生成)的功能。

作品范围包括但不限于新闻资讯、教育学术、办公效率、学习效率、社会公益、游戏娱乐、专业知识问答等。参赛作品必须遵循文心一言插件的开发指南、开发标准等相关协议及规定,并且能够在文心一言平台上正常运行。

【用户期望】

选手可以充分调研对应插件方向下,相关利益者的具体需求,从用户及其使用场景与目标出发,驱动产品的设计定义。

6.任务要求

【开发说明】

本命题产品要求选手深入理解学习需求与场景,深度发挥大语言模型的技术优势,面向学习场景下的用户体验与学习效果,打造基于文心大模型插件平台的优质插件。选手在核心开发环节上可以分为三步:

1)外部服务建设及API化:该服务可以侧重数据供给(如天气、交通等实时信息,如算法对图像的处理结果或自己构建的一个数据库服务等)、也可以侧重数据解析(如对文本进行表格化/思维导图化/PPT化)、也可以侧重控制传递(如控制一个界面/服务/实体的操作)等。也就是选手做插件之前,要想好一件事:除了大模型能力以外,你还需要再去做哪些应用/服务,将大模型没有做到或者做的不太好的地方进行优化,这个外部的能力,将是未来插件的核心。

2)插件开发:基于文心一言的插件开发及描述方式等规则,把构建的外部服务,结合进去。

3)本地上线与打磨优化:结合场景需求与用户体验要求,对插件进行实际测试与打磨。

【技术要求与指标】

1)技术要求:以文心一言的插件机制为基础,设计和开发具有实际使用场景的插件。

2)指标:

功能完整性:对场景/用户需求的分析与满足,提出了较为完整的方案并付诸实现。选手可以从插件使用者视角进行设计,充分利用LLM对用户需求进行任务拆解、目标规划、自动执行的能力;

②上线可交互:成功提交到文心一言插件入口;

③性能优越性:在插件的使用稳定性、内容输出效果和容错性上,具有良好的表现。需测试30条以上插件case,满足率达到70%;

④数据流通性:创新的数据策略设计和数据资源整合。

【提交材料】

1)项目概要介绍;

2)项目简介PPT;

3)项目详细方案;

4)项目演示视频;

5)企业要求提交的材料:

①产品使用手册:包括场景/用户调研结果、插件功能架构、使用流程图、数据流通机制和典型使用场景与示例;

②产品交互演示:对插件上线后的交互过程进行录制;

③项目的详细分工及过程文档:对团队成员的角色、分工、排期和过程进行记录;

6)团队自愿提交的其他补充材料。

【任务清单】

基于文心一言大模型能力,以文心一言的插件机制为基础,打造面向新闻资讯、教育学术、办公效率、学习效率、社会公益、游戏娱乐、专业知识问答等领域的插件。参赛作品必须遵循文心一言插件的开发指南、开发标准等相关协议及规定,并且能够在文心一言平台上正常运行。

【开发工具与数据接口】

(1)一言开发者文档: https://yiyan.baidu.com/developer/doc 

(2)插件上线入口:https://yiyan.baidu.com/developer 

7.其他

 

8.参考信息

9.评分要点

赛题评分要点见附件一:A 类企业命题初赛统一评分标准。

订阅号