出版业AI Agent的设计与实践

掌握了AI Agent的主要组件和工作原理后,你也可以设计出自己的AI Agent。

文|杨福川

2023年是“百模大战”的一年,经过一年时间的快速发展,国内外主流的通用大模型不断迭代和进化,综合能力获得了大幅提升,为它们在商业场景中的使用奠定了基础。2024年则是大模型的应用元年,在各行各业全面开花,越来越多的企业用开放的姿态拥抱大模型。大模型在企业落地的方式有很多种,目前在全球范围内被普遍认可的是“LLM+Agent”的模式,即AI Agent(智能体)。

 

何为AI Agent

Agent的概念最早由人工智能之父马文·明斯基(Marvin Lee Minsky)在他的著作《心智社会》(1985年出版)中提出。后来,罗素、诺维格、彼得在他们的著作《人工智能:现代研究方法》(1995年出版)一书中对Agent做了更详细的描述:“Agent是任何可以被视为通过传感器感知其环境并通过执行器作用于该环境的东西,能够在这个环境中自主行动,以实现其设计目标,并赋予Agent自主性、反应性、社会能力及主动性等属性。”Agent可能很复杂,也可能很简单。复杂的比如人和动物,简单的比如各种工业控制系统。

AI Agent是基于LLM构建的Agent,OpenAI将其定义为:“以LLM为大脑驱动,具有自主理解感知、规划、记忆和使用工具的能力,能自动化执行完成复杂任务的系统。”LLM具备理解、生成、逻辑、记忆等能力,使得AI Agent成为一种能够感知环境、进行决策和执行动作的智能实体。比如告诉 AI Agent 帮你安排出差行程,它会自动帮你完成行程规划、机票预订、酒店预订等一系列工作,无需人工操作。

从AI Agent的定义可以看出,AI Agent能根据外界环境的变化自动调整自己的行为和状态,还具备对外界的刺激作出反应的能力,同时还能与其他智能体或人进行合作,不同的智能体可根据各自的意图与其他智能体进行交互,以达到解决问题的目的。在不断解决问题的过程中,AI Agent以进行智能和体能积累,并修改自己的行为以应对新环境。有了这些特性,AI Agent就能在各种应用场景中表现出足够的主动能力,并发挥重要作用。将AI Agent应用的整个原理简单概括,即AI Agent通过收集和分析数据,对其进行预处理,根据机器学习算法做出决策,采取行动并接收反馈。

 

AI Agent在出版业的应用场景

前面概括性地介绍了AI Agent的定义、特征和原理,接下来简单梳理一下AI Agent在出版业中有哪些应用场景。

选题策划。在选题策划的过程中,我们经常需要定期跟踪和刷新对某些技术领域的最新信息。过去的做法是,我们首先需要锁定一些优质的信息源,然后定期阅读和学习它们提供的信息。有了AI Agent之后,我们可以让AI Agent快速获取并整理全球各种信息渠道提供的相关信息,大幅提升了我们获取信息的效率。在外版选题的策划过程中,我们经常需要定期到国外的一些网站上挖掘一些新作品,也可以通过类似的AI Agent来实现。

图书写作。很多作者在写作前,都需要搜集、阅读大量资料,然后从这些资料中提炼、抽取有价值的内容放到书稿中。传统的人工方式耗时费力,我们可以设计一个AI Agent,把搜集到的所有资料上传到AI Agent的知识库中,作者只需要告诉AI Agent主题,它就能从海量的知识库中快速提取出相应的内容,大幅提升了写作的效率。比如,你正在写作一本数据要素相关的书,搜集和整理了大量关于数据要素的政策、法规类文件,现在你可以设计一个辅助写作的AI Agent,把你搜集到的文件上传到知识库中,你就可以根据你的需求让AI Agent帮你快速整理各种信息。

图书翻译。翻译是大模型最擅长的领域之一,在AI Agent出现之前,使用AI工具翻译书稿时,我们需要频繁输入翻译提示词,而且随着对话长度的增加,翻译的质量会不断下降,因为AI没有记忆,而且每个对话的上下文长度有限制。如果设计一个专门用于翻译的AI Agent,不仅可以完全避免上面的两个问题,还能精准地处理不同领域专业术语不一致的问题,大幅提升翻译的效率。如今在翻译领域,AI Agent已经达到了专业级的水准,可以在出版行业工程化使用。

稿件润色。对书稿进行润色是我们编辑的主要工作之一,也是编辑工作中最耗时的环节。在AI Agent出现之前,用AI工具进行润色时,同样存在需要频繁输入润色指令和润色效果会随着会话长度的增加而下降等问题。专门用于润色的AI Agent可以很好地解决这两个问题。

除了以上四个典型的场景外,AI Agent在出版领域还有很多应用场景,比如出版生产和市场营销等。

 

AI Agent设计工具的选型与组件构成

工欲善其事,必先利其器。那么,如何才能获得满足我们自身需求的AI Agent呢?方式一般有两种:到各种主流的AI Agent平台上寻找平台提供的AI Agent,或利用AI Agent平台提供的功能,根据自己的需求自行设计。

目前,国内主流的AI Agent平台有如下几种:由百度推出的基于文心大模型的文心智能体平台,支持广大开发者根据自身行业领域、应用场景,选不同类型的开发方式,打造大模型时代的产品能力;由字节跳动推出的AI聊天机器人Coze(扣子),支持30秒无代码生成AI Bot,适于快速创建、调试和优化AI聊天机器人的应用程序;字节跳动旗下的飞书智能伙伴,支持多款大模型及用户自定义构建智能伙伴;阿里巴巴推出的智能化工具钉钉AI助理,允许用户根据需求创建个性化AI助理;智谱推出的生成式AI智谱清言,用户科技与ChatGLM构建各种AI Agent;一个开源的LLM应用开发台Dify.AI,支持用户以零代码或低代码的方式创建AI Agent;腾讯推出的腾讯元器,依托于腾讯混元大模型,允许用户无须编写代码即可创建和部署AI Agent,实现聊天对话、内容创作、图像生成等功能。这些平台的功能大同小异,基于这些平台开发AI Agent的方法和步骤也基本相同,但是每个平台底层的通用大模型不一样,每个平台的生态也不一样。

要设计自己的AI Agent,必须懂得AI Agent的主要组件和工作原理。而在掌握了这些基础知识后,即便你没有任何编程基础,也可以用零代码的方式设计自己的AI Agent。如果你想设计符合自己需求的AI Agent,只需要结合AI Agent设计平台的官方文档和案例演示来操作即可,并不复杂。其中的关键点在于能写好提示词并清晰梳理AI Agent的作业流程。进一步钻研学习,一定能开发出各种各样能满足日常工作需求的AI Agent。AI Agent是当前全球主流的大模型落地方式,能真正让大模型的能力赋能各行各业,未来每个人都要有设计AI Agent的能力,人人都应该成为AI Agent设计师,大幅提升工作效率和质量。■

(本文作者为机械工业出版社华章分社计算机图书事业部负责人)

 

Read Previous

《孙子兵法》“热”的冷思考

Read Next

我的第一次文学策展

Leave a Reply

Most Popular