传统出版行业应当在拥有海量经典IP的前提下,让人工智能成为高效出版的有力工具,做行之有效、切实可行的融合探索。
文|董 易
2024年,习近平总书记在主持召开新时代推动中部地区崛起座谈会时强调:“要以科技创新引领产业创新,积极培育和发展新质生产力。” 2024年底举行的中央经济工作会议提出,“以科技创新引领新质生产力发展,建设现代化产业体系”。人工智能作为新质生产力的重要代表,在Web3.0时代,以其卓越的生成能力为各行各业极大地提高了生产效率。具体到出版行业,生成式人工智能在选题策划、内容生成、编辑校对、市场营销等出版全流程均可提供极大的帮助。利用人工智能技术自动生成各种类型的内容(AIGC),包括文本、图像、音频、视频等多种形式,随着技术的发展,已经由初期的数据堆砌重构发展为创意性、情感力兼具,并可以充分兼顾科技伦理的高效优质内容。
中国出版集团旗下的各家出版单位,拥有一大批优质的经典IP内容资源。中国出版集团有限公司董事长黄志坚认为:“立足自身出版优势,以实现内容数据化为核心竞争力。”近些年来,纸质图书市场呈现下滑趋势,越来越多的出版人希望通过科技手段找到更年轻读者的关注点和兴趣点,让经典IP、中华优秀传统文化通过科技的加持,以年轻读者更耳熟能详的话语方式重构,让AI与内容产出深度融合。2024年,笔者任职的华文出版社就经典IP《红楼梦》做了一次AI深度参与的尝试。由南京大学网红教授苗怀明先生主编的《“玩”转〈红楼梦〉:南大红学课花式作业集》(以下简称《“玩”转〈红楼梦〉》)融合了Web1.0至Web3.0的三种创作方式,在AI的图像生成训练及续写型文本训练上做了行之有效的探索。
AI图像生成的探索与分析
2022年8月,在美国科罗拉多州博览会上,数字艺术类的首奖由AI自动生成并通过Photoshop加工的画作《太空歌剧院》摘得。恢宏而细腻的画作兼具了古典画派与未来科幻的双重审美,画作不再是简单的二进制数据堆砌的数字图片,而具备了人的情感,传递了宇宙动静兼具的生命力。这一事件,是生成式AI划时代的事件,从图灵论文中那句“机器能思考吗”到如此震撼、可触及的视觉体验,AI快速走进了普通人的生活。
通过AI形成相对优质的绘画,需要增强AI对图片的理解力,并通过海量数据训练做支撑。人类与AI对图像的思维过程截然不同,人类更多从视觉整体上感知图像,AI则通过拆分像素理解图像。
创作部分
图像训练需要通过图文结合的方式,生成式AI的交互指令,通过一张或多张基础图片与分条截取的文字描述生成。
示例一:图文指令,单图人物形象生成(生成贾雨村的律师形象)
第一,上传贾雨村的人物形象,以百度图片自有版权的87版《红楼梦》贾雨村剧照为基础;第二,搜索一个对应90后、00后认知的理想的律师形象作为风格图片输入;第三,输入英文的编辑指令,文字描述越细节越好。
在生成结果中,选择相对理想的图片,就细部进行更多指令输入并生成图片,迭代到理想的图片后,通过Photoshop等软件优化,形成最终用于图书出版的图片。
王文冠等学者指出:“人工智能大模型虽然擅长模式识别和文本/图像生成,但缺乏对生成内容底层逻辑的理解。这一局限在需要理解因果关系、抽象概念或进行复杂逻辑推理的任务中尤为明显。”通过对单图人物生成的探索,结合人工绘画与人工智能生成图像的思维逻辑,可以得出,相比人工绘画,人工智能的劣势在于生成图像的个性不足,较为扁平化,整体性松散;优势在于可以打磨任何细节,让所有细节的呈现质量标准统一。基于以上分析,笔者认为,人工绘画与人工智能生成图像应做更紧密的结合,如可以先经过人工绘制整体形象,通过人工智能进行细节完善与立体化渲染,以期获取更良好的成品效果。
示例二:图文指令,依据原文生成静物画面
《红楼梦》第四十一回《栊翠庵茶品梅花雪 怡红院劫遇母蝗虫》部分原文:“刘姥姥因见那各式各样的小面果子都玲珑剔透,便拣了一朵牡丹花样的笑道:‘我们那里最巧的姐儿们,也不能铰出这么个纸的来。我又爱吃,又舍不得吃,包些家去给他们做花样子去倒好。’”
编辑指令:背景是深灰色的,主体高对比度,盘子上没有阴影。盘子为古代中国造型,主体是一盘炸制的面点,有花纹。
通过依据原文生成静物画面的形象分析,可以得出,AI在具象化静物生成上基本实现了指令中90%以上的要求。对于原文的理解,记叙类语句的理解到位,描述类词句的理解欠缺。如原文中谈到的“玲珑剔透”,包含了丰富的中国传统文化隐喻。“玲珑”在许慎的《说文解字》中解释为“玉声”,“剔透”在《广韵》中解释为“刻骨镂冰”,两个词汇并列组合在一起,有“高洁”的文化内涵,也象征了栊翠庵中女子们“不食人间烟火”的仙骨。在生成的静物图片中,并没有较好地呈现这一状态。而这一状态恰是原文文化隐喻之所在。基于以上分析,笔者认为,对于需要美学提升价值、聚焦点在具体物品的图像生成上,需要对AI的人工指令更加具体化,尤其是描述类词句需要在指令中转化为记叙类语句。
风格转化部分
为了打造更加亲近的阅读感,手绘风格是近些年来插图的趋势。对于如红楼美食相关章节,需要具有亲近感的手绘食物图片,该部分尝试了使用AI风格迁移算法。这个算法可以基于输入的条件,改变一个图片的风格。
示例三:生成糟鹅掌鸭信的手绘风格插图
首先,利用百度AI“文小言”作画,输入“糟鹅掌鸭信”,就生成了一张真实的照片。使用风格迁移AI算法,输入上图,然后再输入一张手绘风格的图片,就可以输出一张手绘风格的糟鹅掌鸭信。
通过以上三个示例,我们可以总结出生成式AI在绘图方面的优势与不足。从优势上讲,生成式AI算力强大,在训练数据足够丰富的前提下,可以为用户提供较多的选择。几乎所有的人物图片,最传递人物气质的眼神部分,生成式AI基本上都保留了原图的感觉。从不足上看,AI生成图片普遍缺失整体性,能够看得出较为明显的粗粝感,这种感受恰好对应了AI认知图片的底层逻辑是像素。
2021年DeepMind团队让AI与数学家进行合作,在拓扑学和表象理论方面证明了两个数学新猜想;感知技术(如脑电、眼动技术等)可以数据化表达视觉、听觉、触觉等感官信息,揭示深层次的人类艺术审美、情感认知过程。这一猜想的实现对AI生成图片至为重要,是人工智能从图像生成到NFT艺术品创作的关键。生成式人工智能应通过更多数据分析,精进算法,传递人类画作蕴藉的情绪与文化隐喻。
AI文本创作的探索与分析
AI在文本创作中有巨大的数据与算力优势,对于简单文案,AI往往可以通过基础指令与多信息源提供实现。对于需要理解并加以创意的续写类文本,是考验AI处理文本自由度、开放度的重要指标,也一直是AI参与创作的重要领域。
2017年,AI机器人在阅读了英文版《哈利·波特》全集后,创意性地写出了《哈利·波特与看起来像一堆灰烬的肖像》。云波诡谲的故事情节甚至将伏地魔变成孕妇,让罗恩变成蜘蛛。故事情节的荒诞不经,主要因为当时AI算法的狭窄与单一,尽管如此,生成式AI还是在续写类文本上展现出了较强的能力。
续写《红楼梦》结局,是许多创作者津津乐道的尝试。《“玩”转〈红楼梦〉》也特开辟结尾的一回,利用人工与生成式AI做了续写尝试。
雷雯等学者通过AI写作训练分析得出:“AI大语言模型在文学创作上的最大挑战也来自语言,其在人机交互的创作过程中无论如何也无法克服‘语言失真’的问题……指AI在文学创作中存在着的语言结构死板、意象重复、修辞简单等原因导致的语言平庸的问题。”通过对比,笔者发现,两个续写都符合古典小说的特点,也契合了《红楼梦》“白茫茫一片”的现实结局,文字辞藻皆有古典小说的质感。人工续写的部分,侧重于人物对话,以僧道与宝玉言简意赅的问答,勾勒了宝玉内心的成长,人工续写更善于借助具体场景构建故事,以情节取胜。AI续写则通过辞藻营造了比较浓郁的氛围,通过环境描写衬托荣华散尽如逝水之感,画面感强烈,更侧重小说三要素中“环境”的深耕。通过比较不难发现,AI在文学续写上,基本可以实现逻辑自洽及氛围烘托,但情节的机械、辞藻的堆砌、感情的空洞是显而易见的;从情节入手,人工续写更贴近人类的内心活动,更能体现出刹那顿悟之感,感情表达的细腻程度是AI续写难以望其项背的。
AI创作对出版从业人员提出的知识产权挑战
拥抱科技,是出版融媒转型的必由之路。随着智能创作时代的来临,出版从业人员将面临较多的选择与判断,也须重新思考出版物的价值定位。生成式AI的数据库强大到远超任何个体人类的认知边界,对于出版从业人员来讲,作品生成的判断将是选题策划中一道高要求的门槛。AIGC在版权问题、欺诈问题和违禁问题等方面均给出版从业人员提出了全新的判断要求。
生成式AI成果存在来源、指令设计、生成成果三方面的知识产权问题。《中华人民共和国著作权法》规定,作品是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力结果。2022年11月3日,国家互联网信息办公室、工业和信息化部、公安部联合发布《互联网信息服务深度合成管理规定》,对“深度合成”的内容边界、传播边界和管理做了规约。国际上,美国版权局承认,人工智能生成的内容随后被编辑或用于编辑已有的内容,则可以获得版权;法国已承认AI属于独立创作者;加拿大认为AI的训练者或使用者是著作权的拥有者。这表明全世界国家在鼓励科技发展的同时,已经注意到人工智能生成内容的法律界定。对于出版从业者来讲,厘清人类智力与人工智能成果之间的区别,对原创人类智力成果加强保护是工作重点。
在Web3.0时代,出版业面临着从劳动密集型产业向科技产业转化的契机。中国工程院院士高文认为:“大模型在可预见的未来仍是通用人工智能发展的主要方向。” 2025年春节前夕,由深度求索公司研发的DeepSeek V3.0版本正式发布。作为开源大模型的人工智能软件,其优化后的算法逻辑极大降低了训练成本。短短一周内,用户破亿;日活用户在3周内突破3000万大关,超越豆包并接近ChatGPT的一半。DeepSeek以其具备情感力的用户体验、创意力的写作成果和严谨的逻辑推理能力成为生成式AI的黑马。
通过对《“玩”转〈红楼梦〉》AI全流程参与的探索,笔者认为,出版从业人员应当辩证看待人工智能:第一方面,将人工智能作为一种高效率的生产工具,在流程化推进上发挥其高效准确的作用;第二方面,将由人工智能释放出的生产力更多用于创意型策划领域,让图书产品提供给读者更多情绪价值;第三方面,应对人工智能带来的信息获取的便捷,快速拓宽知识边界,提升甄别能力。出版从业人员应找到与人工智能适合的相处方式,让科技为人工智慧赋能,使经典IP焕发人工智能时代的崭新活力。■
(本文作者为华文出版社副总经理)