中国新闻出版研究院院长 魏玉山
在文化强国建设高峰论坛数字出版前沿技术发展与应用分论坛上的演讲全文
尊敬的各位领导、各位嘉宾、各位同行,大家下午好:
首先,我代表中国新闻出版研究院祝贺第十九届文博会的召开。党的十八大以来,以习近平同志为核心的党中央高度重视文化和科技融合工作,对宣传思想文化战线如何应对新一轮科技革命作出了一系列战略部署。《出版业“十四五”时期发展规划》提出壮大数字出版产业,强化新一代信息技术支撑引领作用;中宣部印发的《关于推动出版深度融合发展的实施意见》中提出构建数字时代新型出版传播体系,加强前沿技术探索应用,促进成熟技术应用推广,为科技创新赋能出版融合发展指明了方向。当前,以人工智能、大数据、云计算为代表的前沿技术快速发展,以及以ChatGPT为代表的AI大模型的火热,让包括出版业在内的众多行业处于一场技术革命的风口浪尖上。
出版作为文化传播与传承的重要方式,近些年积极拥抱新技术,催生出许多新产品、新形态、新模式、新服务,为产业带来新增长新机遇,也带来了许多新挑战新问题。
中国新闻出版研究院作为行业的观察者一直在积极地观察、跟踪技术应用的前沿问题。下面,我就国内外数字出版前沿技术应用情况做一个发言。
一、国外数字出版前沿技术应用的新情况
发达国家对数字出版技术运用起步早、发展快、形式灵活,通过自研、并购等方式拓展新技术、新产品,弥补技术能力的不足。其主要业务应用场景包括:
一是智能生成内容。AIGC是去年以来最受全球瞩目的技术应用,在文本、音频、视频方面都有突破性的进展。文本方面,ChatGPT在亚马逊平台掀起了人工智能生成电子书的热潮,截至今年2月中,亚马逊在线书店已有超过200本把ChatGPT列为作者的图书;音频方面,人工智能现在可以非常准确地克隆记者的声音,挪威最大的新闻出版物之一《挪威晚邮报》(Aftenposten)最近利用人工智能技术克隆了播客主持人的声音,南非的一家英语新闻网站(News24)也通过使用一位知名演员的声音训练播报系统以用于新闻和专题报道;视频方面,总部位于韩国的科技公司(Deep Brain AI)能在短短5分钟内将文本内容自动生成AI视频并通过数字人播报,目前已被成功应用于亚洲多个主流电视新闻频道中。
二是高效内容处理。通过机器辅助翻译、转录、汇集、润饰、评估等内容处理工作,可大幅提升编辑们的工作效率。如加拿大的《环球邮报》编辑部开发的一款工具(Sophi)可实现网站内容的自动化管理,包括标题优化、网页布局、社交分发等,可使网站点击率提高17%。再如,一些期刊正在使用基于AI的系统来筛选论文,检测虚假或抄袭的内容,以提高同行评审的效率和准确性。
三是打破“数据孤岛”。施普林格·自然集团(Springer Nature)已于2017年推出了名为SciGraph(科研图谱)的服务,可通过语义网络技术链接开放数据平台,汇集科研资讯,提供多维度信息服务;2022年7月,施普林格宣布推出一项AI引导的新服务(自然科研智讯,Nature Research Intelligence),可为科研决策者提供实时信息和数据以辅助决策制定。
四是增强运营能力。2022年底,一项来自53个国家和地区出版公司的调研数据显示,大多数(67%)出版商都在尝试用人工智能进行信息推荐。企鹅兰登书屋近两年一直重点致力于扩大其数字营销能力,在云计算、大数据和人工智能等前沿领域得到其母公司贝塔斯曼的技术支持。另外,欧洲电子书和有声书分销商(Bookwire)在2018年推出了一套自动化定价和广告推荐的工具,可通过匹配和比较历史价格点发布价格建议,并根据客户偏好推荐电子书内广告,有效提升了销售额。
二、我国数字出版前沿技术应用的新进展
当前,数字出版新技术已渗入我国出版产业链的各个环节,正在颠覆传统的内容生产方式、存储方式、传播方式、阅读方式。根据我们的调研数据,目前国内出版单位对前沿技术的需求和应用排在前三位的分别是大数据、人工智能、云计算;在融合出版产品方面的技术服务需求排在前三位的分别是知识服务、数据库、电子图书。
国内新闻出版单位对前沿技术的应用主要表现在以下场景中:
一是新技术带来内容生产方式新变革。2017年国务院发布的《新一代人工智能发展规划》,将人工智能定位为国际竞争的新焦点、引领未来的战略性技术,其中提到的知识计算引擎与知识服务技术、跨媒体分析推理技术、虚拟现实智能建模技术、自然语言处理技术等关键共性技术与新闻出版业紧密相关。人工智能技术的应用引发了内容生产方式的变革,国内出版单位正在积极探索“人工智能+出版”方式:在选题策划方面,出版单位通过与电商合作分析用户数据,依托大数据和算法模型预测未来热门题材和作品类型,推进选题的精准化;在内容编校方面,基于机器学习、自然语言处理等相关技术的智能协同编校,可实现编、审、校、排一体化流程,可以大大减轻编辑校对人员的工作量。如人民卫生出版社打造的一套数字出版的智能化编审流程,在保证内容权威性和高质量的同时,提升了编辑的工作效率;在内容生产方面,文字识别、语音识别、机器翻译已被广泛应用于新闻出版的内容获取与输出中,智能内容生成也已被成功应用,新闻写作自不必说,在图书出版领域也有许多案例,如北京联合出版公司于2017年5月推出的机器人——小冰署名的图书《阳光失了玻璃窗》,2018年,网易有道公司和电子工业出版社合作出版了全球第一部由人工智能机器翻译、由人工审校的中文版图书《极简区块链》,并出现在当年的北京国际图书博览会上;目前不少出版单位知识库也在积极探索AI大模型的应用。
二是沉浸式产品体验提升获得感。随着VR/AR/MR、数字人、元宇宙等被应用到数字出版中,多维度、立体化、真实场景式的“全真阅读”正在为用户带来身临其境的沉浸式体验。今年3月,上海首个数字化沉浸式图书馆——临港科技智慧图书馆开馆,依托“数字融合云平台”,读者可以在24小时开放的元宇宙图书馆里畅游书海,通过VR体验书中场景。4月,香港联合电子出版有限公司、广东大音音像出版社联手打造的“3201湾区元宇宙”平台上线,首款内测藏品《老子出关》正式对外发售,由中国新闻出版研究院与嘉兴市图书馆共建的“嘉兴市图书馆元宇宙阅读体验馆”正式对外开放。5月,数传集团面向全国出版单位正式推出AI阅读服务数字人(小睿数字人),将一本普通的教辅变成了一个“全科私人家庭教师”。古联(北京)数字传媒科技有限公司已于2022年推出了3D超写实数字人——“苏东坡数字人”,并在央视一套《2023中国诗词大会》舞台亮相、实时互动。可以说,我国出版业的AI新时代正在到来。
三是海量资源+精准化算法驱动服务创新。近十年,全球数据规模爆炸式增长,基于大数据的精准化算法推荐深刻影响了用户消费习惯和企业服务模式。大数据早已走入出版业,2015年国务院发布的《促进大数据发展行动纲要》中就提到了知识服务大数据应用,指出要“建立国家知识服务平台与知识资源服务中心”。2019年《关于促进文化和科技深度融合的指导意见》中提出“加快国家文化大数据体系建设”,大数据技术应用于新闻出版业的步伐加快。出版业精英式内容生产模式积累了大量专业化、高附加值的大数据资源,通过标引、关联等组织方式,正在以更精准化的方式向用户提供服务。如人民法院出版社的“法信”平台汇聚的全量法律、案例数据和法律知识文献资源数达1.24亿篇,总字数达1600亿字,通过类案检索、同案智推两个大数据引擎提供精准推送,目前平台以30分钟一次的频率,更新国内上万篇最新的法律文件和案例。再如医信平台基于用户大数据分析结果,将知识内容形成分层次、分级别的学习架构,使学习者都能够获得适合自身需求的个性化内容,将“人找知识”转变为“知识找人”,大幅节省用户时间。
四是智能化工具助力管理提质增效。在强调“降本增效”的大环境下,智能化工具可以促进出版单位流程优化,提高工作质量。传统出版与数字出版流程的一体化是出版业的发展趋势,未来出版不会止步于完成一本书的制作,还会包括知识体系与知识库的构建与管理、AR/VR产品制作、智能知识服务等,实现数字出版产品与传统出版物的业务协同,互相促进。近日(4月13日)中信出版在公开活动上表示将设立“平行出版实验室”,启动“AIGC数智化出版项目”,加速推动AI技术在出版流程的应用。这对于多模态内容审校也提出了更大挑战,基于图像识别、声音识别、自然语言处理的人工智能审核将成为数字出版内容质量管理的重要方式。
五是区块链技术创新版权保护模式。互联网环境下数字内容版权保护已成为困扰行业发展的长期痛点,区块链技术去中心化机制、智能合约、时间戳等特性在数字版权保护方面优势明显,几乎可以涵盖版权登记、管理、交易和使用的各个环节,最大限度防止侵权行为的发生。不少出版公司或创业者已经投入到区块链的探索和应用中来。2022年12月,“全国文化大数据交易联盟链”正式启动,由深圳文化产权交易所、新华文轩四川数字出版传媒有限公司、广东省广告集团股份有限公司联合发起,提供可信数字共享、分布式身份、智能合约等区块链专业技术能力。此外,区块链在新闻溯源核验、数字资产管理、去中心化协作方面也有广阔的应用场景。区块链还将改变出版单位的角色,为数字出版从业者开启更加个体化的新型收入模式。
三、数字出版技术应用面临的问题与发展前景
出版业对前沿技术应用取得了长足的进步,但是也还面临不少的问题。技术是一把双刃剑,数字出版前沿技术也是如此,比如人工智能技术、AIGC技术,其运用在提高出版生产力的同时,也将对现行的版权制度、出版管理制度产生颠覆性的影响;比如大数据精准算法推荐,在为人们提供更加精准的信息服务时,也限制甚至剥夺了人们的知情权、选择权。
从出版单位内部看,前沿技术的应用也存在一些具体的问题:一是出版单位内部缺乏既懂业务又懂技术的复合型人才,对前沿技术的理解和认知不够深入、全面,前沿技术不会用;二是由于缺乏统一的技术标准,使得出版单位与技术企业的合作无标可依,对前沿技术用不好;三是技术企业不能充分理解出版单位需求,开发的产品无法达到预期效果。
为更好地适应技术变革,我认为出版业还需与技术企业通力合作,在以下几个方面发力:一是加快出版融合标准体系的建设,开展内容、产品、系统、平台、服务等应用标准研制,打破各主体间各自为政的局面;二是加强复合型人才培养,造就一批既能深刻了解业务、又能透彻理解技术的复合型人才;三是加强出版单位与技术企业间的合作交流,如合作建设技术研发中心或搭建技术型高水平实验室,促进相关科技成果高效转化。
未来,出版与技术的融合将越来越深入,对技术对出版业的影响将将越来越广泛。我们将坚持以内容建设为根本、先进技术为支撑的原则,拥抱新技术、用好新技术,为出版强国建设提供强大的技术力量。