摘要:
■受访人:喻国明(北京师范大学新闻传播学院执行院长) □采访人:陈 莹(中国出版传媒商报记者)
9月16日,华西都市报旗下封面传媒、微软和北京师范大学共同发起成立“人工智能与未来媒体实验室”,成为全国首个关注“AI+媒体”实验室。北师大新闻传播学院提供研究队伍,微软为实验室提供包括微软小冰等人工智能产品的展示和技术支持,封面传媒将提供小冰机器人媒体应用承载平台、机器人写作应用承载平台等。
北师大新闻传播学院执行院长喻国明在接受记者采访时表示,与微软、封面新闻的相同理念成为三方合作契机,北师大将具体落实3个项目,包括起草一份人工智能和未来媒体发展现况和未来趋势年度报告,研发人工智能效能评估标准,以及进行一些人工智能实体业务模块方面的共同开发、研制。
传媒业的人工智能还在准备阶段
□您对当下大数据及人工智能有哪些判断?
■人工智能和未来媒体这个方向更切合互联网发展下半场的实际。互联网上半场解决的是网络化的问题,彼此之间连接成内容网络、人际网络、物联网,连接是互联网发展上半场的一个基本事实。
到了互联网下半场,发展重点是在这种规模化、连接的基础上,进行纵向发展、深度的开掘,以及在过去那种疏而有漏的大格局之下做细部加工。而这种加细加密发展在消费升级的背景下,体现出的最重要发展趋势就是个性化、分众化。
大数据解决的是对任何一个个体的定义,包括属性、状况、特性,对其给予社会连接性的描述和基于这种描述的定义。有了大数据,互联网这种连接本身就带来了巨大的全新的现实,就是用户的痕迹可以转化为数据,而这些数据如果能够被有效利用的话,就可以对其做出精细化、个性化和随时随地的动态化描述,这就使需求和服务、资源和资源之间的对接和汇聚、激活整合提供了有利条件。
互联网下半场要解决各种个性化分众化的消费升级必须依赖于大数据的指示说明分析的价值和功用。互联网下半场就是在大数据基础之上的人工智能,人工智能这个角色的登堂入室会成为互联网下半场在进行所有的产品设计、传播的形态里的关键性技术逻辑。而具体发展主流就是在大数据和人工智能帮助之下来去做出相应的服务模式、服务内容和服务传输等方面的创新。
□您认为人工智能在新闻业的应用可以划分为几个阶段?现在处于哪个阶段?
■在大数据和人工智能的基础性条件方面才刚刚开始,所以我们只能说今天利用大数据人工智能进入到我们的社会生活,进入到新闻传播领域只是一个前奏性的初步尝试,还没有规模化展开,只是准备阶段。
原因是现在大数据应用面临着两大难题。首先,绝大部分声称自己是大数据的根本不是大数据。即使用爬虫在其他平台扒下千万、上亿的文本量也不是大数据,大数据是全集的、结构化的、并且是实时的、持续不断的数据集。大数据是实时互动、流动性的,这就造成了真正的大数据源难以接近。因为这些大数据源通常掌握在大公司手里,比如中国移动、阿里巴巴、腾讯、微博。第二个难题就是数据如果只有某一类单一数据其价值很低,信息只有在汇集、复合叠加的时候其价值才能放大,因此任何大数据公司掌握自己的数据本身的价值其实是对这种数据的低估和价值的折损。
□应用人工智能会给传统新闻业的内容生产、采集、分发带来哪些革命性变化?
■从内容来源角度,传感器新闻将成为一个重要类别。地震、体育比赛、上市公司财报,现在基本靠人生产,以后相当一部分数据结构严整的、持续的、规范化的内容都可以用机器自动生成的方式来完成资讯提供和播报。
对于需要人工介入的东西,人工智能和大数据也能进行更具有个性化意义的解读,就能成选题备考系统、辅助参考系统。
从具体内容生产的角度来说可以进行机器写作。经过大文本量的数据认读后,机器也能实现风格化写作,这需要一定时间和深度学习、形成模型的过程,但从技术角度来说已经没有难度了。
从内容分发和送达角度来说,大数据对特定人群的需求和场域进行特定描述,有了这些描述就能知道什么样的东西、在什么时间、什么地点适合某种特定人群,从而形成一种高效的内容分发和资源渠道的重新构建。所以人工智能对于传统传播业无论是在理念、逻辑以及生产方式、分发方式都是革命性的改变。
人工智能将为媒体商业模式破局
□人工智能可能替代传统新闻业的哪些环节?不能替代什么?
■现在对人工智能的应用还处于比较浅度的程度。无论是腾讯DreamWriter还是微软小冰,都已经在写一些规范性新闻,这些规范性新闻如果没有提示用户无法辨识是机器生产的,这实际上就是一种进步。当然机器写作的品种、品类、深度还有待继续发展,但至少从目前来说,过去那些剪刀糨糊的编辑工作将在很短的时间,也许一两年时间就会迅速被消解掉,这些简单的规范化、重复处理工作机器都可以去做。
用一句话总结就是:随着人工智能的发展凡是机器能做的事情,只能做这一件事情的专业工作人员必然被淘汰。
但是,有些工作不会被淘汰。首先,机器从事人工具体工作需要数据,如果数据不完整机器就无法胜任。所以未来人类能够保留的空间就是在那些机器不能挖掘的、得不到的、非规范领域里,对事实的挖掘能力、获取能力是未来新闻工作者的一项重要能力。
其次就是范围,无论机器能够处理多少变量,总体说都是在有明确边界、范围的数据结构当中完成的,超越界限、跨界的事情、内部的结构关系不清晰的事情机器不能胜任。第三,设计领域。与人为因素相关的设计、价值判断以及决策等机器无法替代。机器对于心这种多变量的复杂事物只能作为参考。
□您怎样看待今日头条、搜狗这些在人工智能上面持续投入的公司?
■对他们来说,越来越清楚地认识到数据是他们的价值和竞争力关键。算法型的平台如果没有数据、没有算法的改良,基本上就等于生命终结了,他们对应用大数据、人工智能最有积极性,因为这是关乎他们的价值和生命线的东西。相比传统强势媒体,因为有大量传统资源、内容资源、政策资源反而在这方面的动力相对弱一些,因为即使不用大数据,不用人工智能,还能够通过其他的资源支撑自身价值、能获得更多盈利,它们在应用人工智能等方面的动力就不像今日头条这些背水一战的公司那样迫切和明确。
□现在封面新闻、澎湃新闻已经在人工智能方面有一定实际应用,在您看来距离传统新闻业普遍应用还有多远?
■现在腾讯网已经在财经新闻、体育新闻等领域投入写作机器人DreamWirter。比如微软小冰的能力也比较强,还发表了诗集,但问题也很明显,微软小冰碎片化的语音结构无法表达人类写作的聚焦点和明确诉求,比如悲怆、宏伟等强烈的人类情感,导致句子与句子之间割裂,在整体结构严整性方面弱是目前机器写作与人之间的区别。
□您认为人工智能在新闻传播业应用的第一个爆品可能会是什么?
■当技术本身的成熟累计到一定程度后一定会出现一个爆品,而爆品一定会成为该技术社会化、市场化的动力源,它也会决定人工智能以什么样的方式、在怎样的环节率先进入,以及它对于整个环节的形成造成正面或者负面的影响。
从现实角度来说可能在用户洞察方面更成熟,比如美剧《纸牌屋》完全依靠数据对剧情、演员进行改变,由于周播剧的生产方式,它要根据市场对人物、剧情的这种需求进行及时调整,就是靠大数据来判断。
□人工智能可能会改变未来新闻传播业的盈利模式吗?
■这是肯定的,过去媒体盈利主要靠发行和广告,未来会有更多的第三方付费的方式,为什么在互联网时代会越来越多的破除传统新闻传播业的盈利模式,是因为它提供了更多可能性。大数据连接的丰富性本身就为第三方的付费买单提供了无限可能性,带来了盈利模式组合的丰富性。
□报纸、电视、广播这些传统新闻业态,哪些适合应用人工智能?
■作为研究者来说它只能说大概率的事件,人工智能、大数据它对于新闻传播的各环节、各领域、各种形式。报纸、电视、广播这些媒体类型都适合应用人工智能,这与媒体的介质无关,只与其内在的生产逻辑、服务逻辑、市场逻辑、技术逻辑相关,报纸杂志广播只是一种产生的媒介介质不同,在纸介质、电子介质的表象之下都是一致的,从这个根本性角度来说都是差不多的。