网站首页 | 网站地图

大国新村
首页 > 理论前沿 > 深度原创 > 正文

智能推送为何易陷入“内容下降的螺旋”

——智能推送技术的认识误区

【摘要】智能推送过程中的推荐算法有一个认识误区,就是把“热度”指标所体现的公众对一个信息的趣味性的认可,视为公众认为该信息重要。这实际上是把重要性和趣味性混为一谈,把趣味性当成了第一重要的东西,导致其推荐内容过度娱乐化并流向低俗化。

【关键词】智能推送  算法  趣味性    【中图分类号】G20    【文献标识码】A

信息技术进步带来传播效率的提升和个人选择权的扩大

如果我们全面考察人类传播活动的历史,就会发现,这个历史是社会成员个人的信息权不断扩张的过程。在大众传播理论里有一个“选择性接触理论”,认为受众往往并不是不加区别地对待任何媒介和内容,而是更倾向于接触与自己的既有立场、观点、态度一致或接近的媒介或内容。在大众传播时代,人们看报纸、看电视实际上都是有选择的。

进入网络传播时代,信息技术进步的结果,是媒体个人化以及以此为基础的信息个人化的进一步加强。无论是搜索引擎,还是推荐引擎,基本原理都是把满足个人的信息需求放在首位,整体上在强化个人对信息的选择权。事实上,网络信息需要点击打开的呈现方式,本身就赋予了网络用户信息选择的决定权。而基于算法的精准推送技术,更是大大提升了传播的效率。

美国学者施拉姆在《传播学概论》中为了解释个人如何选择信息传播路径,列出了下列公式:

宋建武

在理想化的智能推送过程中,一方面是将公式中“可能的报偿”做到了最大值,因为智能推送的默认逻辑就是向用户推送他最关心、最感兴趣的信息;另一方面,也将用户获取信息的“费力的程度”降到了最小值。因为目前智能推送基本都是基于移动互联网传播体系,这种新型传播体系与大众传播体系相比,能够让用户以最短的时间、最少的金钱和最小的精力来获取到这些信息。从这个角度看,智能化的精准推送基本上就是信息选择“或然率公式”的最优解,它兼备了最大的分子值和最小的分母值,因此具备最大的“选择或然率”,即用户对于具备精准推送能力的媒体选择概率最高。

如果我们从网络传播技术对社会成员表达权的影响角度观察,将会发现,互联网的普遍赋权特性,使得普通社会成员的表达权得到了更多实现的条件,获得了更多“积极的自由”。这也是“自媒体”产生和发展的技术基础。

通过上述考察我们会发现,社会成员个人对信息的选择权和表达权,随着信息技术的发展而得到增强,是历史发展的趋势,体现着社会的进步,是社会成员个人应该得到尊重的基本权利。在这个意义上,尽管美国学者凯斯·桑斯坦提出“信息茧房”说,对于“公众只注意自己选择的东西和使自己愉悦的通讯领域,久而久之,会将自身桎梏于像蚕茧一般的‘茧房’中”表示担忧,但不能不说,整个社会传播效率的提升以及社会成员个人的信息主权的强化,更具有进步意义。更何况“信息茧房”说提出的“茧房”效果,也就是由于信息不完全而导致的认知偏差,在大众传播过程中,也会由于公众的选择性接触以及媒体“把关人”的特定价值取向而产生。

智能推送技术会产生“内容下降的螺旋”

当前,智能推送技术应用产生的最为人诟病的问题,是低俗和虚假内容常常会被算法选取并加以推送。实践中,几乎所有采用这一技术的信息平台都出现了这一问题。那么,出现这个问题的真正原因是什么?

在智能推送技术中,实际上包含着这样几个环节:其一是选择什么样的规则处理信息;其二是把采用的规则做成数学模型,即把规则数学化,找到规则涉及的各要素之间的函数关系,确定算法;其三是导入大数据用于机器的深度学习和训练;其四是使用算法处理大数据。

结合这一算法的运用以及此类平台运营规则,一些平台之所以出现部分低俗、虚假内容被推送的状况,主要有如下原因:

其一,缺乏内容监控的意识和手段。在聚合各种自媒体内容时,资讯平台为最大规模地占有内容资源,在其发展的特定阶段,往往不加甄别地扩充自媒体的内容,这样就容易造成大量质量不高的内容充斥内容数据库,使得供给侧内容杂芜,鱼目混珠。平台上这些大量低品质内容的供给,满足并“创造”着对低俗内容的需求。而资讯平台以往对此大多缺乏必要的把关意识和技术手段,它们对低俗内容的判断,主要方式是对文本的情感分析,并结合用户的负反馈信息,有些平台甚至在主观上还企图借此提高“流量”和用户数。

其二,算法的取值偏差。目前智能推荐算法主要取值点是热度,即用户对一条信息的点击量,一位资深的算法架构师说“内容热度信息在大的推荐系统特别在用户冷启动的时候非常有效”。这意味着推荐系统的初始设定,基本上都是根据用户信息点击的历史数据判断其信息偏好而产生的,点击量高的内容和内容类别会作为初始设定,被推给更多用户。而用户使用移动终端的场景近乎个人独处,具有私密化特征。在这样的一个状态下,人们所表现出来的信息需求,常常是猎奇心重,对低俗内容较为敏感,这类低质量信息往往点击量较高。这就造成了在需求侧,平台通过以往采用的取值方式所采集到的信息需求特征,主要是比较低俗和原始的需求。而如前所述,由于平台上自媒体数量众多,且管控手段和意识不强,导致供给侧大量充斥着不良内容,通过算法的匹配,以及运营指标和运营机制的引导,就产生了一个下降的螺旋,造成平台上生成和推送的内容越来越低俗。所以说,是当前的算法取值失当造成了“内容下降的螺旋”。

就上述分析来看,智能推送过程中出现的内容低俗问题不是算法本身导致的,而是平台在内容聚合过程中缺乏对内容的有效甄别和控制,加之算法取值失当造成的。这类推荐算法有一个共同的认识误区,就是它们都把“热度”指标所体现的公众对一个信息的趣味性的认可,视为公众认为该信息重要,把公众对一个信息的兴趣,误当做是这个信息的重要性来进行推荐。客观全面地分析“热度”,我们发现,这个指标更多地反映了用户对于特定信息感兴趣的程度,可以映射新闻信息的“趣味性”,但无法反映特定信息对于用户个人和社会的选择和决策行为的真正价值,即新闻信息的“重要性”。目前智能推荐的取值法实际上是把重要性和趣味性混为一谈,把趣味性当成了第一重要的东西,导致其推荐内容过度娱乐化并流向低俗化。

改进算法,完善甄别信息真伪和优劣的手段,运用现代科技正本清源

尽管基于海量信息聚合,并以算法驱动精准分发的智能推送存在上述问题和局限,而且商业性质的资讯平台还容易受到逐利动机的影响,从而加剧这些问题,但不可否认的是,算法技术推动了信息传播方式的显著进步。

在移动互联网时代,移动新闻客户端成为公众接收新闻信息的主要渠道。移动终端的个人化特点及其便携性促进了场景化的信息使用,而信息交互让用户成为传播主体。如何实现海量信息资源与个性化信息需求的高效匹配,构成了移动传播的特殊矛盾。算法技术对传播方式进步的贡献在于,它能够以较高的效率和较低的成本,在社会普遍信息化所产生的海量信息供给中,为个性化需求寻得精准匹配结果。

那么如何优化算法,避免“内容下降的螺旋”呢?我们不能简单地堆砌现在主流媒体所使用的编辑原则,而是应当以现有编辑原则为基础,同时结合移动互联网时代信息分发的规律、公众接受信息的规律,形成更加具有科学性的算法。这样一来,我们就可以把对一个事件重要性的社会判断、个人判断有机结合,把个人选择和社会选择结合起来,让个人能够有机会获得更多的既符合其自身利益,又体现社会主流价值的信息推送。从实践看,今日头条等平台在近期的整改中调整了算法,使容易产生虚假和低俗内容的领域的信息推荐量和阅读量减少了40%。

要想恰当解决在当前算法应用中出现的问题,不仅需要改进算法,还需要完善甄别信息真伪和优劣的手段,以正本清源。对信息真伪的鉴别,国外的脸书(Facebook)和谷歌、国内的微信和微博大多采用第三方核查的方式,然而,这些方式都属于事后应对,未能形成预警机制,难以提前防范虚假信息的发布和传播。随着各类传播平台的用户规模不断扩大,虚假信息一旦被广泛传播,信息源的资质审查和事后惩罚都难以补偿负面舆情效果。因此,传播之前的拦截具有重要意义。当前,互联网信息传播平台努力的方向,都是借助人工智能技术手段进行事先核查。包括脸书、今日头条在内的一些平台近期均大幅度增加了审核人员,正在尝试以“人工+机器”的模式构建防火墙,以对敏感词、“标题党”和虚假信息进行拦截,它们也企图借助人工智能技术,模仿人脑机制,拦截低俗图片、视频等不良内容。今日头条等平台还加强了对自媒体账号及其发布内容的管理,对低俗和虚假信息的产生有较为显著的遏制作用。

还有一个问题值得我们思考,这就是,在我国的互联网传播过程中,是不是商业利益动机过于强烈?互联网的公共空间应该是公共交往、社会参与的场所,而过于强烈的商业动机会助长不择手段地追逐经济利益,从而污染社会舆论环境。互联网的公共平台是用来服务公众的,不是用来个人发财的,这才是公共平台的价值所在。在这方面澄清观念,也是正本清源之一种。

(作者为中国人民大学新闻学院教授、博导)

【注:本文系国家社科基金重点项目“以媒介融合推动新型传播体系的构建研究”(项目批准号:14AZD039)阶段性研究成果】

【参考文献】

①[美]威尔伯·施拉姆著、陈亮等译:《传播学概论》,北京:新华出版社,1984年。

②[美]凯斯·R·桑斯坦著、毕竟悦译:《信息乌托邦:众人如何生产知识》,北京:法律出版社,2008年。

责编/周素丽    美编/王梦雅

[责任编辑:张蕾]
标签: 何易   推送   螺旋   智能   内容