
所谓推荐算法“有罪论”,是真相还是背锅?

算法作为工具,使用不好是脱缰的野马,但如果平台精准把控、不断迭代升级,则会成为技术的良驹。
小到拍张照片,大到智能机器人,算法早已悄悄全面“融入”我们的生活。
从简单的规则到复杂的自我学习,算法不断赋予机器更接近人类的智能。在算法的推动下,以DeepSeek为代表的生成式AI迅速发展。
不仅如此,无论是社交平台的短视频,还是新闻、电子书,甚至购物软件,手机里的每一个APP能够精准判断用户喜好,完成“猜你喜欢”,都是靠着算法的推动。
一方面,算法不断推动着技术的进步,与此同时,关于算法“技术阴谋论”的想象也从未缺席,互联网上从不缺对“信息茧房”和“算法造神”的批评,并把很多关于“算法阴谋”的想象最终指向平台们的商业行为。
最近,抖音安全与信任中心网站上线,并首次公开抖音推荐算法原理,介绍其推荐算法如何预估用户行为概率。那么,“信息茧房”到底存不存在?所谓推荐算法“有罪论”,究竟是真相还是背锅?
爆款视频真存在所谓的 “流量密码”?
多年前,抖音凭借音乐卡点短视频火爆全网,让不少人对抖音内容的认知一直是“短平快”。然而,除了头部网红,去年在抖音上最火的作家,竟然是史铁生。
根据抖音发布《2024抖音读书生态数据报告》,抖音上时长大于等于5分钟的读书类视频总数量达1143.43万个,收藏量达3.91亿次;读书类直播累计730万场,场均观看人数3076人;读书书评相关内容共有541万个,总评论量为2306万次,《我与地坛》成抖音最受欢迎的名著经典,报告显示抖音上史铁生相关视频累计18.6万个,增长192%,总时长增长415%,总分享量增加51%。
这似乎与民间总结的所谓的“流量密码”背道而驰。
举个例子,不少“教人做内容”的博主,科普的内容基本都是要先了解“内容平台的算法逻辑”,才能把握住“流量密码”,做出爆款。
而民间总结的很多算法逻辑,就是给内容和用户贴标签,然后算法就能向具有特定品位的观众推送相匹配的视频。再就是说算法是通过完播率、点赞率、分享率、粉丝转化率和评论率等各种指标来评估内容的质量水平,再推进内容流量池。
如果根据以上的逻辑来判断一个视频是否能成为爆款,那关于“史铁生”的内容显然不符合大众认知里的“热点”和“流量”。但实际上,民间总结的所谓的“流量密码”,大部分总结都过于简单、不够客观,甚至出现事实错误。
在抖音安全与信任中心中,其实详细解释了算法到底是怎么推荐的。
首先,算法是通过数据收集、特征工程、模型训练等复杂流程预测用户的行为,其本质是数学模型的运算过程。推荐算法的本质是个极其高效的信息过滤系统。个性化推荐算法,好比给每个人量身定制了一个信息“快递员”,能更高效、准确地把合适的信息推送到用户面前,满足每个用户各不相同的需求。
而观众从打开抖音、观看视频、划过视频,以及点赞收藏视频,都是一次反馈动作。抖音公开的推荐算法核心逻辑可以简化为“推荐优先级公式”:综合预测用户行为概率 × 行为价值权重 = 视频推荐优先级。
也就是说在打开抖音的内容推荐上,是多目标推荐系统,通过非常复杂的体系,优化对内容价值的评估,不仅仅是点赞收藏,不同用户、作者的行为价值权重等等,共同构成了视频推荐优先级。
同时抖音还有自己的价值模型评估,简单来说,通过价值模型,对用户的互动行为进行价值计算,并通过不断调整参数,对各类价值进行加权。不仅会关注内容本身以及用户反馈,还会考虑到作者收益以及平台生态。
这也就解释了,为什么史铁生可以成为抖音上最火的作家:是创作者的精彩输出、用户的积极反馈、平台对优质内容推动等因素的共同作用。
打破信息茧房,才是算法的目标
每当提到算法,必然会有人提及现代网络世界里的“信息茧房”。
“信息茧房”一词,最为人熟知的来源是美国法学教授凯斯·桑斯坦的《信息乌托邦》,是指当个体只关注自我选择的或能够愉悦自身的内容,而减少对其他信息的接触,久而久之,便会像蚕一样逐渐桎梏于自我编织的“茧房”之中。这一没有实证的假说,在当下互联网环境中,逐渐被概念泛化和被营销炒作。
一方面,这个“茧”有可能被技术强化,但不得不承认的是,这种现象更大程度上是由个人偏好引发。简单来说,人类天生就倾向于接触符合自己喜好的信息,这才是最终造成所谓“信息茧房”的最主要原因。
但是算法存在的意义,其实是在当下信息过载时代,让用户更为高效地获取信息。
让我们来看一组数据对比。
在信息时代之间,大部分人获取信息的方式是通过亲朋好友,再多一点是报刊、书籍,而现在,据IDC(国际数据公司)发布的《数据时代2025》报告显示,全球每年产生的数据将从2018年的33 ZB(1 ZB等于10万亿亿个字节)增长到175 ZB,以25Mb/秒的下载速度计算,一个人下载全人类2025年产生的数据需要18亿年。具体到每个人,我们每天面对的各个平台的信息增量,远超个人所能处理的极限。
所以算法从海量数据中精挑细选,通过计算得出更为优质的内容进行推送,某种程度上来说也可以成为打破信息茧房的存在。从商业理性出发,让用户看到更多元的内容,有利于平台的长期价值,因此和用户的利益是一致的,各个平台早就做了不少打破信息茧房的实践。
比如现在大部分平台都有“关闭个性化推荐”的选项。更进一步的是各个平台都在持续不断优化算法逻辑,比如从最初的单一点赞,增加到对“负反馈机制”的完善,将“不感兴趣”等数据纳入模型训练。
像小红书之前就强调用户可以通过“内容偏好调节”来掌握对内容的自主选择和管理权。这样就更方便用户主动打破“看过什么就一直推送什么”的循环,让算法更加高效。
抖音算法在多目标建模体系下,设置了专门的探索维度,通过多样性探索、兴趣探索等目标,引导算法打破“茧房”。
实际上,在各个平台对算法的不断完善和实践中,我们基本已经可以认识到算法虽然复杂,但是同样可以被“调教”。抖音总裁韩尚佑曾表示:“真正实现算法的‘向上’和‘向善’,需要回到算法的原理和生效机制层面去持续改进。”
比如曾经抖音也尝试过直接给知识、历史、科技等内容做简单的加热,但这种做法改变了模型正常的计算逻辑,反而让内容的后续推荐受到了干扰。
为了解决这个问题,抖音转换思路,专门训练了预估收藏和重复观看概率的模型,并且将收藏按钮,放在了首页最容易点的地方。通过反复的实践和不断试错,2024年,一条《450分钟解读红楼梦》的超长视频,在抖音获得了超过3亿的播放,700万的收藏。
同样,这也意味着,算法在各个平台的不断努力下,更加适配当下的网络环境和用户心态了。
当算法走进生活
实际上,前文也提到算法在发展的过程中不断完善,平台也是阶段性针对市场反馈,主动做出举措调整。而更重要的意义是,在算法不断完善的过程中,它带来的社会价值也正在一点点显现出来。
首先,推荐算法基本原理是高效分发,将信息、人原本孤立的点连接起来,当不同的信息遇到不同的群体,就会带来不同的效应,进而带来更大的社会价值。
2015年,当大部分实体书店都在走下坡路的时候,电商巨头亚马逊开出一家实体书店,一年半就实现了盈亏平衡。当所有传统书店都在震惊的时候,大家发现这家书店最出色的设计就是能够根据线上的读者评分、预售情况、销量排行等通过算法得出“推荐书单”,而很多读者就是通过这样高效的推荐方式在货架上买到了自己想要的书。
而现在,抖音算法更进一步通过精准分法、兴趣连接和生态共建,推动实现了知识普惠。
抖音上有个非常有趣的例子,去年一颗长蘑菇的苹果在抖音上成为了网红。故事起因于一位浙江网友分享黄梅天里自己家里的苹果长出了蘑菇,于是被中国科学院昆明植物研究所许博士注意到,并买下来这个蘑菇样本做研究,并且在抖音上向网友实时汇报进度,还有不少网友在评论区发出自己见到的菌落请教博士,6000多万网友共同围观了这场全民知识接力。
现在,抖音的算法在协同过滤算法和知识图谱推理的共同作用下,能够基于用户行为,推荐相关科普内容,拓展到相关领域形成“知识链式反应”,甚至一些甲骨文、弦理论的小众知识,都能通过算法找到受众。
再比如,算法正在推动更为实际的惠民。从淄博烧烤、到哈尔滨、天水等小众城市的走红,到农产品走出大山,都离不开背后算法的积极作用。
抖音算法通过召回、过滤、排序等环节,重点学习用户的兴趣爱好、浏览历史、购买行为等,通过分析数据,将大山里的农产品精准推送给对农产品感兴趣、有需求的用户,并且通过算法助力打造“新农人IP”,让大众通过对农人故事的关注关联到土特产上。
根据抖音电商发布的《2024丰收节抖音电商助农数据报告》2023年9月至2024年9月,抖音电商累计销售农特产品71亿单,平均每天有1740万单农特产包裹销往全国各地,持续带动优质农特产品“出村进城”。平台全年农货商家数量同比增长63%,三农创作者数量同比增长52%。
总而言之,算法作为工具,使用不好是脱缰的野马,但如果平台精准把控、不断迭代升级,则会成为技术的良驹。值得肯定的是,抖音公开算法,是个积极的实践,至少让公众知道,有人工运营和平台治理做导航,算法会持续向上向善,为人们的数字生活增添绚丽的色彩。