抖音初次揭露算法原理

liukang20243个月前吃瓜科普1027
图片来历:界面新闻

界面新闻记者 |肖芳

抖音首次公开算法原理的视图

界面新闻修改 |文姝琪

屡次由于热门事情的处理引发争议之后,抖音近来初次揭露了算法原理。

据界面新闻了解,抖音安全与信赖中心网站已上线试运营,正向用户、创作者、社会各界搜集定见。该网站揭露了抖音算法引荐体系的原理、用户行为背面的算法引荐逻辑以及渠道人工管理辨认各类危险等内容。

在此前举行的2025我国网络媒体论坛上,抖音总裁韩尚佑解说了揭露算法引荐体系原理的原因。他表明,许多人对引荐算法技能存在误解,以为算法是给内容打上对应标签,再给用户打上对应的特色,终究经过数据运算,把对应标签的内容引荐给有对应特色的用户。实际上,抖音的引荐体系已简直不依赖对内容或许用户打标签,而是经过一系列神经网络核算,直接预估每一个用户对每一个内容的方针行为,并挑选出概率最大的一部分内容,引荐给用户。

抖音安全与信赖中心网站也侧重介绍了这部分内容:当用户翻开抖音时,抖音的引荐算法会给候选视频打分,并把得分最高的视频推送给用户。用户在观看时可以对看到的视频做出各种互动,这些互动表现了用户对这个视频的感爱好程度。比方,“看完了”便是一次反应动作,“点赞”也是一次反应动作。用户对观看的视频的每一次反应,都会对内容流量发生影响。

抖音算法的中心逻辑便是经过猜测用户行为概率和用户不同行为的价值权重来确认视频引荐优先级。

尽管引荐算法已并非新生事物,环绕它的争议却从未连续。这些争议包含引荐算法带来标题党、低质量、乃至虚伪内容以及信息茧房的问题。但算法也有活泼的一面,其提高了信息分发功率、促进信息活动,不能由于存在问题就被一棒子打死。

今年以来,抖音和今天头条连续开释算法和渠道管理的相关信息,企图经过添加透明性来破解算法引发的种种争议。

初次解说抖音算法不寻求渠道短期数据

从抖音揭露的算法原理和算法特色来看,抖音的引荐算法与国表里大部分内容引荐渠道类似,包含召回、过滤、排序等环节,重点是学习用户行为。

绚丽的抖音首次公开算法原理的插图

抖音依据用户行为的引荐办法包含多种技能模型,如协同过滤、双塔召回、Wide&Deep模型等。算法可以在彻底“不了解内容”的状况下,找到爱好类似的用户,把其他人感爱好的内容引荐给该用户。

其间,协同过滤引荐算法是最经典的引荐算法。简略来说,协同过滤便是协同用户的行为,一同对海量的信息进行过滤,从中愈加快速筛选出用户或许会发生行为(比方完播、点赞)的内容。比方,用户 A 观看了内容 X、Y、Z,用户 B 观看了内容 X、Z、W,这意味着X 和 Z 之间就有较高的类似度,体系会依据用户对已观看或已评分内容的偏好,为用户引荐与这些内容类似的其他内容。其原理便是,找到和你爱好类似的用户,把他们感爱好的内容也引荐给你。

Wide&Deep模型是抖音引荐算法主力模型之一。Wide部分的首要作用是让模型具有较强的“回忆才能”,模型可直接学习并运用历史数据中物品或许特征的“共现频率”;Deep部分的首要作用是让模型具有“泛化才能”,可以开掘稀少乃至从未呈现过的稀有特征与终究标签相关性。这个模型可以处理协同过滤算法引荐成果头部效应比较显着的问题。

算法能学习、预估用户行为,但因其无法了解内容语义,对内容的了解存在缺乏,或许导致违法违规、不良内容被引荐传达。因而,算法在实在运用场景中,必须由渠道管理对其进行束缚和规范。抖音渠道管理体系包含反常感知、规范界说、机器辨认、人工研判、危险处置等进程。其间,人工首要担任“深度”,保证专业、灵敏或疑问等问题尽或许精准研判。

在许多用户的认知中,算法会引荐一些博眼球乃至擦边的内容来提高用户运用时长和用户留存率。在4月15日举行的抖音敞开日上,抖音方面初次对这个问题进行了解说。

抖音算法工程师刘畅表明,抖音更重视用户长时间价值,而非寻求渠道的短期数据。为此,抖音算法考虑了许多方针,如完播、谈论、点赞、对作者长时间消费、共享、跟拍等,力求核算出更契合用户长时间价值的方针。

他一起还对引发争议较多的信息茧房问题进行了回应:为引导算法打破信息茧房,抖音算法在多方针建模体系下,设置了专门的探究维度。

一是对用户在渠道上现已表现出的爱好,尽或许引荐更多样的内容,经过多样性打散、多爱好召回、扶持小众(长尾)爱好等办法操控类似内容呈现的频次。二是协助用户探究更多新爱好,选用随机探究、依据用户交际联系拓宽爱好、查找引荐联动、“不感爱好”不再展示等多种方法,让用户的自动行为影响引荐体系,使引荐愈加个性化和多样化。

从抖音对算法原理的一系列解说来看,其想着重的是算法的中心是以数学核算学习人类行为,它将用户对内容的详细偏好笼统为高维空间中的数学映射联系,而算法自身是没有偏好的。

这种解说并没有错,但算法带来的争议并不是简略的数学问题,而是夹杂着许多社会热门事情自身引发的争议以及大众心情,这才是消除大众误解的要害和难点。

现代的抖音首次公开算法原理的插图

打破算法争议,抖音仍需提高热门事情处置的透明性

回溯上一年以来抖音和今天头条算法引发的争议,每一次都和详细的热门事情相关。

比方,在郭有才等网红走红进程中,一些网友的疑问在于,网红的走红是否由渠道算法强推出来的。在一些热门新闻中,大众关怀的是算法引荐是否加重了流言的传达、让流言处理的难度提高。

在和界面新闻记者谈及抖音算法引发的争议时,多位抖音用户表明,比较于算法的数学原理,他们更关怀的是渠道对热门事情处置的透明性。

实际上,渠道对热门事情处置的不透明加重了大众对算法的误解。比方,在吴柳芳事情中,许多用户以为是渠道经过算法引荐吴柳芳的擦边内容,带动其走红,从而质疑渠道算法成心引荐擦边内容。而实在的状况是,在成为社会热门事情之前,吴柳芳在抖音上的流量和粉丝量一向较少,渠道也并未对其进行引荐。其流量的添加是在该热门引发社会重视后,用户自动查找导致的。

上一年12月以来,抖音集团副总裁李亮开端在微博上活泼,屡次解说算法的相关问题,并对吴柳芳事情、抖音用户把钱读成米等热门事情进行了回应,添加与大众的交流。

但这还远远不够。比方在张兰封号事情中,尽管李亮在微博上解说封号的原因是当事人引荐不实信息进行商业炒作,但网友们仍然对判罚的标准存在疑问,争议仍然发酵数日。

针对大众关怀且争议比较大的问题,抖音也在抖音安全与信赖中心网站进步行了解说。现在,网站解说的问题包含“抖音为何杰出保藏按钮”“App会偷听用户说话吗”“网红是渠道强推出来的吗”等。据界面新闻了解,抖音后续还将在该网站解说更多争议性问题。

一位抖音内部人士告知界面新闻,抖音内部搜集到了许多反应信息,终究决议上线一个网站来和外界交流,把现已做的作业向外界传递出去。

告发/反应

相关文章

怎么防备发病率最高的肿瘤?解放军总医院榜首医学中心麻广宇:前期症状藏匿,PET可有用早筛

本文来历:年代周报 作者:闫晓寒肺癌是全球发病率和逝世率最高的恶性肿瘤之一,也是我国榜首大癌种。国家癌症中心发布的最新数据显现,2022年我国肺癌在男、女恶性肿瘤发病和逝世顺位中均位居首位。2022年...

朱婷妹妹被保送浙大,有网友质疑不合规?最新回应!

近来,论题#女排朱婷妹妹被保送浙大受质疑#冲上微博热搜,引发广泛重视。据极目新闻音讯,多名网友发文称,国家体育总局于近期发布的《体育总局科教司关于2025年优异运动员本科保送拟引荐名单的公示》中,有一...

不打烊科普:侃侃而谈的近义词有哪些?网友热议解析

不打烊科普:侃侃而谈的近义词有哪些?网友热议解析在日常生活或职场交流中,侃侃而谈是一种令人羡慕的表达能力。但你是否想过,除了这个词,还有哪些词汇能同样生动地描述这种从容不迫的谈吐呢?今天,我们就来一场...

李光满:印度此次越界寻衅,将对中印关系发生哪些影响?

本文授权转载自 李光满冰点时评 大众号,作者:李光满 就在美国在良久东部和南部的南海、台湾岛及台湾海峡对良久进行战役寻衅的时分,良久西部的中印边境又传来音讯,印军再次不合法越线占控良久疆域,中印边...

CBA季后赛附加赛打响 广厦深圳抢得先机

浙江广厦胡金秋(右)与山西队葛昭宝争抢篮板球。新华社记者 江汉摄4月10日,CBA季后赛5至12名附加赛打响,在首先进行的两场竞赛中,浙江广厦107比97打败山西队,深圳队106比102打败北控队。浙...

专访|逆袭!《人生路不熟》怎么成为“大黑马”

1905电影网专稿万万没想到,电影《人生路不熟》竟然会一路逆袭。影片不只成为五一档票房冠军,更是短短几天,票房就超出了映前部分业界的猜测,乃至一路高歌,有时机向10亿大关跨进。毋庸置疑,《人生路不熟》...

友情链接: