购物吧

您的位置:网站首页 > 今日推荐

今日头条文章推荐机制解析!为什么文章推荐量少?

作者:habao 来源:未知 日期:2019-3-12 7:18:55 人气: 标签:今日头条推荐机制
导读:但是,有些人在今日头条文章动辄几十万、几百万,甚至上千万阅读,但有些则只是几十、几百的流量。除了内容本身的质量以及账号区别之外,最大的关键就在于其算法…

  但是,有些人在今日头条文章动辄几十万、几百万,甚至上千万阅读,但有些则只是几十、几百的流量。

  除了内容本身的质量以及账号区别之外,最大的关键就在于其算法推荐规则。搞懂今日头条文章推荐规则,是在这里进行精细化运营的核心关键。

  那么,今日头条海量文章推荐的机制是怎么样呢?为什么有的文章展现量几百万,有的却只有几十几百?对于文章的推荐机制我们又能做些什么?

  你在头条号发布的内容,在通过审核和进入推荐系统之间,还有一道,那就是下面要说的消重机制。

  如果我们在百度搜索一篇内容,经常会得到多个网址。所以,我们一般需要自己筛选和判断,哪个网址更权威,更有价值,再点击去访问就可以了。

  但是今日头条不一样,它是基于算法推荐给用户的。所以一定要不能连续给用户推荐了几篇相似的内容,否者用户体验会非常差:怎么老是给我推荐一样的内容,什么鬼系统!

  那么,消重就是指对重复、相似、相关的文章进行分类和比对,使其不会同时或重复出现在用户信息流中的过程。

  如果让人来判断,可能就要逐字逐句地把文章读完才能判断得出来。通过计算机这样去判断当然也是可以的,不过,当每天需要处理的内容达到十多万篇次的时候,这么做即使对于计算机来也太麻烦了。

  今日头条的做法是,通过系统的计算,一篇文章的文本、标题、图片等都是可以转换成一串数字代码,也就是信息指纹。这就像我们每个人的身份证,如果两个人的身份证号码一模一样,那么就可以肯定这是两个一样的人。

  而文字信息的「身份证」也能起到类似的作用,对于图片、视频等信息形式,原理也是类似的。这种算法模型这里就不多说了,重点来看影响消重的关键项。

  之所以要对具有相同的标题或者预览图片的内容进行消重(哪怕它们的内容并不相同),是因为,假如用户没有点击内容详情页,他是不知道内容写的什么的。

  那么,光看标题和预览图就是系统把两篇一样的内容重复推荐给了自己,可想而知这样的浏览体验是很糟糕的。

  你肯定对这样的景象不陌生:每当有某个社会热点事件或者话题出现的时候,、自、KOL们一拥而上,竞相报道事件细节或者发表观点,让你的微博、朋友圈被有关这件事的种种内容“刷屏”。

  但是,对于用户来说,需要的其实并不是反复看到相同的信息,如果有足够优质的报道或者观点的话,其实看有限的几条就够了。

  相似主题的消重其实和内容的消重其实原理是一样的,是对文章中全部的关键词(也就是我们常说的标签)进行统计并计算信息指纹,当然也可以对其中与话题相关的关键词进行统计分析。

  一旦系统发现了可能对某篇内容感兴趣的用户,那么系统会自动把具有同样「信息指纹」的内容或话题中,经过挑选最优的一篇推荐到用户的信息流。

  这里,木木重点说一下相似主题消重,这个与我们是最最最相关的。因为头条要追热点,基本是大家的事实。

  因为有这个相似主题消重,那具有相同「信息指纹」的话题或热点,几乎不可能获得推荐了。这就是为什么很多时候我们的热点文章在头条号会推荐惨淡。

  一个热点再热,用户的兴趣也是有限的,特别是如果你的热点角度没什么区别,平台已经推荐过相似内容了,那系统是不愿意再推荐的,因为用户他已经懂了,再推荐就是打扰了!

  所以说你追热点的角度一定要差异化,写热点文章有很多切入点,你可以把一个热点进行拆分关键词,每一个都可以是一个很好的切入口,这就是所谓的“同主题异角度”。

  与此同时,你的标题也要明显的差异化,因为这个热点标签的提取统计,主要来自于标题,而后才是内容。并且,在一个大热点下,用户想知关于热点的各个方面,所以标题角度也要明显。

  如果不能确定自己创作的角度足够独特,及自己的内容足够优质,那么就不要随山柳村寡妇的情史意地追逐热点,免得做了无用功。

  我们知道,文章的阅读量很大程度上取决于系统的推荐量,那么一篇文章的推荐量,是由什么因素决定的呢?

  不过这些都是一些的东西,这里更系统和深入的说一下,只有知道本质了我们才能更好的做好这些。

  今日头条的文章识别系统会对文章进行特征识别,从而判断文章讲的是什么类型和领域的内容。特征识别的维度有很多,在这里我们重点解释「关键词」。

  如一篇体育类文章内容关于某场足球比赛,那么文章可能会出现的高频词就包括球员名字、足球术语或技巧等,如「C 罗」、「射门」、「突破」。

  作者撰文时常用到的虚词、转折词等出现频率也很高,但它们不会作为关键词被提取出来,因为这些词在文章中是普遍存在的。

  系统判定出一篇文章的关键词后,会将这些关键词与文章分类模型进行比对,命中哪些分类词库关键词的比例大,文章即被打上该分类的标签。如,一篇文章排名靠前的关键词为「C 罗」、「射门」、「西甲」、「马德里」,那么该篇文章可能会被打上「足球」、「国际足球」、「西班牙」等标签,完成对文章的初步认知。

  而除文章正文关键词识别外,系统还会对标题进行关键词的识别和分类比对。因此,在标题中露出具代表性的实体词非常重要。

  每个人的阅读兴趣都是大不相同的,个性化推荐机制要做的事情就是——让每位用户看到可能感兴趣的内容。

  这种精准推荐,是建立在机器对每位用户都有充分认知的前提下的。在系统里面,每位用户实际是由大量数据构成的,用户的阅读兴趣就藏在这些数据中:

  性别、年龄、所处地理(城市或地区);还有使用机型、授权账户(如微博、微信等)、手机上经常使用的其他 App 等。

  用户阅读过的文章分类和关键词;相似类型用户还喜欢阅读的其他文章类型;用户在今日头条客户端主动标记「不感兴趣」的实体词或文章类型。

  根据以上数据,系统对用户的阅读兴趣就能有个基本的判断。然后通过对数据的处理,每位用户将被系统打上各种标签。

  那么,这位用户可能被打上「足球、「皇马」、「科技」、「手机」、「米粉」等标签。不同的用户会被打上不同的标签。

  最后,当一篇带有「C 罗」、「足球」标签的文章在进行推荐时,系统会将其自动匹配给带有「C 罗」或「足球」标签的用户,这便是推荐引擎的个性化推荐。

  系统先通过数据来来给内容和用户打上各种标签,然后通过算法将内容标签跟用户标签进行匹配,接着根据第一批推荐情况,决定后续的推荐量,这个下面说。

  为让受欢迎的内容被更多用户看到,不受欢迎的内容不占用过多推荐资源。头条号文章在推荐时,会分批次推荐给对其感兴趣的用户。

  文章首先会被推荐给一批对其最可能感兴趣的用户(这批用户的阅读标签与文章标签重合度最高),这批用户产生的阅读数据,将对文章下一次的推荐起到决定性作用。

  文章的首次推荐,如果点击率低,系统认为文章不适合推荐给更多的用户,会减少二次推荐的推荐量;如果点击率高,系统则认为文章受用户喜欢,将进一步增加推荐量。

  以此类推,文章新一次的推荐量都以上一次推荐的点击率为依据。此外,文章过了时效期后,推荐量将明显衰减,时效期节点通常为24小时、72小时和一周。

  因为这种扩大推荐的机制,你想获得更多的阅读量,就必须努力把各维度阅读数据(点击率、用户阅读时间、收藏数、评论数、读完率等)维持在高位水平。这也就的一些标准。

  其中,至关重要的当然是点击率,也因此,标题和封面图的重要性便不言而喻。这也是今天注意力稀缺时代,文章获得好的的关键要素。

  文章所对应的标签,直接决定了匹配的相对应标签的用户量。有的标签本身就对应很大体量的用户,而有的标签对应人群很小,就算点击率再高,天花板也很低。

  这就是为什么很多专业性文章阅读不高,而情感鸡汤、娱乐、社会新闻的推荐一般会很高。这也是为什么大家都会去追热点,因为热点标题对应的用户群体非常大。

  所以说,我们选题,包括文章标题以及内容里面的关键词使用,一定要基于用户量大的标签,这样可以获得更多的推荐量。

  而且,今日头条还专门推出了热词分析功能,帮助大家找到不错的标签。利用热词分析功能可以大大增加系统推荐量,提高文章的阅读量。

  另外,今日头条是有文章分类的,在你的文章类型的大类下,手机查看相关文章,底部都有对应文章的标签,多收集这些标签,积累自己所属行业的标签库。

  为了提升用户体验,机器会减少那些不受欢迎的内容(即点击率低的内容)的推荐量,如果点击率持续走低,推荐量也相应地持续减少。

  你是体育类帐号,这一次却发表了娱乐类内容。对于这种不属于帐号擅长领域的文章,系统需要重新识别分类再进行推荐,这在一定程度上会延长推荐时间,不能在时效内,推荐给相应的用户。

  木木给大家一个方法,在找选题、写文章、定标题时,可以先通过今日头条实验室搜索一下选题的关键词来判断热度,还可以查看相关关联词。

  比如,我们将“张馨予”和“范冰冰”这两个词进行一天内热度趋势的比较。会发现“范冰冰”的关注热度是高于“张馨予”的。

  那么,如果我要写的是关于这二个人的一个话题文章,那我会不管是在标题还是在内容中着重多出现“范冰冰”这个关键词,这就会增加推荐量,也会更可能受到用户关注,从而提高点击率。

  所以说,今日头条的文章发布以及标题选择也是可以科营的,不一定只是盯着自己的号,也可以看看大是怎样的。

  如果潜在的用户群实在过小,机器将很难挖掘到潜在用户,推荐量自然高不了。而潜在用户群过小有如下原因:

  这个已经说了,有的文章标签本身就对应很大体量的用户,而有的标签对应人群很小,就算点击率再高,推荐量也不会高到哪去。所以,一定要有意识的选择或加入用户量大的标签。

  同一领域或话题相似内容过多,出现了供过于求的现象。如,关于当下热点话题的谈论,受众虽然足够多,但是内容供给总量实在庞大,相应地每一篇内容得到的推荐量也就比较少。

  这一点很容易理解,说白了就是内容扎堆、僧多粥少。那么系统就只有2个选择,要么只推荐其中一部分内容,要么都推荐但是推荐量会少,因为不能重复给1个用户推荐1样的内容。

  文章非原创或者没有在头条号首先发布,再或者和其他话题相似度过高,文章都可能会被消重,从而影响推荐量。

  前面讲了,文章是有一个时效期的,过了时效期文章的推荐量将明显衰减,时效期节点通常为 24 小时、72 小时和一周。

  基本上,我们说的提高点击率+读完率、文章分类明确、文题一致、提高内容质量、账号垂直度高、做好各种互动数以及订阅数、扩大站外热度、保持发文频率等都是为了更好的做好推荐量。

  在推荐量增长到一定数量级之前,即使点击率较高,文章阅读量也不会高,因为内容并没有得到大范围的验证。在后续的推荐中,如果推荐量持续攀升,阅读量可能会稳步增长。

  而如果推荐量已经足够高,阅读量仍然较低,很可能是由于文章的点击率较低。这就需要从点击率着手。

  其实,在木木看来,主要是前2項最重要,至于阅读量,推荐低就主攻推荐量,点击少就集中点击率,自然就解决问题了。

  总而言之,大家要明白,今日头条上的文章是经过发布——审核——识别消重——推荐——点击阅读——用户反馈的过程,知道这个后大家才能根据每个环节各个击破。

  特别需要注意文章以及用户对应标签,文章推荐量和它有点,点击率和它有关,阅读反馈也和它有关,不重视不行。

  

下一篇:没有资料
共有:条评论信息评论信息
发表评论
姓 名:
验证码: