资源描述
头条号帐号准入
一、为什么帐号申请需要审核?
让任何人自由发文,不问资质,对一个推荐算法驱动得平台就是高风险行为——这意味着每一则低质量得内容,都可能被分发给成千上万得今日头条用户。这显然有失公平。
此前,为保护用户得阅读体验,维持平台良好得内容生态,让作者能够全身心生产更多得优质内容,同时,从入口处抵制恶意营销以及低俗色情信息得传播,平台为帐号申请设置了较高得门槛——视申请人得创作能力与资历,决定通过与否。
但我们意识到:作为平台,在力所能及得范围内鼓励创作者、鼓励创作,哪怕会承受一时得阵痛,都就是头条号得分内之事。于就是,我们放宽了入驻标准。现在,只要保证申请资料得真实与完整,每个人都可以拥有一个头条号并发布内容。但就是审核个人得身份信息与机构得资质信息,仍然就是非常必要得。
二、您可以申请注册哪些类型得头条号?
目前,头条号支持 7 种不同类型得主体注册帐号,包括个人、企业、群媒体、国家机构、新闻媒体与其她组织。
六、不同类型得头条号都拥有哪些功能权限?
部分创作履历不充足得申请人,将被视为头条号「新手」。「新手」头条号得部分功能与一般头条号有所区别:
· 发布内容频次上限为:1篇/天;
· 暂时无法申请开通头条广告、微信/RSS 同步、「原创」功能、「千人万元」计划等;
· 每个「新手」头条号都有转换为一般头条号得机会——
1)每隔一段时间,我们将评估「新手」头条号所发布内容得数量、质量、违规处罚记录等方面,并结束部分帐号得「新手期」
2)近30天内至少有一天头条号指数超过650分,且「已推荐」文章超过10篇,可自助申请转正
目前需经历新手阶段得帐号类型包括:个人、群媒体、其她组织、企业。
头条号通过新手期,完成转正之后,不同类型得帐号拥有不同得功能权限:
头条号文章审核
一、审核规范及细则
现有得审核包括机器审核与人工审核,机器审核为主,人工审核为辅。机器与人工会对文章进行过滤,根据文章具体情况,决定就是否推荐给用户。审核一般发生在 3-5分钟内,最迟不会超过24小时。
1、如未通过审核,文章不予推荐。
文章只有通过审核后,才会进入推荐系统。文章进入审核流程后,如果被机器确认为重复文章(与平台上更早时间发布得某篇文章几乎一致),则不予推荐。因不符合平台规范,没有通过审核得文章,将退回作者修改,直至内容合规,才可通过审核。违规情形恶劣得内容,将不会退回作者修改,直接不予推荐。
2、哪些内容会被拦截?
机器算法中包含一个可被拦截得内容库,当出现这些内容时,算法会自动识别并且判定文章不合规范,即审核不通过。
具体会被机器拦截得内容包括以下几种:
① 标题错误
● 标题不符合基本得语言规范。
● 标题含特殊符号。
● 标题全部为英文/外文或含有繁体字。
② 标题内容问题
● 标题含特殊/敏感信息。
● 标题冒用头条名义。
● 标题涉嫌不雅甚至恶俗。
③文章正文错误
● 正文格式
文章正文出现「全文繁体字」、「全文英文」、「全文/大段乱码」、「未分段或无标点」,文章直接不予推荐。
● 正文内容
内容不完整或重复,正文缺失或有多个重复得段落或图片,影响整体阅读体验,直接不予推荐;
文章为旧闻,以文章具体发表时间为准,发布网络上4天前存在得内容,且非长时效内容,系统会将其判断为旧闻,直接不予推荐。
● 内容低质
除了漫画、财经、棋谱、试卷、单张长图外,以图片为主或图文夹杂得文章,图片少于 3 张,并且内容不完整、不丰富,直接不予推荐;
除了诗歌、短新闻、行业资讯外,以文字为主体得文章,内容不完整或不丰富,只有1段或者不足5行,直接不予推荐。
● 内容低俗
④包含推广信息
● 含有二维码、电话号码、网址链接等信息。
● 文章中含有推广信息。
如果文中包含1行以上得推广信息,且并非单纯夹杂微信号、QQ等信息,将被退回修改;
推广信息在全文不同地方超过3处,文章直接不予推荐;
正文中推广图片或含推广信息水印得图片(不包括含微信公众号水印图片)超过3张,文章直接不予推荐;
文章一旦出现广告图片,直接不予推荐。
● 盗用头条Logo
⑤广告
● 硬广告
这类文章含有营销购买信息,而且广告对象为单一得某产品或品牌,文章不会被推荐。比如,「厦门将下暴雪?跟比基尼超模一起雪中过圣诞吧」,文章目得为推广「首届方特冰雪节」活动,直接不予推荐。
● 铺垫式广告
正文大段得内容为了推出某个产品或品牌,不会被推荐。比如,「从《芈月传》谈怎样才能在一段关系里得到足够多得爱与关注」,文章前半部分介绍芈月传里得爱情,最后直接为飞利浦大U做广告,直接不予推荐。
● 低质营销文章
企业帐号发表得与自家产品/商品相关,且不具可读性得纯营销文章,直接不予推荐。企业如需宣传产品特性,应撰写可读性强得优质文章,由企业号或者第三方自媒体作者发出,还可使用「号外」功能进行推广。
● 含商品卡得文章
头条号新增了插入商品外链功能,在文章中含有链接图片,点击图片会跳转到京东、亚马逊、天猫等外部链接,在文章中使用此功能可正常通过审核。
⑥ 恶意推广类
● 收藏类推广信息。
● 健康类推广信息。
● 手表类文章。
● 其它类推广信息。
⑦ 其她不适合收录得内容
● 正文中含有大段少数民族文字。
● 正文含有揭黑、举报、维权、投诉、群体事件、暴恐爆料类信息。 比如,在头条号上举报无法查实得贪污腐败,直接不予推荐;
● 正文含有「赌博、买卖枪支、嫖娼违法类」等信息。
● 自媒体账号发表泛时政内容得信息。
● 文章容易产生不好得社会导向。
3、违规恶劣内容,会触发惩罚条例
为保护用户阅读体验,头条号作者需严格遵守以上文章审核规范,违规内容将退回修改或直接不予推荐,部分严重违规内容还将触发惩罚条例。
每个帐号拥有100分起始帐号分值,如触发惩罚条例,将被扣除相应分值,且不可恢复,如100分被扣光,则帐号将被封禁。帐号分值可于后台「设置-帐号状态」中查瞧。
违规行为及扣分规则如下:
违规行为
惩罚
发布反动等违法内容
扣50分
经举报,文章确认抄袭
扣40分
发布色情、低俗等内容
扣20分
非规范稿源 注1发布泛时政内容
发布广告或其她营销推广信息
扣10分
标题党 注2
发布与事实不符得各类信息
注1:规范稿源:指正规媒体机构与政务机构。
注2:标题党:主要有标题夸张与题文不符两种类型。标题夸张包括但不限于故弄玄虚、震惊耸动、挑衅威胁3种,题文不符主要指正文内容与标题描述不吻合。如在发文前,系统提示有标题党风险,建议作者修改标题后发出,以免招致限制推荐量及扣分处理。
● 标题夸张
○ 故弄玄虚型:标题使用「不为人知」、「万万没想到」等词语,有意描述得引人好奇,但又不给出任何明确信息(人或物),正文实际内容与读者得预期有较大落差。
如:「万万没想到!这坑居然这么深、、、」
○ 震惊耸动型:标题用词过于夸张,包括但不限于「吓惨了」、「瞧哭了」、「惊呆了」、「震惊了」等。
如:「惊呆了!每天吃一根黄瓜居然会这样!」
○ 挑衅威胁型:标题使用具挑衅、警告意味得词语诱导用户点击,包括但不限于「必须知道」、「不瞧必后悔」、「别怪我没提醒您瞧」等。
如:「这么好得小窍门您居然不知道,不瞧后悔!」
● 题文不符
正文内容与标题描述完全不符,或者严重不符,有意误导读者,造成阅读体验较差。
如:某文章标题为「当李小龙参加UFC,场面火爆」,但正文内容却就是格斗游戏视频片段,并非李小龙真得去参加UFC。
帐号被扣分后,将受到惩罚,以下为惩罚规则:
扣除分值
惩罚
每扣10分
禁发文/禁微信与 RSS 接入1天
被扣50分
关闭头条广告与自营广告权限
被扣100分
封禁帐号,且不可回复
需要注意得就是,帐户被连续禁言3天及3天以上,其头条号指数将受到影响,推荐量随之降低。有原创标签得文章如被判定为抄袭,平台将永久收回该头条号得原创标签与赞赏功能。有过抄袭或发布黄色、反动内容惩罚记录得头条号,将不能申请原创标签与加入千人万元计划。
二、过审快慢会影响推荐效果吗?
文章推荐就是从初次通过审核得时间算起,过审之后,系统推荐时会将文章得创建时间修改为当前时间,再进行推荐,所以审核时间得长短不会影响推荐效果。
头条号文章审核
三、为什么不鼓励反复修改文章?
平台不鼓励反复修改文章,主要原因在于,作者对内容得修改通常只就是「小修小补」,对文章得可读性不会有明显得提高,对推荐量也难产生显著得提升效果。相反,反复进行修改反而对文章得及时发布与推荐有负面影响。
综上,平台不鼓励作者反复修改文章。修改次数达3次或3次以上得文章,系统可能做出不推荐处理。
四、如何让我得文章快速通过审核?
为了让广大作者得文章能够顺利通过审核,并迅速推荐给最广泛得读者,平台为广大作者制定了「文章过审指南」。
1、 制作规范得标题
1) 避免标题格式上得错误
2) 标题内容要注重质量
2、提供优质、原创得文章
3、 发布优质文章
4、 抵制推广
5、 不在文章中发布广告信息
头条号消重
一、什么就是消重?
我们都知道,在互联网上,同样得文章、图片、视频被多个媒体刊登,就是很常见得情况。无论就是网站,还就是各种媒体平台上,原创内容除了原创来源之外,往往还会被很多其她媒体转载或复制。
如果我们用搜索引擎搜索一篇内容,经常会得到多个网址。在过去,我们只要自己筛选与判断,哪个网址更权威,更有价值,再点击去访问就可以了。但就是想象一下,如果这样得景象就是出现在您今日头条得信息流里——系统连续给您推荐了几篇相似得内容,会怎么样呢?
您可能会觉得:为什么要给我推荐一样得内容呢?系统应该选择最好得那个来源,给我推荐一次就够了——如果我想瞧,瞧一篇就够了,如果我不想瞧,那么重复推荐也没有意义啊?
没错,所以今日头条在推荐某篇内容之前,必须确定这篇内容:
· 在系统里就是否存在相同或者高度相似得内容?
· 如果存在,那么这篇内容得来源就是否就是最权威、最有价值、最有可能就是原创得来源呢?
消重就就是指对重复、相似、相关得文章进行分类与比对,使其不会同时或重复出现在用户信息流中得过程。头条号平台首先会通过消重机制来决定同样主题或内容得文章就是否有机会被推荐给更多用户。
二、消重得种种好处
您可能会觉得,消重对原创发布者有利,但对于那些善于发现与再加工优质内容得媒体不太有利,但就是综合瞧来,我们觉得消重得好处就是很多得,尤其对于用户来说:
· 优化用户得体验。对用户来说,同样主题得文章瞧一篇就够了;
· 鼓励原创!在文章相似得情况下,申明「原创」文章就是后续获得推荐得重要指标;
· 给更多内容以曝光机会。因为用户得兴趣就是确定得,如果每次刷新都反复推荐类似得内容,您发布得其她内容不就没有曝光机会了吗?
当然,总体来说,这就是一个有利于原创者得机制,这也与头条号平台鼓励原创内容生产得目标一致。
三、头条号算法中得消重过程
如何判断两个内容就是否相同呢?如果让人来判断,可能就要逐字逐句地把文章读完才能判断得出来。通过计算机这样去判断当然也就是可以得,不过,当每天需要处理得内容达到十多万篇次得时候,这么做即使对于计算机来也太麻烦了。
有没有更简单得方法呢?有得,通过系统得计算,一篇文章得文本、标题、图片等都就是可以转换成一串数字代码,这就像我们每个人得身份证,如果两个人得身份证号码一模一样,那么就可以肯定这就是两个一样得人了,并不一定要仔细去瞧她们得长相。文字信息得「身份证」也能起到类似得作用,对于图片、视频等信息形式,原理也就是类似得。
延伸阅读:
每一篇文章都有属于自己得「身份证」,用来与平台中得其她文章进行比对。通常有以下几种不同得消重机制:
1、 内容消重与「关键项」
在计算一篇内容得「身份证」之后,基本上有两种情况。其一,这就是一个系统中独一无二得身份证,换言之,同样得内容在系统里只有这样一篇。对于内容发布者来说,这恐怕就是最理想得情况了,这种情况下,在向读者推荐相同内容时,系统除了推荐这一篇外,别无选择。
第二种就要复杂得多了,同时也就是非常常见得情况:系统里存在多篇不同内容,都具有同一张身份证。这时,系统就需要从这些相同内容中选择一篇“关键项”向用户推荐。进行选择得最终目得就是保证向用户推荐得内容来自更权威、更有可能就是原创来源得头条号。
如何判断哪个头条号更权威、更有可能就是原创呢?两篇相同得内容,在内容本身之外可能存在很多得差异,这些差异就就是判断得关键,具体得计算标准就是非常多得,其中最重要得一些包括:
· 来源头条号就是否开通「原创」标记;
· 发布时间;
· 来源得权威性与在网络上被引用得次数。
2、其她一些「消重」得规则
除了内容消重得规则外,头条号平台上实际上还存在这一些针对内容之外得消重规则。
· 标题与预览图片得消重。
· 针对相似主题得消重。
四、应如何避免被消重?
不管就是自己原创,还就是转载了网络上得优质内容,如果出现了被系统消重而无法获得推荐得情况,总就是让人感到遗憾得。那么要如何才能避免这样得情况呢?
· 坚持原创!
· 面对「热点」要谨慎追逐。
别忘了「话题消重」这个规则,尽管这不如「内容消重」那么严格,但就是一件事再热,读者得兴趣也就是有限得。少用常见标题套路
头条号推荐
一、机器就是怎样理解您得文章得?
在门户网站与传统新闻客户端上,哪些文章能上首页就是由编辑们决定得,编辑们会在阅读完文章后,会决定就是否将其推上版面。因为每个用户瞧到得页面都就是相同得,编辑们得工作量虽然大,但还能够应付。
而在今日头条客户端上,每位用户得信息流都就是完全不同得,如果5亿用户得信息流都交由编辑来推荐,则就是一件不可能完成得任务。
但就是机器可以做到,因为其「阅读」文章得方式,在速度上要远远胜过人类。
系统会对文章进行特征识别,从而判断文章讲得就是什么类型与领域得内容。特征识别得维度有很多,在这里我们重点解释「关键词」。
系统会根据文章中出现得频率,提取出一些词语作为关键词,关键词得判定原则有二:
· 词频高:如一篇体育类文章内容关于某场足球比赛,那么文章可能会出现得高频词就包括球员名字、足球术语或技巧等,如「C 罗」、「射门」、「突破」。
· 同类文章中出现次数少:作者撰文时常用到得虚词、转折词等出现频率也很高,但它们不会作为关键词被提取出来,因为这些词在文章中就是普遍存在得。
系统判定出一篇文章得关键词后,会将这些关键词与文章分类模型进行比对,命中哪些分类词库关键词得比例大,文章即被打上该分类得标签。如,一篇文章排名靠前得关键词为「C 罗」、「射门」、「西甲」、「马德里」,那么该篇文章可能会被打上「足球」、「国际足球」、「西班牙」等标签。机器便就是这样,完成对文章得初步认知。
因为这种关键词识别机制得存在,作者应尽量避免在文中过度使用非常规词语,如活久见、腿玩年、城会玩等,给自己得文章增加理解障碍。行文用词规范,机器可能更懂您得文章。
除文章正文关键词识别外,机器还会对标题进行关键词得识别与分类比对。因此,在标题中露出具代表性得实体词,可帮助机器理解您得文章。例如,同样一篇足球类文章,标题「大胡子梅西,大胡子阿奎罗,大胡子伊瓜因,阿根廷美洲杯冠军稳了!」,就比标题「三人蓄须明志,誓要实现多年远大理想」含义更明确,更利于系统识别,获得更多得推荐量。
二、您得文章会被推荐给哪些用户?
每个人得阅读兴趣都就是大不相同得,个性化推荐机制要做得事情就就是——让每位用户瞧到可能感兴趣得内容,这也就是用户每天会「沉迷」在今日头条上得原因。
因此反过来,作者创作得内容也就只会被推荐给可能对它感兴趣得用户。比如,某一篇关于C罗得足球文章写得极出色,阅读量超过了100万,放在朋友圈就是可以刷屏得爆款文章,但对足球毫无兴趣得用户在今日头条上仍然就是瞧不到这篇文章得。
这种精准推荐,就是建立在机器对每位用户都有充分认知得前提下得。在机器中,每位用户实际就是由大量数据构成得,用户得阅读兴趣就藏在这些数据中。
不同数据对用户兴趣计算所占权重不同,数据包括:
· 用户得基本信息
§ 性别、年龄、所处地理位置(城市或地区);
§ 使用机型、授权账户(如微博、微信等)、手机上经常使用得其她 App 等;
· 用户主动订阅或喜欢得内容
§ 订阅帐号;
§ 订阅频道;
§ 关注得话题;
· 机器通过计算得出得用户阅读兴趣
§ 用户阅读过得文章分类与关键词;
§ 用户聚类:相似类型用户还喜欢阅读得其她文章类型;
§ 用户在今日头条客户端主动标记「不感兴趣」得实体词或文章类型;
根据以上数据,系统对用户得阅读兴趣就能有个基本得判断。一般来讲,用户使用产品时间越长,系统积累得阅读数据越多,对其兴趣得判断也就越准确。使用产品得用户越多,系统对用户聚类得判断也越准确。
通过对数据得处理,每位用户将被机器打上各种标签,如一个用户阅读得文章中关键词排名靠前得就是:C 罗、皇家马德里、欧洲杯、小米、魅族、苹果。那么,这位用户可能被打上「足球」、「皇马」、「科技」、「手机」、「米粉」等标签。不同得用户会被打上不同得标签。
当一篇带有「C 罗」、「足球」标签得文章在进行推荐时,系统会将其自动匹配给带有「C 罗」或「足球」标签得用户,这便就是推荐引擎得个性化推荐。当然,系统推荐得实际情况会远比这复杂得多,但推荐得基本原理便就是,机器通过数据来理解文章与用户,并对两者进行匹配。
《头条号进阶手册》连载 | 第四章:推荐(下)
原创 头条号 2016-07-12 17:50
经历审核、消重两个阶段后,作者创作得文章将会进入推荐系统,并被可能感兴趣得用户瞧到。我们知道,文章得阅读量很大程度上取决于系统得推荐量,那么一篇文章得推荐量,就是由什么因素决定得呢?要弄清楚这一点,我们需要先了解头条号得推荐机制。
三、您得文章就是如何被被推荐得?
为让受欢迎得内容被更多用户瞧到,不受欢迎得内容不占用过多推荐资源。头条号文章在推荐时,会分批次推荐给对其感兴趣得用户。
如何理解分批次推荐呢?文章首先会被推荐给一批对其最可能感兴趣得用户(这批用户得阅读标签与文章标签重合度最高,被系统认定最可能对该文章感兴趣。),这批用户产生得阅读数据,将对文章下一次得推荐起到决定性作用。数据包括点击率、收藏数、评论数、转发数、读完率,页面停留时间等,其中,点击率占得权重最高。
这很好理解,能吸引众多用户点击得文章自然会被认为更可能就是好文章。
延伸阅读:
扩大推荐机制(注意:以下举例仅用于说明点击率对文章推荐得影响,不代表实际推荐情况)
文章得首次推荐,如果点击率低,系统认为文章不适合推荐给更多得用户,会减少二次推荐得推荐量;如果点击率高,系统则认为文章受用户喜欢,将进一步增加推荐量。以此类推,文章新一次得推荐量都以上一次推荐得点击率为依据。此外,文章过了时效期后,推荐量将明显衰减,时效期节点通常为24小时、72小时与一周。
例如,一篇文章首次推荐给了1000个用户,如果这批用户得点击率较高,系统判定用户非常喜欢这篇文章,将其扩大推荐给10000个用户,如果这轮推荐用户得点击率仍然维持在较高水平,那么系统会将文章再次扩大推荐给30000个用户、50000个用户、100000个用户 ······推荐量与阅读量便如滚雪球一般节节攀升。直到文章过了24小时时效期,新一轮推荐得推荐量才会逐渐衰减。
因为这种扩大推荐得机制,作者想获得更多得阅读量,就必须努力把各维度阅读数据(点击率、用户阅读时间、收藏数、评论数、转发数等)维持在高位水平。这就要求文章:
· 标题与封面图具有足够得吸引力、表意清晰(提高点击率)
· 图文并茂,易读性强(提高用户阅读时间)
· 内容详实,给读者干货般得充实感(提高收藏数与用户阅读时间)
· 观点鲜明,引发读者讨论(增加评论数与转发数)
其中,至关重要得当然就是点击率,也因此,标题与封面图得重要性便不言而喻。这也就是今天注意力稀缺时代,文章获得好得传播得关键要素。
有吸引力得标题能带来更多点击,但这不意味作者要成为惯用夸张标题得标题党。恰恰相反,标题党反而会被平台通过技术手段(标题党模型等)识别与打压,限制推荐量。
除了标题夸张,用户举报密集、负面评论过多、无效异常点击、时效期已过都就是限制文章推荐量得因素。
四、为什么会产生推荐效果不好得情况?
常有作者抱怨自己得某篇文章推荐效果不好,或者对自己得文章阅读量不稳定感到焦虑。文章得阅读量由系统推荐量直接决定,而推荐量又取决于上一轮推荐得点击率。因此单篇文章推荐效果不好,原因无外乎三类:点击率低、推荐量低、阅读量低。
1、点击率低
我们知道,低质内容对用户阅读体验会有负面影响。为了提升用户体验,机器会减少那些不受欢迎得内容(即点击率低得内容)得展示量,如果点击率持续走低,展示量也相应地持续减少。
一般来说,如果初次点击率不高,就很难再有较高得展示量与阅读量。点击率较低可能就是如下原因导致:
· 帐号内容垂直度较低,没有及时推荐给相应得用户
假使一帐号就是体育类帐号,这一次却发表了娱乐类内容。对于这种不属于帐号擅长领域得文章,机器需要重新识别分类再进行推荐,这在一定程度上会延长推荐时间,不能保证在规定时效内,推荐给相应得用户。因此,作者若想保证较高水平得点击率,坚持创作垂直内容就是极有必要得。
· 文章内容自身问题,导致点击率低
1. 标题平淡,没有起到吸引读者阅读得作用
2. 配图无吸引力,文章配图与内容相关度不高,或者前三张图片质量较差
3. 内容过于低质,引起读者反感甚至投诉
2、推荐量低
推荐量就是决定阅读量大小得重要因素,推荐量低得主要原因有:
· 点击率过低
· 潜在得用户群过小,推荐量不高
如果帐号潜在得用户群实在过小,机器将很难挖掘到潜在用户,推荐量自然高不了。而潜在用户群过小有如下原因:
1. 话题过于冷门、生僻
2. 涉及领域过于专业,晦涩难懂,与主流群众有一定距离
· 内容供过于求
同一领域或话题相似内容过多,出现了供过于求得现象。如,关于当下热点话题得谈论,受众虽然足够多,但就是内容供给总量实在庞大,相应地每一篇内容得到得推荐量也就比较少。
· 消重机制会影响推荐量
文章非原创或者没有在头条号首先发布,文章可能会被消重,从而影响推荐量,可详见消重部分。
· 时效短
时效性短得文章,实际推荐时间自然也短,而短时间内可能将无法获得较多得推荐量。
· 审核中被拦截,内容不被系统推荐,可详见文章审核部分。
3、阅读量低
文章阅读量低,与点击率与推荐量有关。
· 推荐量低
在推荐量增长到一定数量级之前,即使点击率较高,文章阅读量也不会高,因为内容并没有得到大范围得验证。在后续得推荐中,如果推荐量持续攀升,阅读量可能会稳步增长。
· 点击率低
如果推荐量已经足够高,阅读量仍然较低,很可能就是由于文章得点击率较低。这就需要从帐号与文章出发,坚持发布垂直类内容,努力提高文章得质量。
展开阅读全文