APP推广合作
联系“鸟哥笔记小乔”
26万条抖音数据背后的推荐逻辑,以及严重失调的男女比例
2018-06-01 10:31:01


和往常一样,先给出分析结论,希望你能引起你的兴趣:


  1. 首次推荐分水岭应该在5000人,点赞不过百基本凉了;

  2. 抖音红利似乎在消失,用户越来越不喜欢点赞了;

  3. 15s不一定是最好的,可以试试10s;

  4. 男女比例严重失调,小哥哥的视频更受喜爱;

  5. “生活化”是抖音内容的主体,年轻人乐于表达爱和喜欢;

  6. 90后是抖音的主力军,94年小哥哥小姐姐最多;

  7. 一些小技巧,比如把抖音视频分享到微信和朋友圈;

  8. 一个很棒的广告


下面是正文


丨数据介绍


数据区间是2018年2月1日—5月10日,历时两个月,累计260968条。采集过程中,对作者做了去重处理,也就是说每个作者只取了TA的一条视频数据。这也代表着我们拥有26W个作者的数据。


数据包含视频描述、发布时间、播放数、点赞数、评论数、转发数、尺寸、清晰度、时长、是否包含商品广告、是否包含水印,以及视频作者的昵称、性别、生日、账号创建时间、是否认证、认证类型等数据。


另外,数据均为前端可见数据,未使用任何违规操作。



丨首次推荐分水岭是5000,请把赞“刷”到100+


做过今日头条自媒体账号的人应该了解,头条的推荐算法是先把文章做小范围推荐,查看文章在该部分人中的阅读数据,如果阅读数据良好,则会扩大文章的推荐范围。数据越好,推荐范围则越大。


既然抖音是头条系产品,那肯定采用了同样的推荐逻辑。从用户的方便程度来看,点赞>评论>转发,那么点赞作为推荐算法的指标权重应该会大于其他两个。从头条的推荐算法推测,视频应该会先被推荐给一部分用户,如果点赞数达到某个水平,则会将视频推荐给更多的人;如果没有,那么视频大概率会凉了。


经过不断分段统计视频各播放量与点赞之间的关系,得到了下面这张表格:



由于采集机制的原因,我们很难采集到没有被推荐的视频,但就现有的1907条播放量在5000以下的视频我们可以清晰地看到,这些视频的点赞量100以下的占到了94%。那么反过来可以推断,想要你的视频被更多的人看到(也就是进入系统推荐的二阶段),那么你视频的点赞量至少应该增加到100以上。


我做了几个视频进行了测试,发布后分享出去让好友帮忙点赞(下文会给出方法),那些在1小时内点赞量突破一百的,播放量在几小时内很快破万;而那些点赞量低的,则不再被人问津。



即便这个结果在测试中得到了验证,但是我却不能给出实锤结论。


首先,目前采集到的低于5000播放量的数据,大都在5月以后发布,传播时间不够长,或许这恰好是点赞量低的原因;其次,与整体的样本量相比,这部分数据只占不到1%,没有达到统计分析的样本数要求。


无论如何,视频的点赞量肯定会作为推荐权重的依据,点赞越高自然是越好的。


丨看似红红火火,但瓶颈似乎已经到来


作者数据包含了账号的注册时间,我把作者的注册时间按照月份统计,发现抖音用户的增长似乎在放缓:



从上面的用户注册时间分布来看,抖音用户在2018年1月份达到顶峰,随后开始逐月递减,4月份已经只有3月份的一半!


实际上,这个数据仍然存在一些漏洞。毕竟存在一种可能,就是新注册的用户不喜欢发布视频,而是在注册一段时间后才开始发布。或者,新注册用户的视频因为还未得到系统的推荐,被我们采集到的概率也随之降低。


如果账号的创建时间不能说明问题,我们来看另一组数据。


把视频的发布时间与其相对应的播放量和点赞量结合,我得到了各月发布视频的平均点赞量。为了去除数据传播时长的影响,我去掉了5月以后发布的视频,得到各月平均点赞量分布图:



数据显示,各月视频的平均点赞数在逐月降低,4月份食品平均点赞量甚至不足3月份的一半。或许是因为视频越来越堵,用户已经麻木,但无论如何,早期的红利在逐渐降低,想上车的要赶紧了。



丨拍满15s不是最好的,10s更受用户欢迎


目前抖音未公布获得视频超过15s时长权限的机制,但至少我们知道“优质”是选拔的重要条件,所以在分析视频时长时,我去掉了时长超过15s的视频。对15s以内视频的平均点赞情况作了分析,得到以下分布图:



数据并不支持我们把视频拍满15s,10s是最好的,13s也不错,甚至11s都优于15s。


由于超过15s的视频数量仅6866条,在样本中占比太少,我就不再给出分析。在相同数量级下(均少于100条),39s、42s、50s和58s看上去效果不错。



丨男女比例严重失调,小哥哥的视频更受欢迎


统计26W个作者的性别,我发现抖音用户中女性用户数量接近男性的3倍!显然是严重失调。


(注:“无”代表用户没有填写性别信息)


从用户组成来看,就很容易理解为什么抖音的带货能力这么强了。从购物能力来看,女性购买力更强,毕竟大部分钱都掌握在女性的手里。


把作者性别和其发布视频的平均点赞量结合,我神奇的发现,小哥哥们的视频竟然更受欢迎!



难不成是因为女性用户多于男性,异性相吸?


注:没有性别信息的用户有多个视频点赞量超过百万(比如用户@安德罗妮、的一个视频点赞量达到600W),造成了该类别用户的平均点赞量过高,不排除这部分用户均为女性的可能性。



丨生活化的内容是抖音的主流,年轻人愿意表达爱与喜欢


使用新浪微舆情(wyq.sina.com)的文本分析功能,把视频的描述文字做了词性和情感方面的分析,发现生活化的内容是抖音的主体。



对视频描述文本的词性分析,动词方面除了“喜欢”和“爱”以外,生活化的“想”、“拍”、“吃”是出现频率最高的词;形容词方面“快乐”、“开心”、“好看”和“可爱”是抖音用户最喜欢表达的感情;名词上“小哥哥”和“小姐姐”显然已经成为发抖音的固定搭配。



整体词频方面,除了“小哥哥”、“小姐姐”以及“抖音小助手”以外,具备强烈生活色彩的“爸爸”、“我妈”、“弟弟”、“老公”、“我家”这些词同样被高频率使用。



丨抖音是90后的天下,94年是主力军


对作者的出生年龄进行统计,排除掉建国以前出生和至今未出生的用户,得到如下年龄人数分布图像:


(点击图片放大查看)


图像已经很清楚的告诉我们,抖音的已经是90后的天下,94年是这其中的核心。不过算算也对,94年出生的人现在已经24岁了(我还以为14),正是最青春、最喜欢新鲜事物的年华。


所以,主打年轻人的品牌可以入驻或者把广告投放搞起来了。



丨福利:一些抖音小技巧


1.把视频分享到微信,不被屏蔽甚至可以直接跳转到抖音


由于“互联网短视频整治期间,平台将统一暂停直接播放”,我们分享到抖音的视频会变成一长串链接,这大大降低了我们视频的曝光度。但这些阻挡不了聪明的互联网人(也就是我了)致力于传播的热情,我使用一些黑科技手段为大家开发了一个小工具,可以帮助你们把抖音视频分享到微信,点击后直接跳转到抖音APP播放,像下图这样:



生成链接打开后的应用宝页面也是可以分享出去的,点击后同样可以直达你的抖音视频。这是一个工具箱,具体制作方法我就不透露了,长按识别下面的二维码即可享用。


26万条抖音数据背后的推荐逻辑以及严重失调的男女比例12.png


2.精细化运营,一些小细节很重要


我们来看下面两个视频截图,你发现什么差别了么?

  


如果两个视频都需要视频描述来完善视频的内容,那么后一个视频的效果会更好,因为相比于白色视频背景,纯黑色可以非常清晰的把底部的视频描述凸显出来。


除此以外,视频内容和质量相似的情况下,竖向的视频比横向的视频更容易被点赞,不信你横过手机点赞一下试试……



3.能不能绕过机器筛选直接被推荐到更大的流量池?


随着监管制度的完善,纯机器算法筛选和推荐已经不能满足用户对高质量内容的需求,于是今日头条引入了大量人工审核团队。这些人工除了审核内容是否违规外,还承担发现优质内容、使其提前进入推荐队列的职责(我猜的)。如果我猜对了,那么,如果视频能跨过机器的迭代推荐,直达人工,岂不是会更快速的火起来?


我有一个冒风险的办法,并且测试成功了一次(只测试了一次,200粉丝半小时飙升到1W2播放量),你们如果胆大也可以试一试:在视频描述里加入一些机器识别不准确的敏感词,像这样:


26万条抖音数据背后的推荐逻辑以及严重失调的男女比例14.jpg



作者:喜哥

来源:喜新(ID:noyanjiu)

本文为作者授权鸟哥笔记发布,转载请联系作者并注明出处。



文章推荐:


【专题】新流量洼地——抖音的全套运营攻略

抖音从何而来,抖音向何处去

国内首份抖音广告分析报告,游戏行业广告投放占比最多


运营那些事儿
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
运营那些事儿
运营那些事儿
发表文章43455
确认要消耗 羽毛购买
26万条抖音数据背后的推荐逻辑,以及严重失调的男女比例吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接