400亿播放真实只有100亿?视频刷量与真实数据的“较量”创投

砍柴网 / 文娱价值官 / 2017-12-19 13:16
中国网民最新数据7.51亿,却在爆款的电视剧、网综实现了几十亿、几百亿的播放量,通过技术获取真实数据后发现,一个400亿播放量的真实正片播放数据只有100亿左右? 400亿vs...

2017年9月,据云合数据提供的连续剧播放统计,总播放量达到819.3亿次,而正片有效播放量仅有352.4亿次。(2017年9月1日-9月30日 全网连续剧市场的播放数据)近500亿次的差距,真实性无从评判,但似乎在圈内早已常形成了默认。

2016年,有媒体将网剧的播放量刷量事件翻出,并拿到了淘宝商家乃至导演的证实,在淘宝庞大的刷量产业下,网剧乃至电视剧在播放量上在持续的“自嗨”。

2017年,有视频网站公开将某视频刷量公司起诉,行业内开始了对于刷量的技术筛查和“抵制”。

面对频频出现的爆款电视剧、爆款网剧、爆款视频等,我们在欣赏娱乐化内容的同时,也要选择在认知上保持清晰准确,不被虚假的播放量左右思想。

现在还有不刷量的么?

2016年,视频刷量的行为高调进入大众视线,据每日财经新闻采访内容露出,在记者调查前后,得到了不只一次的惊叹回复“现在还有不刷量的么?”。

这个已经被称作圈内“公开的秘密”的行为,在现象级剧集的播出中占据了什么角色?

以云合数据提供的最新数据来看,在过去的一周里(12月4号-10号),《猎场》《九州海上牧云记》《我的体育老师》位列三甲:

《猎场》一周的点击量为49.2亿,含金量为21.66%;

《九州海上牧云记》一周的点击量为14.06亿,含金量为40.61%;

《我的体育老师》一周点击量为12.61亿,含金量为40.71%。

图为:云合数据12月4日-12月10日周榜单

总览整个周榜单,点击量的含金量最高为69.8%,而最低仅为17.32%,数字间差距硕大。

云合数据提供的数据中,以正片有效播放的概念完成统计,综合了有效点击和用户观看时长,最大程度的去除异常的播放量,在这其中,还会排除花絮、预告片、特辑等干扰。

点击量含金量较高的《海上牧云记》

在提供周榜的数据中,前台点击量包含了花絮,预告片特辑等的播放量。而有效播放所代表的是真实的播放表现。如果前台点击量全部以播放量的概念标注在连续剧上,这是不是一种“故意而为”的迷惑呢?还是充满目的的“注水操作”?

2017年年度大剧很多,以12月5日为时间节点的全年连续剧榜单中,《三生三世十里桃花》、《楚乔传》、《择天记》依次据榜,含金量最高仅为《三生三世十里桃花》的45.02%。

图为:云合数据截止12月5日全年连续剧榜单

但上榜的每部剧播放期间无不成为街头巷尾的谈资,无不登上微博热搜,顺带引起一下群众的热议。真真假假的数据,成就了谁伤害了谁?

数据的较量

假的数据带来的直接结果是好看的播放数据,在好看的数据之后,实则存在着播放平台和第三方数据监测公司的较量。

文娱价值官(ID:wenyujiazhiguan)采访了第三方数据公司--云合数据CEO李雪琳。

在采访中,李雪琳说到:“对于云合的数据,我能确保算法上的公平,但不认为计算得到的数据绝对无误差。但对于点击量的定性是没有问题的。如果一部400亿点击量的连续剧,云合计算出的有效播放数据可能是100亿,也许平台数据显示是150亿,但如果平台显示含金数据300亿、350亿,未免差距太大,值得推敲。”

文娱价值官(ID:wenyujiazhiguan)记者又去CSDN论坛的开发者大本营去寻求了一下对于视频播放量的相关技术。 

云合数据创始人兼职CEO李雪琳

从视频播放平台的角度来看,对于数据的监测,存在不同的算法,可以得到不同的数据,形成大数据的生态分布。大数据在最初应用在视频播放上解决了很多的问题,例如哪一个拍摄情景和部分被快进了,哪一个部分没有快进,观看次数较多,可以通过这样的数据反馈到拍摄方和制作方来更好的拍片。

在各种广告形式增加后,数据的监测形式越发细化,对于开头广告、片头花絮、正片播放、中插广告、压片广告、片尾花絮等等均存在数据获取。但对于视频平台对外宣布的数据来讲,无法得知是否将那一部分数据作为真实数据公开。

一个用户在观看一个视频的时候,还会产生多次的点击播放数据,当视频进入正片几秒后,视频网站通常记录一次播放,而播放过程中出现缓存、网络不稳定则有可能记录第二次播放,在主动点击暂停再播放时,网站将再记录一次播放。因此一个视频的浏览,除自然无操作播放外,一个用户可能贡献了多次播放量。

如果一个连续剧的播放总量为400亿,真实的用户数据需要在除以集数的同时,再除以平均操作次数。

而云合数据作为第三方数据监测公司则去掉预告片,花絮,特辑的干扰,依靠抓取的多维度全量数据,使用机器学习算法,将正片点击量中的异常部分去除,来还原连续剧的真实播放水平。云合数据CEO李雪琳说到,“理论上只要是用户可以看到的前端数据,都是可以获取到的。”

在视频网站的数据计算中,大的网站在搭建结构的时候会通过加密权限的某些算法来提供某些数据的抓取以便于公开数据的审核对比,而用户在网站观看视频的过程也会在网站留下注册后的行为数据,第三方的公司通过算法的抓取也可以完成获取。

如果在片方、品牌方、以及平台的数据都有水分介入的话,最终的真相取决于平台和第三方数据公司对于数据的筛查分析。这又转变成了一场认知和诚信的较量,商业和真相的权衡。

广告主和投资方的黄粱美梦

真真假假的数据是商业和真相的权衡,这样的权衡建立在以下几点立论上。

为广告主和投资人提供“心理安慰”。每部巨作电视剧的高额投资,最终都会以剧集的播放量评测商业收益,播放量最直观也最具说服力,播放量高,对于广告主的议价能力自然提高,而进入投资和收益的“正循环”,最后“你好我好大家好”。

决定网站的片位排行。视频网站是最以流量定胜负的角色,因为流量是视频网站赖以生存的工具,自然会将高流量的剧、视频高位推荐,完成导流。

为了树立剧的品牌力。对于观众看剧来讲,观众除以观感定位剧集的好坏,推荐与否,火爆程度、有多少人看等因素形成的人群效应明显。

以此,在这样的结果导向下,更多数据形成了虚假的现象。有业内人士分析指出,首先,各大视频网站平台会受到干扰,用户挑选内容观看、广告主挑选内容进行投放也会受到干扰。其次,对影视剧行业造成影响,制片方不知道到底哪一类内容真正受用户喜欢,对整个行业来说都是一种恶性循环。

对于一个需要以用户行为和需求决策的行业,整个行业的数据越真实,整个行业才能得到更加健康的发展。

此外,整个需要控制的部分也需要更多的标准来控制,近日,爱奇艺称将组建团队建立数据筛选清洗工作,同时建立视频内容播放标准。

行业的发展形成巨大的数据集,数据的分类整理挖掘可以促进行业标准化,行业细分化,但在虚假数据已经被默认,被产业化,是对正向资源的极大浪费。在伤害片方、广告主和平台的同时,被数据潜移默化影响的用户,是整个过程中最沉默的羔羊。

来源|文娱价值官



1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。


阅读延展



最新快报

1
3