为什么第三方数据报告总是不准?

2020-01-13 投稿人 : www.chacha360.com 围观 : 753 次

年底,将发布各种第三方数据报告,展示2018年互联网行业的发展,并提供对2019年行业趋势的洞察。理论上,这类报告是企业家、投资者和媒体的重要参考,也有助于企业了解行业和竞争对手,也是对数据排名高的公司的认可。

然而,每年我们发现不同的数据报告差异很大,给人一种雾的感觉。不仅是年报,还有“不允许第三方报告”,多年来困扰着互联网行业,尤其是互联网企业。

不允许第三方报告。

最近,我看到了两份信任数据报告,其中一些令人费解。

在trust data 1 1月10日发布的《2018年12月移动互联网全行业排行榜》中,12月份200大应用排名前10名分别是微信、QQ、支付宝、百度、wifi万能钥匙、淘宝、腾讯视频、高音、iQiyi和QQ浏览器。

然而,15天后发布的《2018年移动互联网行业分析报告》,2018年TOP20移动应用的席位发生了变化,分别是微信、支付宝、QQ、淘宝、百度、wifi万能钥匙、腾讯视频、trembles、iQiyi和QQ浏览器。支付宝超越了QQ,淘宝超越了百度和wifi万能钥匙。

这是2018年的第二份报告吗?答案是否定的。Trustdata在报告中明确表示,它采用了2018年12月的数据,相关应用的MAU也发生了变化,有些甚至直接增加了2亿。

不仅前后数据不一致,关键指标也不同于官方企业数据和其他第三方数据。

腾讯2018年第三季度的财务报告显示,QQ的每月总实时账户为8.026亿,而对于移动终端,QQ智能终端的每月实时账户为6.799亿。在Trustdata的两份报告中,QQ的月寿命只有5.8亿英镑。有没有可能在第四季度,QQ经历了2亿英镑的大幅下跌?答案是否定的,第三季度,QQ智能终端每月活跃账户同比增长6.9%,21岁以下年轻用户的数量和使用时间甚至有所增加,这不太可能导致如此悬崖般的下降。

如果企业发布的官方数据不具有权威性,我们可以查看其他第三方数据。QuestMobile的《中国互联网2018年度大报告》是业内传播最广的。其应用排名显示,排名前10位的是微信、QQ、支付宝、手机淘宝、爱奇艺、腾讯视频、百度、高音、搜狗输入法和戈达尔地图,这些都与Trustdata大相径庭。其中,12月份QQ的MAU为6.49亿,比TrustData的MAU高出近1亿,与腾讯第三季度的QQ智能终端月寿命6.799亿非常接近。

让我们再看一遍手机数据。Trustdata的第二份报告显示,中国智能手机运输品牌占总数的8.5%,小米占12.6%。然而,在西诺的数据中,荣耀在销量上超过苹果(5270万台),进入中国市场前4名,仅次于OPPO、vivo和华为。在一份报告中,荣誉胜于小米。在另一份报告中,荣耀远不及小米。

同一数据组织发布的不同报告在同一时间对某个产品的关键数据有巨大差异,这种情况确实很少见。然而,在不同的报告中,有许多产品数据差异巨大的例子。关于“无第三次报告”的争议已经成为企业与第三方数据机构之间的公开矛盾。

误差太大的企业不满意

在数据问题上,中国的数据机构和企业,以及企业和企业之间,一直都处于这样的状态:在一份报告发布,第一、二、三个指标的排名明确之后,企业要么质疑数据机构统计数据的方法、结果或动机,要么质疑竞争对手和数据机构之间的“合作”,导致数据不公平。

2016年,张一鸣对数据组织艾瑞的攻击引发了行业争议。艾瑞(iResearch)当时的数据显示,今天每日活跃用户的头条数字是“百万”,但今天的头条称,许多第三方数据组织报告了3000多万每日活跃用户。

一个令人印象深刻的例子是统一通信浏览器和QQ浏览器之间的“数据纠纷”。余永福在看过一次数据后表示愤怒,拍桌子指责一家数据机构和腾讯,并找了一堆媒体来澄清他是移动浏览器的老板……关于谁是移动浏览器的“老板”的两次争斗也持续了两三年。

2016年,高德和百度也一直在争论谁是互联网地图的老板。高德甚至一直喊着他希望通过“嵌入第三方代码”来竞争。2017年,Trustdata发布了《2017年上半年中国移动互联网行业发展分析报告》,ofo质疑了“共享自行车列表易手,ofo达到顶端,mobike呈现负增长”的结论。ofo和mobike也就谁是第一个分享自行车的人争论了很长时间。

类似的争议发生在许多行业,如搜索、电子商务、视频、音乐和外卖……如果某个领域没有数据争议,只有几个可能性:

首先,该行业太小,数据机构无法报告。

第二,这个行业已成定局。例如,从来没有人敢与微信竞争第一名。

第三,共享自行车和浏览器的行业不再繁荣。现在没有争议了。

当然,说到座位安排,很难取悦每个人。如果数据差距本身很大,就不会引起争议。如果说等级是相等的,第三方数据组织通常很难区分上级和下级。如果有必要区分它们,就会受到质疑。第三方数据组织就像是球场上的裁判,他会因为打球而受到责备。

但是,从更深的角度来看,大数据组织总是给人一种数据不准确的感觉,而且还有更多的原因。

为什么不允许报告?

骆超频道在《今日头条PK艾瑞:数据机构和企业为何总是争论不休?》文章中分析了这一点。今天,似乎许多原因没有得到解决,一些问题已经得到解决。

首先,数据组织的结果不够透明。

你是如何得出一个公司拥有如此大的市场份额和如此长的使用时间的结论的?如果是抽样调查,抽样选择是否科学?如果是自动化工具,用户的覆盖面是否足够大,原始数据和数据统计过程中是否存在漏洞……这些都是企业可能会质疑的问题,那么数据源来自哪里,如何进行统计,统计过程必须足够透明,以经得起第四方和第五方的考验才能令人信服。

前几年,第三方数据组织发布报告,甚至可能不发布数据源和统计方法。对企业数据进行监督而不披露自己的监督方法显然是不公平的。今天的可靠报告将基本上公布统计方法和数据来源。如果你不发表这些报告,就看看它们。

其次,数据样本很难覆盖全部数量,只能部分反映出来。

只有企业自己最了解应用程序的真实数据,第三方数据组织只能通过自己的方法获取一些数据样本,然后使用统计学等方法来推断整体数据。因此,第三方数据只能保持接近真实水平,但不能100%准确。数据获取能力决定了一个组织接近真实情况的能力。

不同的组织有不同的方法来获取数据。一些非主流数据组织直接采取抽样,甚至使用市场下载量的“愚蠢方法”进行报告,基本上没有参考价值。主流数据组织也有不同的方法,一些直接与手机公司合作,一些与运营商合作,一些为应用程序提供技术服务以获取一些数据,还有一些与应用程序合作,但无论使用哪种方法,都无法覆盖所有数据。

与个人电脑网站的开放性相比,移动时代的数据统计更加困难。应用程序是一个封闭的系统。它最了解自己的数据。此外,互联网公司将数据视为资产,越来越不愿意向第三方披露数据。更不可能披露交易量等机密数据。

正是因为这个原因,第三方数据组织的数据只有一定的参考价值,就像前面提到的信任数据一样。在其报告中,该数据库是一个自建的安卓用户样本集,“每天生活超过1亿,每月超过3.2亿”。数据是通过建立一个基于网民人口结构、地理分布、移动应用iOS和安卓比例等因素的模型计算出来的。换句话说,这仍然是一个统计规则。既然是这样,它只能尽可能准确,而不能绝对准确。

第三,即使可以获得样本,谁能保证数据本身没有问题?

不管它是不是m

在能够处理获得的数据之后,企业必须对数据进行“脱水”甚至“反刷”。例如,如果第三方数据组织使用与应用程序合作并允许后者访问其SDK来统计后者的数据的方式,企业会“做数据”来欺骗相应的数据组织吗?换句话说,如果数据组织让企业“报告”数据本身,企业会诚实地给出数据吗?这不是唯一的情况。如果一份报告非常重要,而且企业知道报告的统计方法,它很可能会想尽一切办法使数据变得美丽,并从数据的来源伪造它。这基本上没有解决办法。

第四,不同机构的数据指标严重不一致。

互联网公司在过去几年里合并了很多。合并后,这两家公司的市场份额加起来往往超过100%,甚至200%.这是因为这两家公司以前可能发现不同的数据机构进行报告,这些报告采用不同的标准:一些统计数据是关于渗透率的,一些是关于用户市场份额的,一些是关于活跃用户份额的。总之,各种指标都令人眼花缭乱。精确的统计并不是没有必要的,但是大多数时候数据组织都试图为企业设计相应的指标和口径,以做出“第一”报告。因此,当企业A在数学上比较中国和企业B时,并不是每个人都在比较相同的指标。

数据不准确有很多原因。从长远来看,数据只能尽可能减少误差,但不能消除误差。既然如此,这是否意味着第三方数据报告毫无价值?答案是否定的:“你认为第三方报告怎么样?

首先,数据不会说谎。真实数据对行业有很大价值。

企业了解自己的行业和竞争对手,企业家寻找创新机会,投资者寻找项目,媒体报道企业,所有这些都依赖于数据。企业本身发布的数据可能不真实,因此需要第三方数据组织作为参考。

因此,我们不能否认第三方数据组织的存在和各种第三方报告的价值。

正是因为每个数据组织的报告并不绝对准确,数据观察者才应该全面引用多个组织的数据。目前,中国的主流互联网行业包括问答手机(QuesMobile)、APP Annie、艾瑞咨询(iResearch)、信任数据和通话数据。超大公司也有自己的数据监控平台,如腾讯灯塔、百度移动统计和阿里优梦。

第二,组织应该自律。只有当数据尽可能接近真实水平时,它们才能走得更远。

现在有越来越多的数据组织。如果你的数据总是不可靠的,如果品牌消失了,没有人会相信这些数据。人们会选择相信有品牌的数据组织。QuestMobile是在过去两年中出现的数据组织,不是因为数据100%准确,而是因为数据相对更准确,有着良好的声誉。

有些组织的数据不被允许也与业务模式有关,因此数据组织应该走出依赖报告本身的收入模式,探索新的业务模式,如大数据服务、开发人员服务、咨询服务和数据媒体。目前,一些组织报告的数据绝对客观,对数据本身充满敬意。因此,最终数据报告的影响越来越大。因此,每份报告都可以成为品牌的广告机会,并形成商业模式。

最后,组织应该在获取更多数据的同时加强自身和大数据技术。

机构需要合法合理地获取更真实有效的样本数据。在移动时代,尤其是在监管机构限制对用户数据的访问之后,这将变得越来越困难。正因为如此,数据机构之间的竞争将变得更加激烈。

去年成功的首次公开募股使奥罗拉大数据成为第三方数据服务提供商的第一份额。它的数据采集能力非常出色。它有三个产品系统:开发者服务、广告服务和数据服务,涵盖极光JPush、极光即时消息、极光短信、极光统计和社会共享。广告服务(Aurora Effect Pass)有助于实现准确的营销。在此基础上,它可以与许多手机制造商合作交换数据,配合应用开发

在大数据时代,我认为只有在数据和技术方面具有核心竞争力的数据组织才能走得更远。

youtube.com

日期归档