主持人:下面我们有请来自时趣首席科学家王绪刚王博士为我们演讲的是以目标方法、案例解读,分析大数据究竟是一个什么鬼。
王绪刚:大家下午好,非常荣幸能受到CMRA的邀请,这是一个很不错的时间点,大家会度过一个很困的时段,下面的话题相对来说会枯燥一些,我演讲的题目是大数据是个什么鬼?我既不是大数据的专家,我只是一个大数据的实践者,我在实践的过程当中经常被我的客户、被我的同事、我组里的小朋友都会问的一个问题,大数据究竟是个什么鬼?
在我的演讲之前,我先简单地介绍一下我这个公司,做一个小的广告,可能大家还不太了解时趣,时趣实际上是一家我们现在是移动营销的整体解决方案的一大提供商,它在2011年成立,还是非常年轻,我们做的业务也是相对来说比较多元化,这是我们一些重要的客户,我们主要的提供从底层的数据管理,以及面向CM的商业策略,以及执行和支撑性软件,整体的解决方案。
这是我个人的一个简单的介绍,从这边的图上大家可以清晰地看出来我的主要的专业就是在做营销和数据方面的整合。实际上我一直在从事的是数据技术方面的工作,非常偶然的一个机会加入了时趣,跟一帮在利用非理性思维的人一起工作。
大数据这个在2011年开始火起来以后,我们一直在做这方面的研发工作,我们的客户对于大数据时代的挑战,看到很多精彩的案例,或者别人在讲大数据非常生动地描述未来的时候经常会问我一个问题,为什么我们要去做大数据?做了大数据以后会有什么样重要的应用场景,以及如何去完成?
今天我分享的题目包括这么几个方面:首先,数据是如何帮助商业的?因为我们每一个企业不管是营销的部门也好,还是其他的CM部门也好,总是要做生意,数据如何帮助商业?
我们首先来看在IT的时代,或者传统的品牌营销的时代有这么一个模型,以品牌为中心,我们不断塑造品牌的形象,顺便向受众不断地在去传播,这个时代会有一些IT技术的支持,比如说我们的点、网站,或者在线的一些广告,这些IT经过这么长时间的运营,就会有大量的消费者数据的沉淀,就进入了另外一个时代,或者是进入了另外一个模型的时期,就是以消费者为中心的模型,我们通过沉淀的消费者的数据,不管是内部还是外部的,我们就可以利用数据来做口碑的分期的决策,产品兴趣的洞察,以及在线个性化的体验,这是从IT到DT发生的重要的模型式的变革。
由于IT技术的发展,在互联网上面一个个体的用户,我们强调的是个体用户,一个手机号也可以识别,你的行为可以去追踪,我们的效果可以衡量,你的行为可以去预测。因此,我们的受众就不是一个群体,是一群海量的个体,所谓海量的个体就会意味着另外一种不同的数据结构。在上大学的时候我是学计算机出身,当时计算机课的老师给我讲过了一个话,就是高等数学不是很重要,你只要学好计算机就可以了,计算机当中很多编码,非1即0,一大堆的逻辑,实际上我们发现当我们有海量数据的时候,我们就不仅仅是通过一些简单的采样去描述世界了,我们可以通过非常海量的个体去描述一个真实的商业曲线,也就是一个对人描述多维度的抽象,这就构成了整个商业的逻辑描述。底下的阴影是商业上面的利润。
有了这种海量个体的描述,我们就可以在做相应的IT支持的时候,不再采用一种经验化的,或者是复杂的人工逻辑的判断。比如说我们在做在线推荐,这是一个非常重要的电商当中,或者是媒体的应用的场景,产品经理会写很多很多复杂的判断,今天访问者是什么类型的?我可以给他推荐什么样的类型的?等等这样很多复杂的逻辑,直到把这个产品经理和所有的代码狗全写晕。有了这样的数据,我们就可以去做一些线性的,或者非线性的公式,直接通过这样的公式就可以得出这样一个复杂的逻辑结论。而你只需要调整这些参数就可以得到相应的自动化的结果。因此,有了数据以后,我们的整个决策变得是智能化和更加地程序化,这是很多老师讲程序化购买,程序化购买支撑的基础就是DT的这些技术。
另外一个从决策支持来看,这是一个以前在做数据分析的很常见的流程,我知道我们很多的公司内部都有数据分析师,往往数据分析师就会被赋予多重的角色,他会找相应的数据库的管理员去跑数,突然间领导说我想增加一个纬度,再跑一遍,我再去重新跑来来回回折腾,很多部门都会养很多做数据报表的分析师,他们被叫做表哥、表姐,一个部门有十来个数据分析师,有了他们你数据的抽象模型可以实时地去完成,这是我们可以做到实时的交互式的分析,你的定义的纬度不是事先可知的,可以通过交互的方式去实现。
从IT技术到了DT,它是一个重要的商业效率的变革,所以它应该是在一定的精准度,接近我们人的精准的判断的情况下,运营效率大幅度地提升,因此有了这样一种技术,才使得我们很多所谓刚才乐视的老师讲的羊毛出在狗身上,让猪来买单的可能,你数据的买卖已经超过你自己的交易成本的时候,你就可以去做到很多免费的硬件、软件。
第二个分享的题目是我们从一些案例来看,数据的价值实现会有哪些场景。
首先把整个数据价值实现分成几个部分,我们把整个数据可以看成三种分析,首先是一种事实性分析,就讲的是说什么事情发生了?发生了什么?比如说我们在做会员运营的时候,我们来看你的整个会员的增长、流失、活跃,这是事实性的分析,包括异常的点,包括重大的流失的检测的点,重要的趋向性的信息,比如说我的关键的渠道,刚才苏旋同学分享的重要的意见领袖,这都属于事实性分析,也就是说已经发生的事情,我来通过数据告诉你。这也是一种事实性的分析,比如说粉丝的增长是什么样的,互动是什么样子的,关键的互动等等。
第二类分析我们把它叫做预测性分析,是运用群体的事件形成一个模型,来看相似群体可能在下一步执行的动作是什么?比如说我们去看一些意见领袖的发现,我们找到一个领域,比如说在美妆、美容领域谁是这个意见领袖,这是一个非常重要的数学公式,在这个领域谁的意见传播可能到达的受众是最多的,我们就可以通过一个算法找到一个意见领袖,这是预测性分析的模型。比如说我们在做产品设计的时候,这是我们帮助国内的一个制造企业来去发现你的用户的兴趣可能分布在哪些点上,你的产品的哪些特性上面。它随着时间的变化会出现什么样的变化?以及你一款新的手机,比如说一款千元机上市的时候,哪些点会是可能的购买点,要做一些预测性的分析,因为它还没有发生。包括比如说潜在客户的挖掘,这些人有可能是你的购买者,或者有可能你的广告的点击者并没有去发生,我们可以通过相似的标签做相似的用户,做特征放大,从而获得最好的IOI。
第三类分析相对来说会进入到一个更高级的阶段,我们叫做行动性分析。就是说我们知道了一个人他的下一步动作的时候,我们给他产生一个什么样的动作?比如说我们在整个网站的购买和访问的过程当中,我们是不是要给他做一个推荐、做一个向上的交叉,或者是交叉性的销售,我们是不是发现是一个即将流失的用户,我该给他发一个多大金额的红包才能留住他,这些都是一些行动性分析的模型。比如说我们在给一个卖隐形眼镜的客户,我们给他推荐一款新的产品,从而提升他的客单价,这时候整个的动作都不需要有人工的角色,而是自动地整个在网站上去执行。包括我们在传播的过程当中,根据人的的影响力实时地产生一个他个人的积分。我们在这里面梳理了一个数据应用组合的方式,在不同的运营的阶段,以及在不同的分析的方式上面,我们可以有不同的组合式的数据应用,在品牌的推广方面,我们可以做一些事实性的分析,意见领袖和潜在客户的挖掘就属于预测性的分析,而这种行动性分析,比如说讲到RTB整个大动作都没有人的参与,这就是行动分析,比如说产品的设计、口碑的聆听,到需求点的预测,最后有可能会进入到一个个性化的设计的阶段等等,越往下面整个会越进入到自动化的阶段。
接下来客户可能还会再问你一个问题,我要做大数据了,我该如何衡量我的IOI?我们有几个重要的公式,就是从一个客户的价值来看,我的投入是不是能够达到多、快、好的程度,是不是搜集足够多和足够全的用户数据,我使用数据的频率和接触点是不是足够多?我的用户的画像和内容的匹配程度是不是够好?最后,在基于二次传播这个阶段是不是能够做到够省?
最后一点是数据的价值该如何落地呢?有几点可以跟大家分享,首先要让一线的营销人员自己能够自主式的玩起数据来,让他理解到数据的价值,才能发挥价值的最大化。包括我要全渠道地去整合这种数据,这是我们一个客户在全网上面用户的数据量,大概一年在10个T左右。这是对用户画像的一些重要的纬度,我们会有6个重要的用户画像的纬度,因为时间的关系,我给大家简单地过一下,这是用户画像标签的最重要的应用场景。
最后我想强调的是数据的探索正在进行,会进入一个炒作期,慢慢会进入一个成熟和落地期,我们希望每一个客户跟我们探索大数据的应用,并实现它的价值。
谢谢大家!
主持人:时趣互动是近年来做得比较好的公司,我今天才知道做得这么好,他们的后台是有这么庞大的技术来进行支撑的。现在我们面临的是数据的分享,很多时候我们有两类数据,一方面是作为监测数据的大数据,还有作为调研样本的小数据。