职业经理人周刊
整合 执行 创新   精彩人生从合作开始
金令牌猎头
企业  职位  经理人  专访  点评
年薪(万) 不限 15 25-35 50 100 200 500
职业经理人周刊 >> 商业评论

你真的了解大数据吗?

《职业经理人周刊》

Q =《商学院》

A = 段仰圣

IBM 全球企业咨询服务部业务分析与优化服务大中华区总经理

Q:所谓的“大数据分析”概念,是否新瓶装旧

酒?

A :数据分析的概念的确早于“大数据”,后者是在新的数据环境下,对“分析”这一概念的重新梳理和定义。

以美国网球公开赛为例,数据分析这项工作的起点可以追溯到几十年前。IBM从上世纪60年代就开始赞助美网,在90年代成为这项赛事的官方IT技术提供商,长时间的接触使得它积累了很多历史数据,完成了“收集”的动作,为后来的分析提供基础。

在“数据仓库”的时代,我们只能将收集来的数据从“源头”归拢到“仓库”里,进行分类、分析并得出结果,而在现今“大数据”的语境下,数据收集的手段越来越丰富,少量的死板的数据变成了大量的“数据流”,同时计算能力的提升使我们能够对“数据流”进行分析,找出有问题或者有意义的部分深入研究。因此,我们可以在比赛时看到几乎同步的分析结果,而不像过去那样只有在赛后才能听见“马后炮”。

换句话说,在网球比赛中,大数据分析带来的是实时感受的具象化,帮助粉丝印证自己的看法以及判断下一步的走势,与那种结束之后再来分析归纳赛场表现的统计逻辑完全不同,这是IBM多年来的数据积累和收集、分析技术提升的成果,不是一两次比赛就能实现。

数据不是固化的概念,而是一场旅程,从无到有,由少到多。虽然数据分析早已有之,但是,与其说“大数据”概念是在新瓶装旧酒,不如说它是技术手段持续发酵并且最终质变的必然结局。2013年,IBM将与中国网球公开赛合作,因此今年的比赛就成为中网大数据分析的起始点,在四大满贯赛事的分析工具和方法的基础之上,中网也将开始自己的数据积累,随着相关的数据越来越多,分析的结果也会越来越细致而精密。

Q:在网球比赛中,强大的数据分析技术是否会减少亲临现场的意义?

A:这问题很有趣。我们也在考虑数据分析如何改变观赛的习惯。想想看,如果坐在观众席上的人还在不停地低头刷手机,似乎也很奇怪。

但是,对于那些没有身在现场的观众来说,可视化的数据分析结果的确能够带来最真切的现场感。在没有这些技术支持之前,大家只能看到眼前正在进行的比赛,根据模糊的印象作出主观的判断,即使资深的解说员也是如此,即使他告诉你,“这是今天速度最快的发球”,你当然无法反驳,但实际上也是缺少科学支撑的结论,和菜鸟观众的臆测并无本质上的不同,只不过前者更有经验而已。

而准确的数据分析则使一切都无所遁形。即使你只是守在电视机前,刷着官网上面统计分析的页面,所获得信息可能比现场屏息静气的观众还要多——毕竟人家买票进场,是要看心仪的球员而不是总盯着手机屏幕。因此,对于技术控们来说,在家看电视或者视频直播也不会有所损失,甚至有可能得到更直观、更准确的信息来判断比赛的走势。

对于IBM来说,在比赛的同时不间断地收集数据流,并不会影响到比赛的进程和结果。但是,基于多年的积累而总结出来的比赛关键点(keys to match)以及其它的一些技术方面的历史信息,如球员发球的习惯、赢球的时机,都从模糊的印象变为可对比、可量化的数据,从而帮助粉丝们在赛前就预测比赛的走势。

从这个角度来看, “ 预测”是数据分析的价值所在,它可以使菜鸟也成为超级智能的粉丝,比赛还是那场比赛,但是我们看比赛的方式已经不同了。

如果说,互联网使得人与人之间的联系变得扁平化,数据分析也在改变着知识和经验的传递系统,过去我们认为经验和判断是只可意会、 不可言传的能力,但是同样脱胎于信息积累的数据分析技术使得经验这件事也从过去“不可说”的状态转化为具体的分析结果,由此大大缩小了菜鸟与资深人士之间的差距。

继社交关系扁平化之外,智慧上的差距,至少在网球比赛中,也被渐渐抹平了。因此,即使专家范儿的比赛解说员还没有完全失掉意义,至少对于场外的观众来说,他们拥有了一项精确的工具来帮助理解场上正在发生的事情。当然,这一切都无法替代现场观赛所体验到的气氛和张力,比赛中感性的那一部分,至少在眼下,还无法通过冰冷的数据来表达。

Q:大数据分析与互联网的发展是怎样的关系?

A:我认为,互联网只是大数据产生的条件之一,但不是直接的因果关系。很多时候,这两个概念总被扯在一起。

互联网的发展使得数据量开始爆炸,其中大部分都是非结构化的数据,如文本、图像和影音等等,在同一时间内有很多数据出现,如何从这些数据中分析出有意义的结果,就是大数据技术所面临的挑战。但是,对于企业来说,互联网究竟是不是数据的主要来源,还是要看具体的环境和需要。

例如,网球比赛的数据就与互联网没有关系。而在制造业的工厂内,各处安装的传感器在同时产生很多数据,这也是大数据。IBM曾经为一家来自制造业的客户设计设备维护的预测方案,通过对设备数据的分析,预测哪些设备有可能出问题,提前进行预防工作,而不是像过去那样对每个设备都进行固定的巡检,发现故障了才去处理,这就是一例典型的应用。

因此, 对于很多企业来说,数据并不是有了互联网才产生,而是来自日常的运营和管理。来自互联网的数据价值更多地体现于营销层面,可以作出360度的客户视图,洞察人们的需求,这对于电商等行业来讲的确意义重大,但是,在运营模式更为复杂的其它行业,如前面提到的例子,数据来源多样化,互联网仅仅是其中之一而已。

全面的大数据分析可以帮助管理者进行战略上的判断,如果只关注营销和客户服务领域的互联网数据,这个目标恐怕就难以实现。

利用分析技术防止运动伤害

受伤的运动员并不是唯一遭受痛苦的人。关键球员的缺席会给球队协作、战绩、球迷关注度带来消极的影响。为了在伤害发生之前有效预防,莱斯特老虎橄榄球队采用了IBM 的预测分析技术。

识别风险——对抗激烈的比赛

在护具无损的情况下,球员每场比赛要做出20-40 个擒抱动作,每个赛季四分之一的球员会受伤。

运用分析技术避免伤害——数据搜集

通过安装在球员身上的传感器监测并衡量运动强度、冲撞、疲劳水平。同时分析影响竞技水平的关键心理指标。

球员伤停,机会流失

受伤球员只能坐板凳,球队竞争力打折扣,观赏性降低。

预测分析

使用IBM 预测分析技术,老虎队可以迅速汇总分析45 名球员的数据,预测伤害风险,据此调整球员的训练规划。

获得竞争优势——防止运动伤害,发掘潜力球员

为球员量身定做训练计划之外,老虎队还利用分析技术改善球员发掘流程,保证球队可以拥有最具潜力的年轻球员。健康、有天赋的球员带来更好的战绩,观赏性上升。

定义大数据

术语“大数据”被普遍使用,但仍是一个会引起混乱的概念。大数据已被用于传达各种概念,包括海量数据、社交媒体分析、下一代的数据管理功能、实时数据等。

无论所用的名称是什么,组织已经开始了解和探索如何用全新的方式处理和分析大量信息。这样人数越来越多的一小群先驱实现了突破性的业务成果。在世界各地的各行各业中,高管认识到需要更多地了解如何充分利用大数据。尽管似乎一直受到媒体的关注,但可能很难找到关于组织真正在做什么的深入信息。

为了更好地了解组织如何看待大数据,以及目前用它来促进其业务的程度。IBM商业价值研究院与牛津大学赛德商学院合作进行了一项大数据工作研究,调查了95个国家和地区的1144位业务与IT专业人员,并采访了几十位学者、主题事务专家和商业高管。

关于大数据的大部分混乱都始于定义本身。为了了解研究受访者对该术语的定义,研究者要求每位受访者最多选择两个大数据特征,其中并没有发现某一个特征明显占据主导地位,相反,在对大数据的最佳描述应该是“如今更大量的数据、新型的数据和分析”,还是“更多实时信息分析的新兴要求”这个问题上,受访者的观点比较分散(见下图)。

这些结果与一种描述大数据三个维度特征的有效方法一致—“三个V”: 数量(volume)、多样性(variety)和速度(velocity)。虽然它们已涵盖大数据本身的主要属性,但我们认为组织需要考虑第四个重要的维度: 真实性(veracity)。将真实性作为第四个大数据属性,强调了对某些类型的数据所固有的不确定性进行处理和管理的重要性。这四个维度的融合有助于我们定义和区分大数据:

数量: 数据的数量。也许是与大数据最相关的特征,数量是指为了提高整个企业的决策,组织试图利用的数据的庞大数量。数据量在以前所未有的速度持续增加。但是,真正构成“大”

量的内容因行业、甚至地域的不同而不同,并且小于经常被提到的PB级和ZB级数据量。只有刚刚过半数的受访者将1 TB和1 PB的数据集视为大数据,而另外30%的受访者根本不知道对于他们的组织来说多大才算“大”。不过大家都同意,任何在今天被认为是“大量”的东西,在明天会变得更大。

多样性: 不同类型的数据和数据源。多样性是指管理多种数据类型(包括结构化、半结构化和非结构化数据)的复杂性。组织需要对来自一系列复杂的传统和非传统信息源的数据进行整合与分析,这些信息源来自企业内部和外部。

随着传感器、智能设备和社交协作技术的爆炸性增长,所产生的数据有无数种形式,包括文本、Web数据、tweet、传感器数据、音频、视频、点击流、日志文件等。

速度: 活动的数据。人们创建、处理和分析数据的速度在不断加快。对更高的速度有所贡献的是数据创建的实时性,以及将流数据融入到业务流程和决策的需要。速度影响延迟—创建或捕获数据与它可供访问之间的延迟时间。

如今,数据不断生成的速度让传统系统无法捕获、存储和分析这些数据。对于时间敏感的流程(如实时欺诈检测和多渠道“即时”营销),必须对特定类型的数据进行实时分析,让其实现商业价值。

真实性: 数据不确定性。真实性是指与特定类型的数据相关的可靠性级别。追求高质量数据是一个重要的大数据要求和挑战,但即使是最好的数据清洗方法也无法去除某些数据固有的不可预测性,如天气、经济或客户的实际未来购买决策。承认并制定计划来应对不确定性的需求是大数据的一个维度,这在高管力求更好地了解他们周围不确定性的世界时已引入。

最终,大数据是这些特征的组合,它为组织创造了一个在当今数字化市场中获得竞争优势的机会。它让公司能够革新他们与客户交互,并为其客户提供服务的方式,并让组织(甚至是整个行业)能够对自身进行改造。并不是每个组织对参与和构建其大数据功能都会采取同样的方法。但每一个行业中都存在利用新的大数据技术和分析来改善决策和绩效的机会。

来源:《商学院》
金令牌猎头
企业找猎头  职业经理人找猎头
北京猎头职位
上海猎头职位
广州猎头职位
联系我们 | 金令牌猎头 | 法律声明 | 猎头服务 | 职业经理人俱乐部 | 设为主页 | 收藏本站
职业经理人周刊  Copyright® 版权所有   微信:AirPnP   TEL:010-85885475
京ICP备05025905号-2京公网安备110105009133号