1、从数据规模的角度来论证
所谓“大数据”,最基本的要求当然是数据规模大,但是很难给出一个绝对的数字标准来确定其量的大小,而只能用一些模糊的感觉来相对比较。例如,如果一个企业:(1)在年度预算中有了专门的数据存储和分析预算(财务上);(2)有独立的数据处理和分析部门;(3)有比较完整的数据存储,安全和保密政策与管理流程;(4)有高度依赖数据分析结果的商业模式。就可以说这个企业面临着利用大数据的机会或挑战了。
从这一点来看,目前国内的有线电视运营商都不具备。
2、从数据结构与数据关联度的角度来论证
数据量只是反映数据性质的一个指标,也许还不是最重要的指标。一天产生一百万TB数据的公司也许算不上大数据公司,而另一个一天只产生一万TB数据的公司也许反而是个大数据公司——个中奥妙就在于数据结构的复杂性。
有线电视网络中所产生的数据,其结构如何?
目前有线电视用户大多数都是看一下直播的数字电视节目,有一部分则看一下点播节目、上上网,由此产生的数据量虽然不小,但结构简单、重复性高,分析起来很容易,无非就是根据用户背景和使用习惯来分分组、归归类,具备简单的数据挖掘基本功已足够,扯什么“大数据”就有点故弄玄虚。
要是(假设)以后的有线电视网络发展成了一个开放平台,用户在此可以干互联网能够支持的几乎大部分事情,网络行为又可分为个人、群体和组织等层次,而且数据间的关联度又好(用户与用户、用户与用户行为、行为与行为之间都具有确定的关联性),那么这个数据的结构就够复杂,能够支持深度挖掘和复杂建模,就可以算作“大数据”。
为您推荐
日前,IDC与Gartner于上周四早晨双双推出各自最新的云计算及大数据发展趋势预测及统计结果,有些结论堪称大胆,而另一些则可能会淹没在看官们的口水当中。以下就让我们来聊聊这些机构的说法与实际看到的情况。大数据领域“大数据处理将在2012年成为一项‘必备’能力”(来自IDC)。由于目前这项技术还没有获得“必备”这么重要的地位,因此加以争论也无甚意义。不过IDC在为支持其言论而举出的推导过程中确实犯了几个逻辑性错误。根据他们的说法,到2012年将出现2.43泽字节(即千万亿兆字节)的非结构化数据,但这种大数据所带来的问题基本上只会反映在存储机制上。图片、视频以及音乐文件是
如果说2010年是云计算元年,那么2011年无疑是云计算四面开花、发展迅猛的一年。而最直接的动力来自国家相关部门在政策方面的推波助澜。近日,国家发改委扶持云计算首批专项资金6.6亿元已于10月陆续下拨到北京、上海、深圳、杭州、江苏无锡等5个试点城市的15个示范项目。10多家牵头企业陆续收到千万元扶持资金。据了解,首批获得支持的企业包括阿里巴巴、腾讯、百度、华东电脑(600850,股吧)、华胜天成(600410,股吧)、金蝶软件等多家企业。其中,阿里巴巴、百度获得过亿元的资金支持,华东电脑、华胜天成等也获得1500万~2000万元的资金支持。“现在不谈云计算都不好意思了。”一位计算机业内人士在感
未来的十年将是一个“大数据”引领的智慧科技的时代。随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、物联网应用更加丰富。更多的传感设备、移动终端接入到网络,由此产生的数据及增长速度将比历史上的任何时期都要多,都要快。“大数据”时代的脚步悄然而至。请试想一下:当40亿部手机、10亿部电脑,随时随地都在向分布在全球各地的服务器发送数据;当你开着车对着“语音助手”说:“我要在附近找一家最罗曼蒂克的餐厅。”之后,短短一两秒就能得到您满意的答案时。其背后向您提供服务所涉及到的定位、资料检索、存取、数据交换等一系列动作是何等的复杂。而这一系列动作正是由“大数据”所支撑,正如IBM总结的那样:“大量化(Vo
在2011年《巴伦周刊》评出的全球最佳CEO中,乔图斯(JosephM.Tucci)榜上有名。这本在美国投资界影响力极大的杂志,评选与其他商业类媒体榜单侧重点略有不同,CEO领导的公司在资本市场表现是关键衡量因素。的确,这位EMC公司董事会主席兼CEO领导了公司在过去10年的复兴,而公司也成为《华尔街日报》过去20年表现最好股票十佳之一。“他是企业应用领域的斯蒂夫·乔布斯”,美国媒体这样评价他。今年3月,EMC市值超过600亿美元,其收购的公司VMware价值400亿美元(2004年收购价为6.25亿)。两者并表后按市值计算,在IT公司中仅次于苹果、微软、IBM和谷歌。