“大数据”由技术圈走向主流市场

2012-08-13 08:17:00来源:腾讯科技 热度:

北京时间8月12日消息,据国外媒体报道,今年是大数据(Big Data)发展史上一个重要年份,由技术圈进入了主流市场。

大数据是瑞士达沃斯世界经济论坛上一个重要主题,与会者发布了题为《大数据,大影响》(Big Data, Big Impact)。3月份,美国联邦政府公布了一项耗资2亿美元的大数据计算研究计划。

《纽约时报》在文章标题中也采用了“Big Data”这一术语,例如“The Age of Big Data”(大数据的时代)。大数据概念普及的一个确定迹象出现在上个月,斯科特·亚当斯(Scott Adams)创作的《Dilbert》漫画中,一幅漫画的文字内容为,“它无所不在,无所不知”(It comes from everywhere. It knows all),下一幅漫画的内容是,“这就是大数据”(its name is Big Data)。

“大数据”术语成功的原因有两个,其一是术语本身技术性不强,其二是术语包含着“前程远大”的一系列不断进步的技术。

大数据是一个速写符号,意味着将人工智能工具——例如机器学习,用于处理非标准数据库中的数据,其中包括用户上网浏览习惯资料、社交网络用户信息、传感器数据和监视数据。

海量数据和智能软件算法的结合为企业捕捉新商机提供了可能。例如,谷歌和Facebook都是大数据公司。IBM的Watson超级计算机去年在问答节目《Jeopardy》中战胜人类是大数据计算的胜利。从理论上说,大数据能改进商业和医疗等过程中的决策,使决策越来越信赖于数据和分析而非直觉和经验。

康奈尔大学计算机科学家乔恩·克莱因伯格(Jon Kleinberg)称,“大数据这个术语本身很模糊,但在某些方面却又非常具体。大数据是可能改造一切的一种过程的标签。”

一直以来,不断增长的数据都是一项挑战。19世纪末,人口普查员不知道如何统计和分类快速增长的美国人口。1890年的人口普查中出现了一项创新性突破,那就是由赫尔曼·霍勒瑞斯(Herman Hollerith)发明的可以由机器处理的穿孔卡片,这项技术成为IBM的基础。

大数据是一个修辞学意义上的词汇,在数据方面,“大”(big)是一个快速发展的术语。据数名计算机科学家和业内高管称,2008年“大数据”这一术语开始在技术圈内出现。《连线》发表了一篇文章,中肯地阐述了数据泛滥带来的机遇和挑战。《连线》称,大数据是“Petabyte时代”的开端。这是一篇很好的文章,但“Petabyte”技术性过强,很难在主流市场上流行开来。人类将会创建比petabyte量级更多的数据——exabyte、zettabyte和yottabyte。

起初,许多科学家和工程师都嘲笑“大数据”只不过是一个营销术语。2008年末,“大数据”得到部分美国知名计算机科学研究人员的认可,业界组织“计算社区联盟”(Computing Community Consortium)发表了一份有影响力的白皮书《大数据计算:在商务、科学和社会领域创建革命性突破》,作者是一位知名计算机科学家,卡耐基·梅隆大学的兰道尔·布赖恩特(Randal E. Bryant)、加利福尼亚大学伯克利分校兰迪·卡兹(Randy H. Katz)、华盛顿大学的爱德华·拉佐斯加(Edward D. Lazowska)。

他们的认可对“大数据”术语提供了智力支持。IBM技术专家、新兴互联网技术副总裁洛德·史密斯(Rod A. Smith)表示,他喜欢“大数据”这个术语,因为它使人们的思维不仅局限于数据处理的机器,“大数据真正重要的是新用途和新见解,而非数据本身”。

IBM在营销中使用了“大数据”术语,尤其是在与客户沟通后。2008年,史密斯的团队建立了一个网站,解释“大数据”的概念,该网站的内容已经得到极大丰富。2011年,IBM引进了Twitter标签——#IBMbigdata。IBM还建立了大数据邮件列表,今年1月份出版了一本标题为《理解大数据》(Understanding Big Data)的电子书。

创办于1976年的SAS Institute(以下简称“SAS”)开发了遍历数据库、获取有价值信息的软件。SAS所处的业务领域出现了许多术语,其中包括“数据挖掘”(data mining)、“商业智能”(business intelligence)和“数据分析”(data analytics)。

最初,SAS首席营销官吉姆·戴维斯(Jim Davis)认为“大数据”不过是业界的另一个营销用语而已,“最初我对它不感兴趣”,他指出,数十年来,SAS的大企业客户——例如银行和保险公司,一直在“挖掘”海量数据。

但是,大数据技术能利用企业数据库之外的全部Web数据。随着SAS的技术能够利用这些互联网时代的海量数据,其营销也随之发生了变化。去年,SAS开始使用“大数据”、“大数据分析”(Big Data analytics)术语。多年来,SAS一直使用“高性能分析”(high-performance analytics)术语。5月份,SAS任命了一名负责大数据业务的副总裁保罗·肯特(Paul Kent)。戴维斯说,“我们必须‘人云亦云’。”

“大数据”也有负面意义,因为“Big Brother”、“Big Oil”、“Big Government”等词汇带有贬义。大数据技术的支持者称,使用“大数据”术语的好处大于风险。

责任编辑:方珍

为您推荐

云计算及大数据发展趋势预测

日前,IDC与Gartner于上周四早晨双双推出各自最新的云计算及大数据发展趋势预测及统计结果,有些结论堪称大胆,而另一些则可能会淹没在看官们的口水当中。以下就让我们来聊聊这些机构的说法与实际看到的情况。大数据领域“大数据处理将在2012年成为一项‘必备’能力”(来自IDC)。由于目前这项技术还没有获得“必备”这么重要的地位,因此加以争论也无甚意义。不过IDC在为支持其言论而举出的推导过程中确实犯了几个逻辑性错误。根据他们的说法,到2012年将出现2.43泽字节(即千万亿兆字节)的非结构化数据,但这种大数据所带来的问题基本上只会反映在存储机制上。图片、视频以及音乐文件是

云计算产业发展谨防“虚火”

如果说2010年是云计算元年,那么2011年无疑是云计算四面开花、发展迅猛的一年。而最直接的动力来自国家相关部门在政策方面的推波助澜。近日,国家发改委扶持云计算首批专项资金6.6亿元已于10月陆续下拨到北京、上海、深圳、杭州、江苏无锡等5个试点城市的15个示范项目。10多家牵头企业陆续收到千万元扶持资金。据了解,首批获得支持的企业包括阿里巴巴、腾讯、百度、华东电脑(600850,股吧)、华胜天成(600410,股吧)、金蝶软件等多家企业。其中,阿里巴巴、百度获得过亿元的资金支持,华东电脑、华胜天成等也获得1500万~2000万元的资金支持。“现在不谈云计算都不好意思了。”一位计算机业内人士在感

“大数据”时代来临 CIO你准备好了么?

未来的十年将是一个“大数据”引领的智慧科技的时代。随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、物联网应用更加丰富。更多的传感设备、移动终端接入到网络,由此产生的数据及增长速度将比历史上的任何时期都要多,都要快。“大数据”时代的脚步悄然而至。请试想一下:当40亿部手机、10亿部电脑,随时随地都在向分布在全球各地的服务器发送数据;当你开着车对着“语音助手”说:“我要在附近找一家最罗曼蒂克的餐厅。”之后,短短一两秒就能得到您满意的答案时。其背后向您提供服务所涉及到的定位、资料检索、存取、数据交换等一系列动作是何等的复杂。而这一系列动作正是由“大数据”所支撑,正如IBM总结的那样:“大量化(Vo

IT新浪潮:云计算 大数据时代到了

在2011年《巴伦周刊》评出的全球最佳CEO中,乔图斯(JosephM.Tucci)榜上有名。这本在美国投资界影响力极大的杂志,评选与其他商业类媒体榜单侧重点略有不同,CEO领导的公司在资本市场表现是关键衡量因素。的确,这位EMC公司董事会主席兼CEO领导了公司在过去10年的复兴,而公司也成为《华尔街日报》过去20年表现最好股票十佳之一。“他是企业应用领域的斯蒂夫·乔布斯”,美国媒体这样评价他。今年3月,EMC市值超过600亿美元,其收购的公司VMware价值400亿美元(2004年收购价为6.25亿)。两者并表后按市值计算,在IT公司中仅次于苹果、微软、IBM和谷歌。