产业新闻

大数据 仍是大过错?

来源:http://moto-loisirs-77.com 责任编辑:ag88环亚国际 2018-09-03 14:36

  大数据 仍是大过错?

  大数据是关于大规划现象的一种迷糊的表达。这一术语现在现已被企业家、科学家、政府和媒体炒得过热。

  五年前,谷歌的一个研讨小组在全球尖端的科学杂志《天然》上宣告了一个令人瞩目的效果。该小组能够追寻美国境内流感的传达趋势,而这一成果不依赖于任何医疗查看。他们的追寻速度乃至比疾控中心(CDC)要快的多。谷歌的追寻成果只要一天的延时,而CDC则需求汇总很多医生的确诊成果才干得到一张传达趋势图,延时超越一周。谷歌能算的这么快,是由于他们发现当人们呈现流感症状的时分,往往会跑到网络上查找一些相关的内容。

  谷歌流感趋势不只方便、精确、本钱低价,并且没有运用什么理论。谷歌的工程师们不必费力的去假定哪些查找关键字(比方流感症状或许我身边的药店)跟伤风感染有相关性。他们只需求拿出来自己网站上5000万个最抢手的查找字,然后让算法来做挑选就行了。

  谷歌流感趋势的成功,很快就成为了商业、技能和科学范畴中最新趋势的标志。振奋的媒体记者们不断的在问,谷歌给咱们带来了什么新的科技?

  在这许多流行语中,大数据是一个迷糊的词汇,常常呈现于各种营销人员的口中。一些人用这个词来着重现有数据量的惊人规划——大型粒子对撞机每年会发生15PB的数据,相当于你最喜欢的一首歌曲重复演奏15000年的文件巨细。

  然而在大数据里,大多数公司感兴趣的是所谓的实际数据,比如网页查找记载、信用卡消费记载和移动电话与邻近基站的通讯记载等等。谷歌流感趋势就是根据这样的实际数据,这也就是本文所评论的一类数据。这类数据集乃至比对撞机的数据规划还要大(例如facebook),更重要的是尽管这类数据的规划很大,但却相对简单收集。它们往往是由于不同的用处被收集起来并凌乱的堆积在一起,并且能够实时的更新。咱们的通讯、文娱以及商务活动都现已转移到互联网上,互联网也现已进入咱们的手机、轿车乃至是眼镜。因而咱们的整个日子都能够被记载和数字化,这些在十年前都是无法幻想的。

  大数据的鼓吹者们提出了四个令人振奋的定论,每一个都能从谷歌流感趋势的成功中印证:

  1) 数据剖析能够生成惊人精确的成果;

  2) 由于每一个数据点都能够被捕捉到, 所以能够完全筛选曩昔那种抽样计算的办法;

  3) 不必再寻觅现象背面的原因,咱们只需求知道两者之间有计算相关性就行了;

  4) 不再需求科学的或许计算的模型,理论被终结了。《连线》杂志2008年的一篇文章里豪情万丈的写到:数据现已大到能够自己说出定论了。