大数据的四个典范特征
- 时间:2012-12-25
- 泉源:
888集团6008(泉源:中国电子报、电子信息工业网 作者:不详)
大数据(Big Data)是指“无法用现有的软件工具提取、存储、搜索、共享、剖析和处置惩罚的海量的、重大的数据荟萃。”业界通常用4个V(即Volume、Variety、Value、Velocity)来归纳综合大数据的特征。
一是数据体量重大(Volume)。阻止现在,人类生产的所有印刷质料的数据量是200PB(1PB=210TB),而历史上全人类说过的所有的话的数据量约莫是5EB(1EB=210PB)。目今,典范小我私家盘算机硬盘的容量为TB量级,而一些大企业的数据量已经靠近EB量级。
二是数据类型繁多(Variety)。这种类型的多样性也让数据被分为结构化数据和非结构化数据。相关于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处置惩罚能力提出了更高要求。
三是价值密度低(Value)。价值密度的崎岖与数据总量的巨细成反比。以视频为例,一部1小时的视频,在一连不中止的监控中,有用数据可能仅有一二秒。怎样通过强盛的机械算法更迅速地完成数据的价值“提纯”成为现在大数据配景下亟待解决的难题。
四是处置惩罚速率快(Velocity)。这是大数据区分于古板数据挖掘的最显著特征。凭证IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将抵达35.2ZB。在云云海量的数据眼前,处置惩罚数据的效率就是企业的生命。
下一篇:悄悄来临的大数据时代