大数据的 3V、4V、7V,到底是什么意思?
大数据,顾名思义,指的是大量的数据。
更专业来讲,大数据是一种规模大到在获取、存储、管理、分析等方面远超传统数据软件工具能力范围的数据集合。
我们常说:“量变引起质变”。而大数据就是这种情况。
随着数据体量的增加,相关技术、理念、思维等也发生质的变化,从而形成了一个新的领域,即大数据领域。
大数据通过采集、分析和处理海量数据,寻找特征和趋势,提炼更多高价值信息,用于改善业务流程或辅助决策。
在大数据领域,我们常听到诸如3V、4V、7V等的说法。这些V到底代表什么呢?
本文将简要介绍一下。
█ 3V、4V、7V 的由来
2001年,美国麦塔集团分析师道格・兰尼(Doug Laney)在进行大数据理论研究时发现大数据具备三个特征,即:Volume(体量大)、Variety(多样化)、Velocity(速度快)。
后来,“3V”逐渐成为业界描述大数据特征的标准。
在此基础上,业界专家陆续提出了“4V”、“5V”乃至“7V”,包括:Veracity(真实性)、Value(价值密度)、Variability(变异性)、Visualization(可视性)等。
所有这些V,为大数据特征提供了新的定义。
以下将详细解释这些“V”各自代表的意义。
█ No.1 :Volume(体量大)
大数据量有多大?
传统PC和手机处理的数据通常是GB/TB级别。例如,目前常见的硬盘容量为1TB / 2TB / 4TB。
TB、GB、MB、KB的关系大家应该都不陌生:
1 KB = 1024 B (KB - kilobyte)
1 MB = 1024 KB(MB - megabyte)
1 GB = 1024 MB(GB - gigabyte)
1 TB = 1024 GB(TB - terabyte)
大数据属于PB/EB级别。
1 PB = 1024 TB(PB - petabyte)
1 EB = 1024 PB(EB - exabyte)
以几个字母描述可能不太直观。下面举个例子。
1TB只需一个硬盘存储,大约相当于20万张照片或20万首MP3音乐,或者是20万部电子书。
1PB需要约2个机柜的存储设备,相当于约2亿张照片或2亿首MP3音乐。若不停播放音乐,可听约两千年。
1EB需要约2000个机柜的存储设备。这些机柜并排放长约1.2公里。若置于机房内,需要21个标准篮球场大小的机房才能容纳。
互联网巨头如阿里、百度、腾讯的数据量据说已接近EB级。
EB尚不是最大级别。据IDC数据,2020年全球创建、捕获、复制和消耗的数据总量约为64ZB。到2025年,全球数据总量可能达到惊人的163ZB。若建造一个用来存储这些数据的机房,其面积将超过196个鸟巢体育场。
人类社会的数据量不仅巨大,增长速度也很快——每年增长50%。即每两年数据量翻倍。
为何数据增长如此迅速?
...1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。