摘要:
...
大数据特征首先体现为“容量大”,存储单位从过去的GB到TB直至PB、EB、ZB、YB。1PB相当于全中国学术研究图书馆藏书信息内容的50%,1EB相当于至今全世界人类所讲过的话语的20%,1ZB相当于全世界海滩上沙子的数量总和,1YB相当于7000位人类体内的微细胞总和。存储单位:在计算机系统中,数据采用二进制表示,1位二进制数“0”或“1”存储称为1bit(位)。Byte(字节)是数据存储的基础单位,由8bits组成。计算机系统中常用的数据单位从小到大,依次为Byte、KB、MB、GB、TB、PB、EBZB、YB、BB、NB、DB,是按照进率1024(2的10次方)来计算。通常一个英文字母占用1Byte,一个中文汉字占用两个英文字母空间,即2Byte。一部《四库全书》8亿左右汉字,如果按照汉字文本存储,仅1.6G左右大小。通常情况下,手机拍摄一张照片,如果按照标准分辨率衡量大约占用2-4M空间,高清分辨率衡量大约占用5-8M空间;一部2个小时的电影,如果按照标准分辨率衡量大约占用600M,高清分辨率大约占用2G。多样性主要体现在数据来源多、数据类型多和数据之间关联性强三个方面:1.数据来源多。由于数据来源于不同的应用系统或不同的设备决定了大数据来源的多样性。例如企业所面对的传统数据主要是交易数据,而互联网和物联网带来了诸如社交网站、传感器等多种来源的数据。2.数据类型多,并且以非结构化数据为主。例如传统的企业数据都是以表格的形式保存,而大数据中有70%-85%的数据以非结构化或半结构化数据存在,如图片、音频、视频、网络日志、链接信息等。3.数据之间关联性强,频繁交互。例如游客在旅游途中上传的照片和日志,就与游客的位置、行程等信息有很强的关联性。大数据的速度快体现在三个方面:一是数据产生得快,二是数据处理得快,三是数据传播速度快。数据产生得快体现在生产生活中无时无刻不在产生新的数据。数据处理得快体现在大数据可以通过实时处理、并行处理等方式,快速对所产生的数据进行处理。数据传播速度快体现在大数据与以往的档案、广播、报纸等传统数据载体不同,大数据的交换和传播是通过互联网、云计算等方式实现,远比传统媒介信息交换的传播速度快。数据的增长速度和处理速度是大数据高速性的重要体现。并行计算:并行计算又称平行计算,是相对于串行计算来说的。这种计算方式是一种一次可执行多个指令的算法,目的是提高计算速度,通过扩大问题求解规模,解决大型而复杂的计算问题。并行计算可分为时间上的并行和空间上的并行,时间上的并行是指流水线技术,空间上的并行是指用多个处理器并发的执行计算。大数据正在渗透到我们生活的方方面面,在生产生活、经营活动、流通、生物医学、城市管理、安全防护、金融、营销等各个领域大放异彩。随着大数据的应用越来越广泛,我们在日常生活中,会越来越受益于大数据带来的高应用价值。可以通过降低搜寻成本、复制成本交通运输成本等降低经济活动成本,从宏观经济运行到微观企业管理方面利用大数据大大提升经济运行效率。通过数字技术与传统产业的深度融合,大数据能激发企业创新能力,引导产业全面变革,实现产业结构转型升级。另外可以促进构建大数据驱动的政府服务平台,不断提升政府治理效能。现实世界所产生的数据中,有价值的数据所占比例很小,价值密度低。大数据最大的价值在于通过从大量不相关的各种类型数据中,挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习、人工智能或数据挖掘等方法进行深度分析,发现新规律和新知识。
来 源:市发改局
投稿邮箱:[email protected]
觉得文章有用就打赏一下文章作者
支付宝扫一扫打赏
微信扫一扫打赏