导读:大数据的出现带来了许多新的术语,但这些术语往往比较难以理解。因此,一亦在国外的一个网站上扒来了常用的大数据术语表,抛砖引玉,供大家深入了解。其中部分定义参考了相应的博客文章。当然,这份术语表并没有%包含所有的术语。
建议阅读时间8分钟。
上期回顾:十分钟读完《大数据时代》
A
聚合(Aggregation)–搜索、合并、显示数据的过程
算法(Algorithms)–可以完成某种数据分析的数学公式
分析法(Analytics)–用于发现数据的内在涵义
异常检测(Anomalydetection)–在数据集中搜索与预期模式或行为不匹配的数据项。除了“Anomalies”,用来表示异常的词有以下几种:outliers,exceptions,surprises,contaminants.他们通常可提供关键的可执行信息
匿名化(Anonymization)–使数据匿名,即移除所有与个人隐私相关的数据
应用(Application)–实现某种特定功能的计算机软件
人工智能(ArtificialIntelligence)–研发智能机器和智能软件,这些智能设备能够感知周遭的环境,并根据要求作出相应的反应,甚至能自我学习
B
行为分析法(BehaviouralAnalytics)–这种分析法是根据用户的行为如“怎么做”,“为什么这么做”,以及“做了什么”来得出结论,而不是仅仅针对人物和时间的一门分析学科,它着眼于数据中的人性化模式
大数据科学家(BigDataScientist)–能够设计大数据算法使得大数据变得有用的人
大数据创业公司(Bigdatastartup)–指研发最新大数据技术的新兴公司
生物测定术(Biometrics)–根据个人的特征进行身份识别
B字节(BB:Brontobytes)–约等于0YB(Yottabytes),相当于未来数字化宇宙的大小。1B字节包含了27个0!
商业智能(BusinessIntelligence)–是一系列理论、方法学和过程,使得数据更容易被理解
C
分类分析(Classificationanalysis)–从数据中获得重要的相关性信息的系统化过程;这类数据也被称为元数据(metadata),是描述数据的数据
云计算(Cloud