数据挖掘与数据仓库之间的区别


发布者 勿忘初心  发布时间 1445772302090
关键字 分享 

data

数据挖掘技术是经由自动或半自动的方法探勘及分析大量的资料,以创建有效的模型及规则,而企业通过数据挖掘可以更加了解他们的客户,进而改进他们的行销、业务及客服的运作。 数据挖掘是数据仓库的一种重要运用。基本上,它是用来将你的资料中隐藏的资讯挖掘出来,所以 Data Mining 其实是所谓的 Knowledge Discovery 的一部份,Data Mining 使用了许多统计分析与 Modeling 的方法,到资料中寻找有用的特征(Patterns)以及关连性(Relationships)。 Knowledge Discovery 的过程对 Data Mining 的应用成功与否有重要的影响,只有它才能确保 Data Mining 能获得有意义的结果。

data

数据挖掘和OLAP同为分析工具,其差别在于OLAP提供用户一便利的多维度观点和方法,以有效率的对数据进行复杂的查询动作,其预设查询条件由用户预先设定,而数据挖掘,则能由资讯系统主动发掘资料来源中未曾被查觉的隐藏资讯,和透过用户的认知以产生信息。

data

数据挖掘是计算机科学的一个分支,涉及从大型数据集的提取。这些过程会结合使用统计方法和人工智能。数据挖掘在现代企业把原始数据转换为人工智能的来源。对数据进行操纵,因此能够提供可靠的信息,可以用于决策。这给企业的竞争带来很大的优势,可以依靠他们的数据集提供情报。数据挖掘也被组织在分析实践包括营销、监测科学和检测欺诈行为等各个方面。

data

还有其他常见的术语与数据挖掘相关的可能,比如数据钓鱼、数据窥探等。所有这些指向不同的数据挖掘应用于抽样较小的数据集,用于生产统计和推断。

 

data

数据仓库可以作为数据挖掘和OLAP等分析工具的资料来源,由于存放于数据仓库中的资料,必需经过筛选与转换,因此可以避免分析工具使用错误的资料,而得到不正确的分析结果。

data

另一方面,数据仓库是一个术语,描述一个系统在一个组织中所使用的数据的集合。这些数据收集在数据仓库提供的是事务性系统,如发票,购买记录,甚至贷款记录。各个点的数据记录被创建然后集合在一起,就是数据仓库。该数据仓库给出的数据报告可以帮助用户业务信息,从而做出有效的决策。

data

总结:

数据挖掘就是从大量数据中提取数据的过程。
数据仓库是汇集所有相关数据的一个过程。
数据挖掘和数据仓库都是商业智能工具集合。
数据挖掘是特定的数据收集。
数据仓库是一个工具来节省时间和提高效率,将数据从不同的位置不同区域组织在一起。
数据仓库三层,即分段、集成和访问。









  开源的 OurJS
OurJS开源博客已经迁移到 OnceOA 平台。

  关注我们
扫一扫即可关注我们:
OnceJS

OnceOA