说到数据仓库和数据挖掘,大家都不知道它的含义,也不清楚它们是干嘛的,那么,数据仓库与数据挖掘的区别是什么?数据仓库的特点有哪些?接下来就跟着小编来看看这篇文章吧。
数据仓库与数据挖掘
数据仓库的特点有哪些
1、数据仓库是面向主题的;操作型数据库的数据组织面向事务处理任务,而数据仓库中的数据是按照一定的主题域进行组织。主题是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
2、数据仓库是集成的,数据仓库的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出来,进行加工与集成,统一与综合之后才能进入数据仓库;
数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到当前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
数据仓库与数据挖掘
什么是数据仓库
数据仓库是一种分析数据库,用于存储和处理数据,以便对数据进行分析。数据仓库的两个主要功能:存储分析数据和处理分析数据。
首先,如果多个业务数据位于不同的数据源,就无法轻易地将它们组合在一起。
其次,你的数据源系统不适合用来运行大量的数据分析,这样做可能会危及业务运行,因为它会给系统带来很重的负载。
数据仓库与数据挖掘的区别是什么
数据仓库是要集成多种数据源,比如个人财务记录和购物记录,比如企业的原料、生产、销售的异构数据库。数据库一般是单一结构的,没办法集成异构源去做一个统一接口,所以在数据分析需求达到宏观规模后才弄出这么个概念来。所谓面向事务和面向主题就是这个意思。事务是数据记录查询的单一任务,主题是数据分析目标的相关数据范畴。
数据仓库是数据挖掘的对象,进行大规模的数据挖掘前先要建立数据仓库,数据挖掘的研究方向有偏向数据库的。
看了小编介绍了这么多,相信大家对数据仓库与数据挖掘区别有哪些的内容有了一个基本的了解了吧。
------ End ------ |