数仓和数据库
首先要理解数据库和数据仓库的区别,数据仓库和数据库的区别:数据库存储的是原始数据,没经过任何加工,作为存储来用;而数据仓库是为了满足数据分析需要设计的,对数据进行一些操作为主,比如对源数据进行了ETL过程,数据抽取工作分抽取、清洗、转换、装载;数据仓库的数据量要比数据库大很多。
明白了数仓和数据库的区别我们来看看数仓能解决什么问题:首先业务需求逻辑五花八门,重复建设问题严重,清洗规则混轮,业务逻辑无法复用,造成资源浪费,这就是为什么要有数仓和分层。所以要有统一的数据口径,统一的数据规范来赋能业务,节省大家的时间。其次要保证数据质量。最后能进行数据血缘追踪。 总结:数仓可以赋能业务,节省时间,减少无效沟通,避免资源浪费。
想要了解更多小伙伴们可以私信。
首先要理解数据库和数据仓库的区别,数据仓库和数据库的区别:数据库存储的是原始数据,没经过任何加工,作为存储来用;而数据仓库是为了满足数据分析需要设计的,对数据进行一些操作为主,比如对源数据进行了ETL过程,数据抽取工作分抽取、清洗、转换、装载;数据仓库的数据量要比数据库大很多。
明白了数仓和数据库的区别我们来看看数仓能解决什么问题:首先业务需求逻辑五花八门,重复建设问题严重,清洗规则混轮,业务逻辑无法复用,造成资源浪费,这就是为什么要有数仓和分层。所以要有统一的数据口径,统一的数据规范来赋能业务,节省大家的时间。其次要保证数据质量。最后能进行数据血缘追踪。 总结:数仓可以赋能业务,节省时间,减少无效沟通,避免资源浪费。
想要了解更多小伙伴们可以私信。