本文仅为个人观点,适用于我所接触到的大数据平台
看完理解了就点个赞叭~
一、数据仓库 DW
数据仓库:data warehouse,顾名思义是存放数据的地方。是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
那么我所接触的产品是如何建立数据仓库的呢?大致分为STAGE层、ODS层、DWD、DWA、DM。
1.STAGE层
STAGE层是数据仓库数据的登台层,既将各种分散来源的数据加载到数据仓库中。Stage层中装的都是最原始的数据,是需要进行后面处理的数据。
2.ODS层
ODS是英文名 operation data store的缩写。常被作为数据仓库的数据处理的过渡,以降低直接进行数据处理的复杂度。什么意思呢?ODS就是把stage层中的数据进行初步的处理,因为stage层中的数据量大且复杂,ODS按生产系统规范统一数据模型和数据编码,同时对于数据源系统的数据质量进行稽核,保证进入数据仓库数据的完整性。
如何更通俗点理解呢,比如stage层中存放着“A、1、B、C、26、你好”这些分散没有结构的数据。那么到了ODS层中这些数据就变成了
“字母:A、B、C;
数字:1、26;
汉字:你好”
只是打个比方,具体内容不会是这样简单。
3.DWD层
DWD(data warehouse detail data)是数据仓库的细节数据层。为企业各种分析类应用提供细节性数据支持

2209

被折叠的 条评论
为什么被折叠?



