概述
上一篇主要阐述了OneData建模体系的大概流程,以及三个重要板块中的需求调研及规划部分;而本篇主要阐述规范定义模块的内容。在我们知道数仓涵盖的业务流程以及需求点,然后再进行数据域的划分;这时数仓大致的架构与方向基本明确,而接下来要说的则是具体细节。例如:需要建哪些维度表、每张维度表的粒度是什么、公共计算逻辑是哪些等等;后续内容将会展开说明。
规范定义

规范定义指以维度建模作为理论基础,构建总线矩阵,划分和定义数据域、业务过程、维度、度量 /原子指标、修饰类型、修饰词、时间周期、派生指标等;其中的名词术语都会在后续内容进行说明。
构建总线矩阵
当明确每一个数据域中有哪些业务过程后,就可以开始构建总线矩阵;主要目的是用于指导后面事实模型中关联维度定义。举例说明:下表是关于交易域的的部分总线矩阵,以及定义的几个常见的维度(时间、用户、商品、支付方式、退单类型等等维度);其中每行表示业务过程,每列表示维度,√ 表示业务过程与维度存在关联;而一个业务过程对应维度模型中的事务型事实表,一个维度对应维度模型中的维度表。

上述已经提到为什么要构建总线矩阵,那么要怎么一步一步的来构建总线矩阵呢?首先总线矩阵中的核心是围绕事务型事实表构建出来的,及通过事务型事实表的构建方式同样可以构建成总线矩阵。
事务型事实表构建流程:选择业务过程 ->

本文详细介绍了OneData建模中的规范定义阶段,包括构建总线矩阵以指导维度模型的关联定义,以及明确统计指标如原子指标、派生指标和衍生指标。通过事务型事实表的构建流程,阐述了如何逐步形成总线矩阵,并强调了指标体系在减少计算资源消耗和提高沟通效率上的作用。
1万+

被折叠的 条评论
为什么被折叠?



