一、方法理论
在上一篇“数据建模-概念篇”中有提到,数据建模有四个阶段:业务建模、领域概念建模、逻辑建模、物理建模。

1、业务建模
业务建模,主要包含以下几个部分:
-
划分整个单位的业务,一般按照业务部门的划分,进行各个部分之间业务工作的界定,理清各业务部门之间的关系。
-
深入了解各个业务部门内的具体业务流程并将其程序化。
-
提出修改和改进业务部门工作流程的方法并程序化。
-
数据建模的范围界定,整个数据仓库项目的目标和阶段划分。
2、领域概念建模
领域建模,主要包含以下几个部分:
-
抽取关键业务概念,并将之抽象化。
-
将业务概念分组,按照业务主线聚合类似的分组概念。
-
细化分组概念,理清分组概念内的业务流程并抽象化。
-
理清分组概念之间的关联,形成完整的领域概念模型。
3、逻辑建模
逻辑建模,主要包含以下几个部分:
-
业务概念实体化,并考虑其具体的属性
-
事件实体化,并考虑其属性内容
-
说明实体化,并考虑其属性内容
-
输出数据逻辑模型
4、物理建模
物理建模,主要包含以下几个部分:
-
针对特定物理化平台,做出相应的技术调整
-
针对模型的性能考虑,对特定平台作出相应的调整
-
针对管理的需要,结合特定的平台,做出相应的调整
-
生成最后的执行脚本,并完善之
-
输出数据物理模型
二、方法实践
本文将以市级公安大数据平台数据模型为例,贯穿建模四个阶段,详细了解数据仓库建模的具体步骤。
1、业务建模阶段:
1.1明确业务域
市局组织架构如下

根据业务部门的划分,划分业务域:
包括:人口、刑事、交管、巡查、治安、刑侦、内保、经侦、监管、法制、文保、消防、出入境等;
由于公安市级大数据平台的服务群体涵盖整个公安全行业,需要打破警种限制,对现有数据进行大整合,规模远比业务数据库系统要大。人们对数据仓库提出了两种设计方法,“自顶向下”和“自底向上”。
“自顶向下”需要对所有部门的业务内容、业务流程及业务部门间的业务关系有一个基本的了解,然后建立一个全局性的数据仓库结构。再在这一基础上,建立部门或个人数据仓库。这一方法的好处是一致性强,易于管理、控制,但缺点是难度大、周期长、费用高。
“自底向上”,顾名思义,先从部门的数据集市出发,完成局部或部门的需求,获得相关经验后再进行全局性建设。这种方法相对更灵活,周期短,费用低,易被接受。
所以本文将采用自底向上的方法,以刑侦业务领域为例,进行业务模型和仓库的建设。
1.2针对具体业务域,梳理业务流程
刑事案件整体业务流程:

公安机关内部刑事案件流程:

从流程图中,提取对象实体,包括:
扭送人、报案人、控告人、举报人、民警、嫌疑人相关联系人—— 人
案件归属地、证物收集地、线上、线下——地
案件基本属性(包括案件描述、归属区域、状态等)、档案(接受案件登记表)、报告——案事件
上级公安机关、有管辖权的公安机关、检察院、法院 —— 组织
物证、书证——物品
当我们分析刑事案件时,一般关注两个问题:案件情况怎么样,……
本文详细介绍了数据建模的四个阶段:业务建模、领域概念建模、逻辑建模和物理建模。在业务建模阶段,通过分析市级公安大数据平台,采用自底向上的方法,以刑侦业务为实例,梳理业务流程,提取关键实体。接着,文章深入到概念建模、逻辑建模和物理建模,逐步构建数据模型。
4万+

被折叠的 条评论
为什么被折叠?



