数据建模-方法篇

本文详细介绍了数据建模的四个阶段:业务建模、领域概念建模、逻辑建模和物理建模。在业务建模阶段,通过分析市级公安大数据平台,采用自底向上的方法,以刑侦业务为实例,梳理业务流程,提取关键实体。接着,文章深入到概念建模、逻辑建模和物理建模,逐步构建数据模型。

一、方法理论 

在上一篇“数据建模-概念篇”中有提到,数据建模有四个阶段:业务建模、领域概念建模、逻辑建模、物理建模

 

1、业务建模

业务建模,主要包含以下几个部分:

  • 划分整个单位的业务,一般按照业务部门的划分,进行各个部分之间业务工作的界定,理清各业务部门之间的关系。

  • 深入了解各个业务部门内的具体业务流程并将其程序化。

  • 提出修改和改进业务部门工作流程的方法并程序化。

  • 数据建模的范围界定,整个数据仓库项目的目标和阶段划分。

 

2、领域概念建模

领域建模,主要包含以下几个部分:

  • 抽取关键业务概念,并将之抽象化。

  • 将业务概念分组,按照业务主线聚合类似的分组概念。

  • 细化分组概念,理清分组概念内的业务流程并抽象化。

  • 理清分组概念之间的关联,形成完整的领域概念模型。

 

3、逻辑建模

逻辑建模,主要包含以下几个部分:

  • 业务概念实体化,并考虑其具体的属性

  • 事件实体化,并考虑其属性内容

  • 说明实体化,并考虑其属性内容

  • 输出数据逻辑模型

 

4、物理建模

物理建模,主要包含以下几个部分:

  • 针对特定物理化平台,做出相应的技术调整

  • 针对模型的性能考虑,对特定平台作出相应的调整

  • 针对管理的需要,结合特定的平台,做出相应的调整

  • 生成最后的执行脚本,并完善之

  • 输出数据物理模型

 

二、方法实践

本文将以市级公安大数据平台数据模型为例,贯穿建模四个阶段,详细了解数据仓库建模的具体步骤。

1、业务建模阶段:

1.1明确业务域

市局组织架构如下

根据业务部门的划分,划分业务域:

包括:人口、刑事、交管、巡查、治安、刑侦、内保、经侦、监管、法制、文保、消防、出入境等;

由于公安市级大数据平台的服务群体涵盖整个公安全行业,需要打破警种限制,对现有数据进行大整合,规模远比业务数据库系统要大。人们对数据仓库提出了两种设计方法,“自顶向下”和“自底向上”。

“自顶向下”需要对所有部门的业务内容、业务流程及业务部门间的业务关系有一个基本的了解,然后建立一个全局性的数据仓库结构。再在这一基础上,建立部门或个人数据仓库。这一方法的好处是一致性强,易于管理、控制,但缺点是难度大、周期长、费用高。

“自底向上”,顾名思义,先从部门的数据集市出发,完成局部或部门的需求,获得相关经验后再进行全局性建设。这种方法相对更灵活,周期短,费用低,易被接受。

所以本文将采用自底向上的方法,以刑侦业务领域为例,进行业务模型和仓库的建设。

1.2针对具体业务域,梳理业务流程

刑事案件整体业务流程:

公安机关内部刑事案件流程:

从流程图中,提取对象实体,包括:

扭送人、报案人、控告人、举报人、民警、嫌疑人相关联系人—— 人

案件归属地、证物收集地、线上、线下——地

案件基本属性(包括案件描述、归属区域、状态等)、档案(接受案件登记表)、报告——案事件

上级公安机关、有管辖权的公安机关、检察院、法院 —— 组织

物证、书证——物品

当我们分析刑事案件时,一般关注两个问题:案件情况怎么样,……

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值