最近在学习大数据时,遇到数据、元数据和元模型难以区分的问题,这里用更简单的例子说明:
-
数据:就是实际的业务记录,数据库中对应一条条真实的记录。
-
元数据:用于描述数据的信息,通常分为表级元数据和字段级元数据,类似数据字典。
-
元模型:定义描述数据时应包含哪些元数据信息的规则,相当于元数据的统一模板。
这三者的关系:数据是被描述的对象,元数据是对数据的描述,元模型是对元数据结构和规则的定义。
实际数据库举例
数据
就是实际存储的业务记录,数据库中对应一条订单记录:

元数据
元数据通常分为表级元数据和字段级元数据两层,用来描述这张表和字段的属性。
表级元数据
每行对应一张数据表的整体信息。

字段级元数据
每行对应一个字段的属性信息:

元模型
元模型是定义元数据结构和规则的规范,告诉你元数据应该如何编写、必须包含哪些信息。

为什么在大数据场景中重要
-
元数据让系统能找到、理解、分类和管理数据。
-
元模型让不同系统之间的元数据格式一致,便于统一管理、互通和自动化处理。
-
元模型还支持元数据校验和规范执行,提升数据治理效果。
三者层级关系
-
数据:最底层的真实业务内容,是被描述的对象。
-
元数据:对数据的结构化描述,是数据的“说明书”。
-
元模型:对元数据的结构化定义,是说明书的统一模板或规范。
生活化类比
-
数据 = 一本具体的小说正文内容。
-
元数据 = 这本书的封面信息(书名、作者、出版社、页数)。
-
元模型 = 行业规定的“图书封面必须包含书名、作者、ISBN 号”的出版规范。
总结
-
元数据是描述数据的信息。
-
元模型是定义元数据格式和字段规则的规范。
1900

被折叠的 条评论
为什么被折叠?



