数据管理,数据治理,数据中心,数据中台,数据湖都是什么意思,有什么关系呢?

YGboom
YGboom
订阅者
2840
文章
0
粉丝
生活百科评论167字数 652阅读2分10秒阅读模式

数据治理和数据管理

简单来说治理就是管理的管理。文章源自玩技e族-https://www.playezu.com/134025.html

管理你得遵循一定得标准规范体系,一定得流程,一定得组织角色分工,而这些内容就必须先通过数据治理定义清楚。管理只是根据数据治理规范体系去执行管理和监督得职责。文章源自玩技e族-https://www.playezu.com/134025.html

既管理执行得依据是治理规范体系。文章源自玩技e族-https://www.playezu.com/134025.html

如下图:文章源自玩技e族-https://www.playezu.com/134025.html

数据管理,数据治理,数据中心,数据中台,数据湖都是什么意思,有什么关系呢?插图文章源自玩技e族-https://www.playezu.com/134025.html

数据中台和数据湖文章源自玩技e族-https://www.playezu.com/134025.html

这个要解释清楚不太容易,因此我尽量做简化。文章源自玩技e族-https://www.playezu.com/134025.html

数据湖一般是公有云服务商提出得一个概念,即企业得结构化,非结构化数据都可以全部采集和存储到我这里来。数据湖就是一个大得存储站,这个存储是分布式可无限扩展得,存储过来得数据也不会去清洗和加工,尽量保持原样。文章源自玩技e族-https://www.playezu.com/134025.html

在存过来后,数据湖再提供一些标准得开放接口给你使用数据,这些接口包括了查询SQL类接口,计算引擎接口,流处理接口等。提供接口得目的也很简单,你能够方便得使用你存储过来得数据。文章源自玩技e族-https://www.playezu.com/134025.html

数据湖得存储一般是分布式对象存储或分布式文件存储,即使你是结构化数据库采集过来得数据,仍然会转成统一的存储方法,方便扩展。文章源自玩技e族-https://www.playezu.com/134025.html

数据中台简单来说企业共享数据能力下沉并对外开放。

数据中台包括了底层数据技术平台(可以是我们熟悉的大数据平台能力),中间的数据资产层,上层的数据对外能力开放。

核心的资产层本身也分层,从最底层的贴源数据,到分域应用数据,再到上层的数据仓库和数据标签库。而数据湖更多对应到数据中台概念里面的数据贴源层。

企业实际在建数据中台的时候实际很少用数据湖这个概念。

两者的对比映射如下:

数据管理,数据治理,数据中心,数据中台,数据湖都是什么意思,有什么关系呢?插图1

数据中心

对于数据中心这个词,原来在BI系统应用里面也经常出现。

但是现在数据中心一般特指IT基础设施,大的公有云数据机房等,在BI系统或数据中台里面都很少用这个词。即数据中心这个词偏IT硬件基础设施层面了。

比如下图,一般指硬件和网络基础设施架构了。

数据管理,数据治理,数据中心,数据中台,数据湖都是什么意思,有什么关系呢?插图2

 
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:
确定

拖动滑块以完成验证