医疗保健

数据湖整合-聚合器类比

在我上一篇博文,我介绍了作为一个整合者的数据湖的概念,以及在这个环境中应用健壮的信息治理的关键成功因素。在这篇文章中,我想介绍一个类比,以帮助可视化这个环境和涉及的各方。

所以,数据湖作为整合者。这到底是什么意思?对我来说,这意味着从多个来源获取信息,并让多个目标能够获得这些信息——关键在于确保目标不需要知道哪个来源提供了什么信息。

换句话说,将源与目标解耦,以便将重点放在实际信息上,这是功能强大且有用的数据湖的一个关键特征。

这个分离提供一定程度的灵活性增加,删除,甚至访问机制的改变,涉及的系统变得更简单和更有效率,因为你只需要专注在一个系统,而不是担心这个系统如何,也可能不会与他人互动。

换句话说,数据湖整合器可以使用以下目的和价值陈述来描述:

数据湖的目的:

数据湖的重点是为跨各种系统和解决方案共享信息提供一个单一和通用的机制

理由/值:

数据湖的好处在于系统的解耦和删除点对点集成解决方案,以提高效率和降低维护成本,同时允许删除和引入解决方案,而不影响任何其他解决方案,或产生集成或分解解决方案的成本

我喜欢用一个聚合器的类比——在这一点上,中央存储库(数据)湖从各种渠道搜集信息(供应商),汇总(分离,结合,巩固,把——或者只是离开它),这个独立的信息来源(消费者)的目标。下面的图片提供了这个类比的图解:

这个现实世界的概念一直应用于我们的日常生活中,也是所有零售互动的基础模型。但是,正如所指出的,“仓库”模型可能是最接近数据湖概念的,因为它也提供了“直接”访问供应商“交付”的产品(只是坐在托盘上)——这是数据湖中的一个选项。

对于正确的使用者,有时提供直接访问是有意义的,提供与“重新打包”版本一致的选项。

这个模型依赖于几个关键概念:一个是对“公共词汇表”的引用,我将在后面的文章中讨论这个概念,另一个是供应商、聚合者和消费者的角色。

明确定义和阐明这些角色及其责任是至关重要的,以便所有各方都“在同一页上”,只要知道他们如何扮演一个角色,以及同样重要的是,这些角色之间的界限在哪里。在下一篇文章中,我将更深入地探讨这些角色和责任。

关于作者

更多作者介绍

留下一个回复

这个网站使用Akismet来减少垃圾邮件。了解如何处理您的评论数据

订阅每周博客文摘:

报名