医疗保健

数据集成:驯服医疗保健行业的猛兽——第3部分

我以前说过,现在我还要再说一遍……将一个或多个EMR系统中的数据集成到一个内聚分析仓库数据库中是非常困难的。尤其是当你从头开始做的时候。

在我最近的两个博客中(数据集成:驯服医疗保健的野兽我演示了如何通过使用预构建的“加速器”,减少从EMR系统提取数据并将其放入仓库用于复杂分析和报告的时间和成本。

在任何组织承担建立数据仓库的工作之前,都需要有一个这样做的理由。在IT领域,我们有时称这些为“业务需求”。

下面是它的工作原理。

医疗保健组织中的某个人对IT部门说:“我们需要一大堆报告来向政府汇报,并更好地管理我们的流程。”此外,我们想分析我们的病人和财务数据,看看我们是否能以更低的成本为我们的病人提供更好的服务。我们现在就需要它,我们不希望它花费大量的钱。”

您可以与他们一起提供他们想要的报告列表和他们想要的分析类型结果。

根据这些数据,您的技术人员将查看现有的EMR系统,以确定满足需求的数据字段,并确定项目的范围。你需要病人,遭遇,帐户,程序,诊断,组织,位置,声明,药物和药物订单,实验室订单,临床结果和一些其他的东西,只是为了开始。

这相当于15个以上的系统、353个以上的源表和2933个以上的列。您将需要设计一个数据库、构建数百个程序、测试和验证数据等等(完全是虚构的、毫无意义的一组数字,但我试图说明这是一堆工作)。你会突然意识到你需要帮助,否则你将永远无法完成,并花费数百万美元。

为了使事情更加复杂,操作系统以混合主题状态存储和处理数据。这意味着一个以遭遇为中心的系统将遭遇与相关的患者、诊断、程序、支持的临床命令和临床发现数据混合在一起。这使得存储和更新事务数据变得更容易。

但是仓库不能以事务为中心。数据设计需要高度规范化,以减少冗余数据。由于它还需要分布在很长一段时间的数据来发现趋势,并寻找治疗和结果模式,仓库需要存储数十亿条记录来获得有意义的分析结果。这需要不同的存储方案。这最好使用维度星型模式设计(如第2部分所述)。但是在将数据加载到维度结构之前,需要重新组织数据。

因此,为了加载数据仓库,我们需要分解源事务,并将数据加载到面向主题(Patient, Organization, Encounter等)的原子数据库中。

Atomic数据库是一种高度规范化的第三范式(抱歉,这是关系模型术语),确保将其重新链接在一起,以确保正确存储。

注:这是医疗保健领域的Perficient Analytics门户的最后一部分——入口入口设计中的一个关键因素。

幸运的你!你读了我的博客(全部三部分),你知道该给谁打电话!但是你怀疑。这是真的吗?所以你联系了几家医疗保健机构,他们都告诉你同样的事情……打电话给Perficient!这些家伙太棒了,你会爱上他们的!

我们接到电话后会告诉你情况。

在这张图中,

  1. Perficient Analytics Gateway—适用于医疗保健行业,一组预构建流程,可在极短的时间内构建和加载您的仓库。
  2. 一个稳定的行业标准统一数据模型(我们与之合作并为之构建产品)。
  3. 将数据从Source转移到Stage,再转移到Atomic,再转移到Dimensional,几乎是交钥匙的过程,为分析和报告做好了准备。

使这个过程标准化的是它与统一数据模型的原子数据库的一致。Data Vault Hub & Satellite结构(如第2部分所述)的稳定性允许我们使用标准输入格式(对于那些没有首字母缩写的人,我们将其称为SIF)设计具有与Atomic相同列的Pre-Stage数据库表。一种类型用于枢纽和卫星组合,另一种类型用于关系等。我们还有一些其他的,但你知道的。

我们使用SIF在面向主题的边界中存储源数据,维护与所有相关hub的关系,使所有hub都与Atomic模型保持一致。这使得摄入编程变得容易和可重用。它还提供了筛选和转换源列的机制,作为仓库处理的准备。

Perficient Analytics Gateway的“摄入量门户”部分——用于医疗保健;

  1. 用于从您的数据源提取数据到摄入量“SIF”。它被设计用来接收来自任何系统的数据。
  2. 在Pre-Stage数据库中处理和存储SIF记录
  3. 它有助于过滤重复、清理、验证、重新格式化等传入数据,以便最终装载到仓库。
  4. 将数据从Pre-Stage移动到Atomic的ETL过程。
  5. 标准化数据格式,消除垃圾数据,验证代码并合并来自多个系统的类似输入。

这里显示的是从Source到SIF的基本数据流。

为了实现这一切,我们创建映射文档,其中包含足够的信息,以驱动机械代码生成过程,该过程创建正确加载SIF表所需的ETL和ELT编程。剩下的预构建的ETL程序完成剩下的工作。

SIF表中所有列的数据格式都是一个最大长度的可变字符(有一些较小的例外),因此无论从系统输入的任何给定字段的长度或值是多少,它都将被接受。然后使用仓库字段数据类型来指导传出数据类型匹配的程序。

由于仓库模型很少更改,将数据从SIF (Pre-Stage)移动到Atomic的编程大部分时间都在进行,很少或没有修改。

这是一个巨大的时间节省,如下所示。

当然,我简化了这个,使它简短。

不用说,Perficient的BI团队、源系统知识和经验、Gateway和Data模型的组件都不便宜。然而,与自己从头做起相比,这要快得多,干净得多,而且比你想象的要便宜得多。

给我们打电话!

关于作者

更多作者介绍

留下一个回复

这个网站使用Akismet来减少垃圾邮件。了解如何处理您的评论数据

订阅每周博客文摘:

报名
类别