INFOBANCO: una plataforma de investigación sanitaria basada en openEHR

Veratech quiere compartir los resultados del proyecto INFOBANCO, que se ha desarrollado entre abril de 2022 y junio de 2023 para el Servicio Madrileño de Salud. Veratech for Health ha tenido el privilegio de participar en este proyecto desde su concepción inicial en la consulta previa al mercado, hasta su implementación final, fomentando la adopción de openEHR y la metodología de modelado de arquetipos.

INFOBANCO es el resultado de un proyecto de Compra Pública de Innovación con el objetivo de construir una plataforma regional de datos para la investigación sanitaria. Esta plataforma busca ofrecer servicios de explotación de información a clínicos, gestores e investigadores, haciendo posible la combinación de datos procedentes de múltiples fuentes. Está dotada de herramientas de gobernanza, recogida, transformación, consulta, visualización y análisis de datos para obtener conocimiento y apoyar la toma de decisiones.

La arquitectura de la plataforma INFOBANCO puede verse en la siguiente figura:

La idea innovadora detrás de esta arquitectura es poner un repositorio de datos clínicos (CDR) según el estándar openEHR como núcleo de una plataforma de investigación, y utilizarlo como fuente para transformaciones de datos (procesos ETL) a otros estándares comúnmente utilizados en el campo de la investigación clínica (OMOP CDM, HL7 FHIR, CDISC ODM, i2b2). La hipótesis de este trabajo fue que el modelo de referencia y los arquetipos de openEHR proporcionan el conjunto más completo de información (tanto de información sanitaria como de contexto) para alimentar cualquier otro modelo de información utilizado por otros estándares.

Componentes de la plataforma Infobanco

  • Entradas. Se han integrado dos sistemas de información diferentes, incluyendo la información de la HCE del Hospital 12 de octubre y la información de la HCE del área de Atención Primaria.
  • Lago de datos. Un primer repositorio para la integración de los datos en bruto, facilitando un único punto de entrada para procesarlos. Este lago de datos ofrece datos en múltiples capas: brutos (datos tal y como están en su origen), limpios (normalización básica, como formatos de fechas o números), y consumo (clasificación/organización de los datos según su dominio).
  • openEHR CDR. Los datos del lago de datos se han normalizado siguiendo los arquetipos y plantillas de openEHR. Inicialmente, sólo los datos cubiertos por los arquetipos existentes y requeridos por los formatos de salida se han incluido en el CDR de openEHR. Este CDR se construye utilizando la plataforma Better.
  • Salidas estándar. Se han implementado procesos ETL para convertir los datos de openEHR a otros formatos estándar. El procedimiento seguido ha sido la selección de los datos relevantes para cada salida utilizando AQL en primer lugar, y posteriormente la implementación de las transformaciones de datos utilizando la tecnología más adecuada en cada caso: Python, Java, Pentaho.
  • Salidas no estándar. Algunos casos de uso requerían información que aún no ha sido incluida en el CDR de openEHR (principalmente datos no cubiertos por los arquetipos existentes o datos de gestión interna de los sistemas de entrada). En esos casos, por ejemplo para construir un panel de control de BI, se puede seguir accediendo a los datos en bruto directamente desde el lago de datos.

Las tareas del proyecto no incluían ninguna actividad específica de modelado de arquetipos. Solo se crearon plantillas utilizando arquetipos ya existentes. En el proyecto, se utilizaron más de 35 arquetipos existentes del CKM para construir 21 plantillas que representan datos Demográficos, Encuentros, Problemas de salud, Administración de medicamentos, Vacunaciones, Alertas, Informe de fenotipo, Informe genómico, Historial familiar, etc.

El desarrollo de la plataforma se ha completado en julio de 2023. Se han cargado en la plataforma un primer conjunto de 100.000 pacientes, con la intención de cargar los 450.000 pacientes del Hospital 12 de octubre en los próximos meses, y se pretende cargar los 6,5 millones de pacientes de la Comunidad de Madrid en un futuro.

Este proyecto ha sido posible gracias a la colaboración de las siguientes organizaciones:

  • Hospital 12 de octubre, Madrid
  • Área de Atención Primaria, Madrid
  • Veratech for health
  • NTT Data España
  • Grupo RHEA
  • Better

Financiación y gestión:

  • Unión Europea, Fondo Europeo de Desarrollo Regional (FEDER)
  • Ministerio de Sanidad de España
  • Consejería de Sanidad de la Comunidad de Madrid

Más información:

https://cpisanidadcm.org/infobanco/