Se necesitó una pandemia, pero EE. UU. Finalmente tiene (algunos) datos médicos centralizados

N3C, por otro lado, es auditable y responsable ante miles de investigadores en cientos de instituciones participantes, con un fuerte enfoque en la transparencia y la reproducibilidad. Todo lo que hacen los usuarios dentro de la interfaz, que utiliza GovCloud de Palantir plataforma, se conserva cuidadosamente, de modo que cualquier persona con acceso pueda volver sobre sus pasos.

“Esto no es ciencia espacial y no es realmente nuevo. Es un trabajo duro. Es tedioso, debe hacerse con cuidado y tenemos que validar cada paso ”, dice Christopher Chute, profesor de medicina en Johns Hopkins que también codirige N3C. “Lo peor que podríamos hacer es transformar metódicamente los datos en basura que nos daría respuestas incorrectas”.

Fuerza bruta

Haendel señala que estos esfuerzos no han sido fáciles. “La diversidad en la experiencia que se necesitó para que esto sucediera, la perseverancia, la dedicación y, francamente, la fuerza bruta, no tiene precedentes”, dice ella.

Esa fuerza bruta proviene de muchos campos diferentes, muchos de los cuales no forman parte tradicionalmente de la investigación médica.

“Tener a todos a bordo de todos los aspectos de la ciencia realmente ayudó. Durante el covid, la gente estaba mucho más dispuesta a colaborar ”, dice Mary Boland, profesora de informática en la Universidad de Pensilvania. “Podrías tener ingenieros, informáticos, físicos, todas estas personas que normalmente no participan en la investigación de salud pública”.

Boland es parte de un grupo que usa los datos de N3C para buscar si el covid aumenta el sangrado irregular en mujeres con síndrome de ovario poliquístico. Fuera de covid, la mayoría de los investigadores tienen que usar datos de reclamaciones de seguros para obtener una base de datos lo suficientemente grande para los análisis a nivel de población, dice.

Los datos de reclamaciones pueden responder algunas preguntas sobre qué tan bien funcionan los medicamentos en el mundo real, por ejemplo. Pero esas bases de datos carecen de una gran cantidad de información, incluidos los resultados de laboratorio, los síntomas que informan las personas e incluso si los pacientes mueren.

Recogida y limpieza

Fuera de las bases de datos de reclamaciones de seguros, la mayoría de los colaboradores de datos de salud en los EE. UU. Utilizan un modelo federado. Todos los participantes en estos estudios acuerdan formatear sus propios conjuntos de datos en un formato común y luego ejecutar consultas desde el colectivo, como la proporción de casos graves de covid por grupo de edad. Varios colectivos internacionales de investigación de covid, incluido el Informática y ciencias de datos de salud observacionales (OHDSI, que se pronuncia “Odisea”), operan de esta manera, evitando problemas legales y políticos con los datos de pacientes transfronterizos.

OHDSI, que se fundó en 2014, cuenta con investigadores de 30 países, que juntos tienen registros de 600 millones de pacientes.

“Eso permite que cada institución mantenga sus datos detrás de sus propios cortafuegos, con sus propias protecciones de datos en su lugar. No requiere ningún dato del paciente para moverse hacia adelante y hacia atrás ”, dice Boland. “Eso es reconfortante para muchos lugares, especialmente con toda la piratería que ha estado ocurriendo últimamente”.

Leave a Reply

Your email address will not be published. Required fields are marked *