La inteligencia artificial avanza a gran velocidad en el ámbito médico y abre un debate clave sobre su papel en la toma de decisiones clínicas, especialmente en contextos críticos como los servicios de urgencias. En este contexto, una investigación liderada por la Escuela de Medicina de Harvard que se presenta este viernes en la revista Science, y que ha avanzado La Vanguardia, concluye que la inteligencia artificial puede superar a los médicos en la toma de decisiones en urgencias, especialmente cuando la información clínica es incompleta y es necesario actuar con rapidez. El estudio ha evaluado el sistema 01 de OpenAI en situaciones propias de los servicios de urgencias: el triaje inicial, el razonamiento diagnóstico, la selección de pruebas médicas y la decisión sobre el destino del paciente después de la atención. 

Los investigadores compararon su rendimiento con el de médicos de las universidades de Harvard y Stanford, con GPT-4o y con profesionales que utilizaban GPT-4 como apoyo. La evaluación se ha llevado a cabo presentándole casos clínicos complejos, como si fuera una prueba de examen médico. Los resultados del sistema 01 se han comparado con los de estos médicos que han analizado los mismos casos, así como con los del modelo GPT-4o, una versión más avanzada de GPT-4. En todos los escenarios, 01 ha mostrado un rendimiento superior, superando tanto a GPT-4o como a los profesionales sanitarios, incluso aquellos que contaban con el apoyo de GPT-4. En todos los casos, 01 obtuvo mejores resultados.

La prueba más relevante se hizo con 76 casos reales de pacientes del hospital Beth Israel Deaconess de Boston. Los investigadores introdujeron la información clínica sin editar, con datos confusos, ruido y elementos irrelevantes, tal como ocurre en la práctica real. Incluso en estas condiciones, el sistema superó a los médicos. En el triaje inicial, 01 acertó el diagnóstico en el 67% de los casos, frente al 50-55% de los médicos. Posteriormente, con más pruebas disponibles, el sistema elevó el acierto hasta el 82%, mientras que los médicos se situaron entre el 70% y el 79%.

A pesar de estos resultados, los mismos autores y comentaristas subrayan que esto no significa que la IA sustituya a los médicos, sino que lo que recomiendan es integrar la IA como herramienta de apoyo en la toma de decisiones clínicas para mejorar la atención a los pacientes, pero siempre bajo la supervisión, responsabilidad y control humano. El modelo trabajó solo con texto, mientras que la práctica clínica real también depende de la observación, la exploración física y las señales no verbales. Además, el resultado más plausible es un uso como apoyo a la decisión clínica, no como un reemplazo total. Los autores del informe creen que la inteligencia artificial podría ayudar a hacer el primer triaje de pacientes, la decisión de qué pruebas pedir o incluso derivarlos una vez salgan del hospital. “Estos modelos pueden ser una de las tecnologías con más impacto en la medicina en décadas”, afirmó Adam Rodman, codirector del estudio, en rueda de prensa. Sin embargo, advirtió que todavía no están preparados para un uso masivo. Los investigadores señalan que habrá que hacer ensayos clínicos prospectivos para comprobar los beneficios reales para los pacientes y que los sistemas sanitarios deberán invertir en infraestructura e integrar la IA de manera segura. Además, apuntan un reto clave: a pesar de su potencial, los médicos todavía no saben cómo aprovechar plenamente estas herramientas.

La Vanguardia pone como ejemplo tres casos reales que aparecen en este estudio. El primero es el de un hombre, enfermero de profesión, que acudió a urgencias del hospital Beth Israel Deaconess de Boston con hipoglucemia. Mientras los médicos atribuyeron inicialmente el caso a un problema de diabetes, la inteligencia artificial identificó que el origen era un tipo raro de cáncer de páncreas. En el segundo caso, un hombre ingresó con un tromboembolismo pulmonar y, a pesar de mejorar inicialmente con anticoagulantes, volvió a empeorar. Mientras los médicos lo atribuyeron a un posible fracaso del tratamiento, la IA detectó que el paciente tenía lupus e identificó correctamente que la inflamación era causada por esta enfermedad autoinmune. En el tercer caso, un paciente trasplantado e inmunodeprimido llegó a urgencias con síntomas de infección, sobre todo respiratorios. Aunque los médicos sospecharon de una infección pulmonar y restaron importancia a un dolor en el escroto, la IA identificó correctamente que se trataba de una infección necrosante en esta zona que requería cirugía. 

En declaraciones al programa No lo sé de RAC1, el presidente del Colegio de Médicos de Girona, Josep Vilaplana, ha remarcado que el componente humano seguirá siendo esencial: “Los conocimientos son muy importantes, pero saber cómo es el paciente que tienes delante y qué le puedes pedir es clave si quieres tener éxito terapéutico y aconsejarle bien”. Vilaplana también ha reconocido que la IA puede razonar con más datos, más rapidez y, a menudo, con más precisión que el cerebro humano, pero ha subrayado que su papel debe ser el de reforzar y mejorar la práctica médica, no sustituirla.