software

ChatGPT o1 vs médicos: estudio Harvard muestra 67% acierto en diagnósticos de urgencia

5 de mayo de 2026 · Fuente: El Chapuzas Informático

ChatGPT o1 supera a médicos en diagnósticos de urgencia según estudio de Harvard

Un estudio realizado por investigadores de la Facultad de Medicina de Harvard y el Centro Médico Beth Israel Deaconess revela que los modelos de inteligencia artificial de OpenAI alcanzan mayor precisión diagnóstica que médicos en situaciones de urgencia. La investigación utilizó condiciones reales para evaluar el rendimiento práctico de diferentes sistemas.

Resultados del análisis comparativo

Los investigadores evaluaron el desempeño del modelo ChatGPT o1-preview (versión 2024 con capacidad de razonamiento) contra diagnósticos médicos tradicionales. En un caso real de paciente con embolia pulmonar que se agravó durante tratamiento, el modelo alcanzó un 67% de acierto promedio, con rangos que superaron 75% en determinadas evaluaciones.

Por comparación, el sistema de diagnóstico médico ISABEL registró 50% de acierto en el mismo caso, con mayor variabilidad en los resultados. Otros modelos evaluados como GPT-4 mostraron menor precisión que o1-preview.

Capacidades de razonamiento en modelos IA

La ventaja del modelo o1-preview radica en su arquitectura de razonamiento avanzado, que le permite analizar información clínica de forma similar al pensamiento médico deductivo. Los modelos se entrenaron con millones de parámetros y acceso a conocimiento médico extenso, aunque OpenAI ya desarrolló ChatGPT Health específicamente para consultas de salud con validación de profesionales médicos.

Implicaciones para diagnósticos de urgencia en Chile

Este hallazgo cobra relevancia en contexto latinoamericano donde la disponibilidad de especialistas en urgencias presenta limitaciones en algunas regiones. Sin embargo, expertos advierten que estos resultados no validan el reemplazo de médicos, sino su complementación con herramientas de IA para casos complejos.

Las plataformas como Perplexity Health han demostrado respuestas fiables en evaluaciones previas, aunque ninguna reemplaza la responsabilidad clínica profesional y la evaluación física del paciente.

Limitaciones del estudio

La investigación analizó casos específicos en condiciones controladas. La generalización a todos los tipos de urgencias requiere análisis más extensos. Además, la IA no puede realizar exploración física ni acceder a información contextual del paciente que un médico sí obtiene en consulta directa.

Mencionados en esta noticia

OpenAIChatGPT o1-previewOpenAIGPT-4OpenAIChatGPT HealthPerplexityPerplexity HealthISABEL HealthcareISABELHarvard UniversityFacultad de Medicina de Harvard

Preguntas frecuentes

¿ChatGPT reemplaza al médico en diagnósticos de urgencia?

No. El estudio muestra que ChatGPT o1 puede asistir en análisis diagnóstico, pero no reemplaza la evaluación clínica profesional, exploración física ni responsabilidad legal del médico. Es una herramienta complementaria.

¿Cuál fue el porcentaje de acierto de ChatGPT en el estudio?

ChatGPT o1-preview alcanzó 67% de acierto promedio en diagnósticos de urgencia, con rangos que superaron 75%. Comparado con médicos que obtuvieron 50% en el mismo caso.

¿Por qué o1-preview es mejor que GPT-4 en diagnósticos?

o1-preview incluye capacidad avanzada de razonamiento que simula el pensamiento deductivo médico, permitiendo análisis más profundo de información clínica compleja comparado con GPT-4.

¿Estos modelos están disponibles en Chile para diagnósticos?

ChatGPT está disponible en Chile, pero su uso para diagnósticos médicos requiere cautela. OpenAI desarrolló ChatGPT Health específicamente para salud, aunque su acceso varía por región.

¿Qué limitaciones tiene este estudio?

Analizó casos específicos en condiciones controladas. La generalización a todos los tipos de urgencias requiere investigación más extensa. La IA carece de exploración física del paciente.

Todas las noticias Ir al inicio