Un chatbot de IA muestra potencial como socio de diagnóstico, según investigadores

Los médicos investigadores del Centro Médico Beth Israel Deaconess (BIDMC) compararon el razonamiento probabilístico de un chatbot con el de los médicos humanos. Los hallazgos, publicados en JAMA Network Open , sugieren que la inteligencia artificial podría servir como herramientas útiles de apoyo a las decisiones clínicas para los médicos.

“Los seres humanos luchan con el razonamiento probabilístico, la práctica de tomar decisiones basadas en el cálculo de probabilidades”, dijo el autor correspondiente del estudio, Adam Rodman, MD, médico de medicina interna e investigador del Departamento de Medicina del BIDMC.

“El razonamiento probabilístico es uno de varios componentes para hacer un diagnóstico, que es un proceso increíblemente complejo que utiliza una variedad de estrategias cognitivas diferentes. Elegimos evaluar el razonamiento probabilístico de forma aislada porque es un área bien conocida donde los humanos podrían necesitar apoyo. “

Basando su estudio en una encuesta nacional publicada previamente de más de 550 profesionales que realizaban razonamientos probabilísticos en cinco casos médicos , Rodman y sus colegas alimentaron el modelo de lenguaje grande (LLM) disponible públicamente, Chat GPT-4, con la misma serie de casos y ejecutaron un modelo idéntico. solicite 100 veces para generar una variedad de respuestas.

El chatbot, al igual que los médicos anteriores, tenía la tarea de estimar la probabilidad de un diagnóstico determinado en función de la presentación de los pacientes. Luego, dados los resultados de pruebas como una radiografía de tórax para detectar neumonía, una mamografía para detectar cáncer de mama , una prueba de esfuerzo para detectar enfermedades de las arterias coronarias y un urocultivo para detectar infecciones del tracto urinario , el programa chatbot actualizó sus estimaciones.

Cuando los resultados de las pruebas fueron positivos, fue una especie de empate; el chatbot fue más preciso al hacer diagnósticos que los humanos en dos casos, igualmente preciso en dos casos y menos preciso en un caso. Pero cuando las pruebas dieron negativas, el chatbot brilló, demostrando más precisión en el diagnóstico que los humanos en los cinco casos.

“Los seres humanos a veces sienten que el riesgo es mayor de lo que es después de un resultado negativo de la prueba, lo que puede conducir a un tratamiento excesivo, más pruebas y demasiados medicamentos”, dijo Rodman.

Pero Rodman está menos interesado en cómo los chatbots y los humanos actúan cara a cara que en cómo el desempeño de los médicos altamente capacitados podría cambiar en respuesta a tener estas nuevas tecnologías de apoyo disponibles en la clínica, agregó Rodman. Él y sus colegas lo están investigando.

“Los LLM no pueden acceder al mundo exterior; no calculan probabilidades como lo hacen los epidemiólogos, o incluso los jugadores de póquer. Lo que hacen tiene mucho más en común con la forma en que los humanos toman decisiones probabilísticas puntuales”, dijo. .

“Pero eso es lo emocionante. Incluso si son imperfectos, su facilidad de uso y su capacidad para integrarse en los flujos de trabajo clínicos podrían, en teoría, hacer que los humanos tomen mejores decisiones”, dijo. “Se necesitan urgentemente futuras investigaciones sobre la inteligencia colectiva humana y artificial”.

Fuente: medicalxpress.com