ChatGPT vs Médicos: Estudio compara recomendaciones de tratamiento para depresión

Portada | Ciencia y tecnología

Foto: Gustavo Torres (NotiPress)

Un nuevo estudio sugiere que la herramienta de inteligencia artificial (IA) ChatGPT podría ser mejor que un médico al momento de seguir estándares de tratamiento para la depresión clínica. Según la investigación publicada en Family Medicine and Community Health, dicha herramienta también tendría la ventaja de carecer de sesgos de género o clase social, a menudo presentes en la relación médico-paciente.

De acuerdo con un comunicado de la revista académica BMJ, la depresión es un padecimiento común y la gente a menudo acude primeramente a sus médicos familiares en busca de atención. Para tratar este padecimiento, señala el comunicado, existen directrices clínicas específicas basadas en evidencia, generalmente con un enfoque de atención escalonado, según la severidad de la depresión. Por otro lado, una herramienta de IA como ChatGPT tiene el potencial de ofrecer información rápida, objetiva y derivada para complementar los métodos de diagnóstico tradicionales, además de proveer confidencialidad y anonimato.

Por esto, el estudio comparó cómo las versiones 3.5 y 4 de ChatGPT y mil 249 médicos franceses brindan atención primaria, evalúan y recomiendan tratamientos para la depresión de leve a grave. Los investigadores utilizaron viñetas con la descripción de los pacientes, con variaciones en género, clase social y gravedad de la depresión, y consultaron a ChatGPT en cada situación. Las opciones de respuesta se limitaron a: espera vigilante, derivación para psicoterapia, medicamentos recetados, derivación para psicoterapia más medicamentos recetados, o ninguno de esos.

Entre otros datos, los autores del estudio identificaron que solo poco más del 4% de los médicos familiares recomendaron exclusivamente la derivación a psicoterapia para casos leves de depresión, acorde con los lineamientos clínicos. En comparación, ChatGPT 3.5 y ChatGPT 4 hicieron esta recomendación en el 95% y el 97.5% de los casos, respectivamente.

Asimismo, en los casos de depresión grave, un 44.5% de los médicos recomendó psicoterapia más medicamentos recetados, mientras ChatGPT lo hizo con mayor frecuencia. La versión 3.5 lo hizo en un 72% de los casos graves y ChatGPT 4 en el 100%, conforme los lineamientos clínicos de tratamiento. A diferencia de otras investigaciones publicadas, este estudio no encontró señales de sesgos de género y clases sociales en el tratamiento recomendado, aseguran los autores.

Las limitaciones de este estudio

Pese a un mayor apego de ChatGPT a los lineamientos clínicos para el tratamiento de la depresión, los alcances de esta investigación aún son limitados. Por un lado, el comunicado reconoce que el estudio se limitó a interacciones de ChatGPT 3.5 y 4 en un punto específico en el tiempo. Igualmente, la información de la IA se comparó con datos de una muestra representativa de doctores de atención primaria en Francia, por lo cual, la conclusión podría no ser ampliamente aplicable.

Finalmente, los casos descritos en las viñetas corresponden a una visita inicial debido a una queja de depresión, por lo que no representa un tratamiento continuo de la enfermedad ni incluye otras variables. Asimismo, deben considerarse temas éticos, particularmente en torno a la privacidad, seguridad y la necesidad de tener un médico presente, por cuestiones de juicio clínico en torno al diagnóstico o tratamiento de la depresión.

Similarmente, un estudio de la Universidad Médica y Dental de Tokio concluyó que, pese al potencial de ChatGPT en medicina, sus diagnósticos y recomendaciones resultan inconsistentes, al menos para un conjunto de síntomas ortopédicos comunes. Para permitir un uso extendido de la inteligencia artificial en la medicina, los expertos consideran necesario continuar con un entrenamiento específico de herramientas como ChatGPT para estos fines. Paralelamente, la comunidad investigadora aboga por un desarrollo transparente y preciso de estas tecnologías, mientras se permite la reproducibilidad y la validación de su funcionamiento entre pares.

DESCARGA LA NOTA SÍGUENOS EN GOOGLE NEWS