En tema Inteligencia artificial para mejorar el rendimiento diagnóstico de la tomografía computarizada Reproducir nota Los autores de este estudio desarrollaron y validaron una red neuronal convolucional tridimensional como sistema de apoyo basado en inteligencia artificial que permite diferenciar con precisión el carcinoma de colon de la diverticulitis aguda en las imágenes de tomografía computarizada. Introducción La diverticulitis aguda (DA) es una causa gastrointestinal frecuente de ingreso hospitalario con una carga importante de enfermedad. En particular, las formas menos típicas de presentación, como la localización del lado derecho o la edad joven del paciente, pueden enmascarar y retrasar el diagnóstico correcto. La diferenciación entre etiología maligna y benigna en el engrosamiento de la pared del intestino grueso en imágenes de tomografía computarizada (TC) puede ser una tarea difícil. Los sistemas de apoyo basados en inteligencia artificial (IA) pueden mejorar la precisión diagnóstica de los radiólogos, como se ha demostrado en una variedad de tareas de imagen. Las mejoras en el rendimiento diagnóstico -en particular la reducción de los resultados falsos negativos- pueden ser útiles en la atención al paciente. El propósito de esta investigación fue desarrollar y evaluar un algoritmo de aprendizaje profundo capaz de diferenciar el carcinoma de colon (CC) y la DA en imágenes de TC, y analizar el impacto del sistema de soporte de IA en un estudio de lectores. Métodos En este estudio diagnóstico realizado en un centro de atención terciaria de Alemania, se incluyeron pacientes que se sometieron a cirugía entre el 1 de julio de 2005 y el 1 de octubre de 2020 por CC o DA. El único criterio de exclusión fue la calidad insuficiente de la imagen de TC. Los cuadros delimitadores tridimensionales, incluido el segmento intestinal enfermo y el mesenterio circundante, se delinearon de forma manual y se utilizaron para desarrollar una red neuronal convolucional tridimensional. Se realizó un estudio de lectura con diez observadores de diferentes niveles de experiencia. La distribución de los lectores fue la siguiente: residentes de radiología con menos de tres años de experiencia (n = 3), residentes de radiología con tres o más años de experiencia (n = 4) y radiólogos certificados (n = 3) con especialización en imágenes gastrointestinales. Se pidió a los lectores que clasificaran la cohorte de prueba en condiciones de sala de lectura, primero sin el apoyo algorítmico y luego con el apoyo algorítmico. Para evaluar el rendimiento diagnóstico se calculó la sensibilidad, la especificidad, el valor predictivo positivo (VPP) y el valor predictivo negativo (VPN) para todos los lectores y grupos de lectores, con apoyo de IA y sin apoyo de IA. Las métricas se compararon mediante la prueba de McNemar y comparaciones de valores predictivos relativos y absolutos. Resultados Se incluyeron un total de 585 pacientes (media de edad de 63.2 ± 13.4 años; 341 varones [58.3%] y 244 mujeres [41.7%]). Todos los pacientes incluidos se sometieron a resecciones intestinales del intestino enfermo, con confirmación histopatológica del diagnóstico por parte de un patólogo certificado. A ningún paciente le faltaron datos sobre los parámetros incluidos. Los participantes con CC (n = 318) tenían una media de edad de 66.6 ± 13.2 años y 189 eran varones (59.4%). Los individuos con DA (n = 267) tenían una media de edad de 59.0 ± 12.5 años, y 152 eran varones (56.9%). De los 585 pacientes, 445 (77.8%) se sometieron a gammagrafía interna y 130 (22.8%) a imágenes externas. La red neuronal convolucional tridimensional alcanzó una sensibilidad del 83.3% (intervalo de confianza del 95% [IC 95%]: 70.0% a 96.6%) y una especificidad del 86.6% (IC 95%: 74.5% a 98.8%) para el conjunto de prueba, en comparación con una media de sensibilidad del lector del 77.6% (IC 95%: 72.9% a 82.3%) y una media de especificidad del 81.6% (IC 95%: 77.2% a 86.1%). El grupo combinado de lectores mejoró de forma significativa con el apoyo de la IA, y pasó de una sensibilidad del 77.6% a una del 85.6% (IC 95%: 81.3% a 89.3%; p < 0.001), y de una especificidad del 81.6% a una del 91.3% (IC 95%: 88.1% a 94.5%; p < 0.001). El apoyo de la IA redujo de manera significativa el número de resultados falsos negativos y falsos positivos (el VPN del 78.5% al 86.4% y el VPP del 80.9% al 90.8%; p < 0.001). Conclusión La correcta diferenciación del CC y la DA tiene importantes repercusiones clínicas. Los hallazgos de este estudio sugieren que un modelo de aprendizaje profundo capaz de distinguir CC y DA en imágenes de TC, como sistema de apoyo, puede mejorar de forma significativa el rendimiento diagnóstico de los radiólogos, lo que puede optimizar la atención del paciente. Los autores de esta investigación desarrollaron y validaron una red neuronal convolucional tridimensional, como sistema de apoyo de IA, que permite diferenciar con precisión el CC de la DA en las imágenes de TC. El modelo de IA mostró un rendimiento no inferior al del radiólogo promedio y condujo a un aumento significativo en el rendimiento del radiólogo, independientemente de la experiencia. Además, el apoyo de IA dio lugar a una disminución de las tasas de falsos negativos. Referencias Resumen objetivo elaborado por el Comité de Redacción Científica de SIIC sobre la base del artículo Development and Validation of a Deep Learning Algorithm to Differentiate Colon Carcinoma from Acute Diverticulitis in Computed Tomography Images, de Ziegelmayer S, Reischl S, Braren R y colaboradores, integrantes del Technical University of Munich, Munich, Alemania. El artículo original, compuesto por 10 páginas, fue editado por JAMA Network Open 6(1):1- 10, Ene 2023.