VIII Congreso Internacional de Investigación REDU

← vista completa

Implementación de un modelo para predecir la resistencia a carbapenémicos en Klebsiella pneumoniae mediante un algoritmo de Machine Learning

Implementation of a model to predict resistance to carbapenems in Klebsiella pneumoniae using a Machine Learning algorithm

Tema
Ciencias de la vida

Palabras clave
Klebsiella pneumoniae, carbapenémicos, Machine Learning (ML), Extreme Gradient Boosting (XGBoost)

Introducción

Klebsiella pneumoniae es un patógeno oportunista asociado al ambiente intrahospitalario que provoca infecciones graves en grupos de riesgo. El tratamiento para estas infecciones incluye la administración de antibióticos carbapenémicos en casos de resistencia a otros antibióticos. La problemática de resistencia a múltiples antibióticos es particularmente seria en infecciones por K. pneumoniae, a momento tiene escala problema de salud pública en muchos paises. Además, el diagnóstico tardío y prescripción no expecíficade antibióticos deriva en altas tasas de mortalidad. Los métodos clínicos de diagnóstico incluyen los análisis microbiológicos y moleculares y los reportes pueden estar disponibles usualmente entre 48-72 horas luego de la toma de muestras o el resultado puede depender de bases de datos de genes de resistencia, las cuales pueden no estar actualizadas. Actualmente, las grandes bases de datos de genomas completos y anotación sobre resistencia antimicrobiana otorgan una alternativa prometedora para mejorar el manejo terapéutico. La inteligencia artificial (AI) se ha convertido en una herramienta relevante para el análisis masivo de estos datos.

Objetivos

Implementar un modelo basado en Machine Learning (ML) para predecir la resistencia de K. pneumoniae a los carbapenémicos de uso frecuente: imipenem y meropenem.

Método

Se construyó un set de datos conformado por 416 secuencias de genoma completo y sus fenotipos de susceptibilidad antimicrobiana. Las secuencias se dividieron en k-mers para aumentar la flexibilidad del análisis y se aplicó un estudio de asociación de genoma completo (GWAS) para corregir los problemas asociados a la estructura poblacional bacteriana. Los modelos se entrenaron mediante un algoritmo Extreme Gradient Boosting (XGBoost) optimizando tiempo y recursos computacionales.

Principales Resultados

Los modelos mostraron exactitud, precisión, sensibilidad y valor F superiores al 80% con tiempo de entrenamiento menores a los 5 minutos. Además, la capacidad de clasificación de los modelos se evaluó por medio de curvas ROC cuyas áreas bajo la curva (AUC) alcanzaron valores de 0,81.

Conclusiones

Se concluyó que los modelos basados en ML son capaces de predecir fenotipos de susceptibilidad antimicrobiana por medio del análisis masivo de datos genómicos.