Lanit Consulting, Grupo Init, Athlon y Biocruces Bizkaia (Unidad del Dolor del Hospital Universitario de Cruces) desarrollamos el proyecto PAINTECH. El objetivo de PAINTECH es mejorar la calidad de vida de las personas con lumbalgia y dolor crónico de espalda a través de la tecnología y de cambios en el estilo de vida.
Hacer uso de la Inteligencia Artificial en este proyecto es algo vanguardista pero que poco a poco se está introduciendo en múltiples ámbitos que nos afectan directamente y, en este caso, el ámbito médico. Procesar los datos, realizar el Análisis Exploratorio de los Datos (EDA) y el entrenamiento, validación y test de modelos de algoritmos de Machine Learning para predecir la cronificación de la enfermedad han sido las tareas principales que se han desarrollado durante el estudio.
Como paso previo a la generación del modelo se realiza un Análisis Exploratorio univariante comparando los valores agrupados por clases. Además, se realiza un Análisis Estadístico para confirmar la existencia o no de diferencias significativas entre dichas clases. Estudiando la correlación entre atributos, la densidad de cada uno y haciendo el análisis correspondiente se han apreciado datos de interés:
- El uso de opiáceos aumenta cuanto más se acerca el paciente a la fecha de diagnóstico de la enfermedad.
- Se ha detectado que los grupos de fármacos gabapentinoides, opiáceos, antidepresivos y medicación con determinados principios activos que predominan en los pacientes que tienen lumbociatalgia.
- En datos de pacientes de hospitalizaciones, diagnósticos y consultas externas se comparte el aumento de servicio prestado de traumatología para pacientes con el achaque. En diagnósticos y consultas externas coincide también el aumento del valor rehabilitación.
- Mediante un Análisis de las Componentes Principales (PCA) obtenemos que se necesita una combinación de 14 a 23 componentes para explicar el 95-99% de la varianza del modelo, por lo que un número menor de variables para el modelo puede ser perjudicial para su acierto.
Este análisis permite hacer un primer cribado de variables para su inclusión en el modelo. Con el conjunto resultante se realizan pruebas de entrenamiento y validación con diferentes algoritmos para sacar el modelo más adecuado. El modelo elegido ha sido un RandomForest que nos ha arrojado un accuracy, precision, recall y f1 score de 88%, 95%, 79% y 86% respectivamente. Creado el modelo, podemos apreciar que las variables que el algoritmo toma con importancia son las siguientes (ordenadas de mayor importancia a menor): IMC, edad, tensión, dispensación de opiáceos, ATC de los fármacos, tipo de fármaco, sexo, servicio de consulta externa, etc.
Con el modelo antes mencionado se ha creado una solución web para que este conocimiento se pueda replicar en un futuro con un grupo de datos diferente y hacer un análisis, entrenamiento del modelo o sacar una predicción de porcentaje de riesgo de padecer lumbociatalgia crónica para nuevos pacientes.
Al hacer uso de esta tecnología y de los datos que recolectan y tienen disponibles los hospitales, los profesionales de la salud que traten pacientes tendrían un apoyo o métrica que les pueda alertar acerca de la posible cronificación en un paciente de la enfermedad que éste padece o puede padecer.
Es importante que el Sector Público invierta en esta tecnología emergente que tantos beneficios y capacidad de anticipación a eventos nos puede ofrecer para, así, beneficiar el estilo de vida de todos.