UQuery, aprovechando toda la información clínica en beneficio de los pacientes
La cantidad de datos que generamos ha crecido a un ritmo exponencial durante los últimos años, y uno de los principales contribuyentes a este fenómeno es el sector sanitario. Sin embargo, cada vez una mayor proporción de esa información es no estructurada, como son los textos. Resulta difícil que una máquina comprenda y extraiga valor de forma automática a partir de ellos, ya que el lenguaje humano es muy complejo. Para salvar este escollo, entran en juego las tecnologías de Procesamiento de Lenguaje Natural.
Aplicando esta tecnologías, y con la asesoría médica de Azierta, GMV ha conseguido la estructuración de datos textuales sanitarios para facilitar el análisis y la explotación de información clínica de pacientes con Carcinoma de Células Renales (CCR), persiguiendo ofrecerles tratamiento personalizados. Ello no habría sido posible sin la inestimable colaboración de Joaquín Carballido Rodríguez, Jefe del Servicio de Urología del Hospital Universitario Puerta de Hierro de Madrid de donde proceden los datos de casi 600 pacientes con neoplasias malignas renales recopilados a lo largo de diez años. Los formularios, informes y notas médicas se han podido interpretar y explotar con tecnologías de procesamiento natural de GMV y el conocimiento del doctor e investigador Eduardo Ródenas y su equipo.
El desarrollo ha constado de 3 fases claramente diferenciadas. Durante la primera, se ha generado una ontología del Carcinoma de Células Renales, que permite representar el conocimiento pertinente sobre este ámbito mediante la definición de entidades relevantes –síntomas, pruebas médicas, tratamientos, etc.- y las interacciones entre ellas. Se definió asimismo una serie de conceptos relevantes cuyos valores pueden resultar de interés (ej. escala ECOG o el número de plaquetas en sangre).
En la segunda fase, se realizó la extracción de conocimiento útil a partir de los textos, para lo cual el equipo de GMV se ha apoyado en uQuery, una herramienta de diseño propio orientada al Procesamiento del lenguaje natural. Gracias a ella, se localizaron en los datos los conceptos y patrones previamente definidos, pudiéndose abordar problemáticas comunes asociadas al tratamiento de lenguaje natural, como son la gestión del género o de las negaciones, muy comunes en textos médicos. Durante esta fase se buscó también asignar un contexto temporal a los hallazgos encontrados, de modo que éstos pudieran ser posteriormente ordenados de forma cronológica. Ello supuso uno de los grandes retos del proyecto, sobre todo por las particularidades de muchos textos médicos, como son la narración esquemática o la mezcla de contextos temporales. Finalmente, la última consistió en poner en valor los resultados obtenidos mediante una serie de visualizaciones que permitieron reconstruir la cronología de la enfermedad del paciente y analizarla de forma más intuitiva.
El trabajo realizado buscaba ampliar el conocimiento global sobre el comportamiento de los CCR’s y profundizar en la patología para mejorar la atención a los pacientes con estos tumores. Con este proyecto, GMV y Azierta, aplicando tecnología de lenguaje natural, han proporcionado a los especialistas del Hospital Puerta de Hierro información de gran valor sobre: los procedimientos diagnósticos aplicados durante la fase de estudio; su curso evolutivo a lo largo de estos años, el abordaje de las diferentes pautas terapéuticas en función de las comorbilidades descritas por el propio paciente y su estilo de vida, entre otras cosas. Con Uquery, la herramienta de Procesamiento del Lenguaje Natural de GMV, se ha analizado y explotado la información clínica de pacientes con Carcinoma de Células Renales permitiendo construir la cronología de su enfermedad y poder llevar acabo nuevos abordajes clínicos.
Autor: Paloma López de Arenosa Barbeito. Científica de Datos de la División de Inteligencia Artificial y Big Data de GMV.