Autor: Paloma López de Arenosa Barbeito. Danolog w Dziale Sztucznej Inteligencji i Danych typu Big Data w GMV

A quantidade de dados que geramos cresceu a um ritmo exponencial durante os últimos anos, e um dos principais contribuintes a este fenómeno é o setor sanitário. No entanto, uma cada vez maior proporção dessa informação é estruturada, como é o caso os textos. É difícil que uma máquina compreenda e extraia valor de forma automática a partir deles, uma vez que a linguagem humana é muito complexa. Para ultrapassar este obstáculo, entram em jogo as tecnologias de Processamento de Linguagem Natural.

Aplicando esta tecnologias, e com a assessoria médica da Azierta, a GMV conseguiu a estruturação de dados textuais sanitários para facilitar a análise e exploração de informação clínica de pacientes com Carcinoma de Células Renais (CCR), procurando oferecer-lhes tratamentos personalizados. Isso não teria sido possível sem a inestimável colaboração de Joaquín Carballido Rodríguez, Chefe do Serviço de Urologia do Hospital Universitário Puerta de Hierro de Madrid, de onde procedem os dados de quase 600 pacientes com neoplasias malignas renais compilados ao longo de dez anos. Foi possível interpretar e explorar os formulários, relatórios e notas médicas com tecnologias de processamento natural da GMV e o conhecimento do doutor e investigador Eduardo Ródenas e da sua equipa.

O desenvolvimento constou de 3 fases claramente diferenciadas. Durante a primeira, gerou-se uma ontologia do Carcinoma de Células Renais, que permite representar o conhecimento pertinente sobre este âmbito mediante a definição de entidades relevantes. sintomas, provas médicas, tratamentos, etc., e as interações entre elas. Foram também definidos uma série de conceitos relevantes cujos valores podem ser interessantes (por exemplo, escala ECOG ou o número de plaquetas no sangue).

Na segunda fase, realizou-se a extração de conhecimento útil a partir dos textos, para o qual a equipa da GMV se apoiou em uQuery, uma ferramenta de desenho próprio orientada para o processamento da linguagem natural. Graças a ela, localizaram-se nos dados os conceitos e padrões previamente definidos, podendo abordar-se problemáticas comuns associadas ao tratamento de linguagem natural, como são a gestão do género ou das negações, muito comuns em textos médicos. Durante esta fase procurou-se também atribuir um contexto temporário às descobertas realizadas, de modo que pudessem ser posteriormente ordenadas de forma cronológica. Isso representou um dos grandes desafios do projeto, sobretudo pelas particularidades de muitos textos médicos, como são a narração esquemática ou a mistura de contextos temporários. Finalmente, a última consistiu em avaliar os resultados obtidos mediante uma série de visualizações que permitiram reconstruir a cronologia da doença do paciente e analisá-la de forma mais intuitiva.

O trabalho realizado procurava ampliar o conhecimento global sobre o comportamento dos CCR e aprofundar na patologia para melhorar a atenção aos pacientes com estes tumores. Com este projeto, a GMV e a Azierta, aplicando tecnologia de linguagem natural, proporcionaram aos especialistas do Hospital Puerta de Hierro informação de grande valor sobre: os procedimentos diagnósticos aplicados durante a fase de estudo, o seu curso evolutivo ao longo destes anos, a abordagem das diferentes pautas terapêuticas em função das comorbidades descritas pelo próprio paciente e o seu estilo de vida, entre outras coisas. Com UQuery, a ferramenta de Processamento da Linguagem Natural da GMV, analisou-se e explorou-se a informação clínica de pacientes com Carcinoma de Células Renais, permitindo construir a cronologia da sua doença e poder levar a cabo novas abordagens clínicas.

Autor: Paloma López de Arenosa Barbeito. Cientista de Dados da Divisão de Inteligência Artificial e Big Data da GMV.

Adicionar novo comentário

Imprimir