Pandemia do novo coronavírus: Parte 6 e inteligência artificial (NLP)

O novo coronavírus chegou e mudou o mundo. Quarentenas, quase um milhão de mortes oficiais e restrições severas à movimentação. Empregos perdidos, vacinas em desenvolvimento ultra-acelerado. Crise e oportunidade. Como digerir fatos e tendências em meio a um tsunami de informações? Como pesar as evidências pró e contra um tratamento ou uma vacina? Como avaliar o que se sabe até agora sobre a COVID-19? Descubra neste novo post da nossa série sobre a pandemia.

Sim, já é humanamente impossível ficar a par das atualizações científicas sobre a COVID-19. Novas descobertas, reportadas em centenas de papers e preprints, tem saído todo dia.

Não é exagero. Somente este ano, já foram publicados mais de 189 mil artigos relacionados à COVID-19. Isso tudo e mais de 170 vacinas em diferentes fases de teste. Isso quer dizer que mais de 800 artigos tem sido publicados diariamente. O bom é que hoje em dia contamos com ferramentas computacionais que podem nos dar uma mão para digerir esse banquete de informação.  

Por exemplo, a inteligência artificial (IA, em português e no resto to texto, ou AI ou artificial intelligence, em inglês) e seus ramos podem nos ajudar a processar e filtrar o que há de relevante para ser analisado dentro desse tópico em crescimento exponencial. Isso pode ser feito através da análise de textos, rastreamento em tempo real, geração automática de relatórios e análises de risco.

A inteligência artificial e seus ramos

Aqui vou explicar conceitos relacionados a essas áreas que podem nos ajudar a fazer ciência e resolver problemas na era da pandemia.

A IA é uma área da ciência que se propõe a desenvolver dispositivos providos de inteligência, baseados na capacidade de raciocinar, sentir ou detectar sinais, resolver problemas, e dar seguimento a processos com base em decisões inteligentes. Na primeira metade do século XX, um paper de Alan Turing trazia a ideia de que máquinas poderiam resolver problemas e tomar decisões. Nesse artigo, o pai da computação discutiu como tais máquinas poderiam ser desenvolvidas e como a inteligência delas poderia ser testada.

Assim, a IA transita entre a ciência da computação, a ciência cognitiva e as engenharias. Já o aprendizado de máquinas (mais conhecido como machine learning ou ML, em inglês) é uma subárea da IA que inclui técnicas estatísticas para permitir que máquinas aperfeiçoem ao máximo suas tarefas com base na experiência (ou conhecimento a priori).

Dentro do machine learning temos ainda o aprendizado profundo (deep learning), que é um conjunto de processamento multicamada baseado em redes neurais com muitíssimos dados sendo processados e interagindo entre essas redes.

Em interface com o aprendizado de máquina e aprendizado profundo nós temos o estudo de processamento de linguagem natural (PLN, mais conhecido como NLP, em inglês: natural language processing, e por conta disso, vou usar NLP ao long do texto). Essa subárea busca compreender, simular e prever automaticamente a linguagem humana (objeto de estudo da linguística). Interessante, né? Em um diagrama de Venn, as relações entre essas áreas ficam assim:

Post_NPL

Só de ver esse diagrama e descrições gerais dos conceitos, você já imagina quanta coisa dá pra discutir e aprender no mundo da inteligência artificial, incluindo muitos medos e esperanças!

Neste post, vamos focar na análise automática de textos que pode ser feita utilizando NLP. Ela pode ser útil para tradução e interpretação, elaboração de perguntas e respostas em interfaces do tipo “tira-dúvidas”, sumarização de textos, e criação de legendas para figuras ou filmes, dentre muitas outras aplicações.

Dá até pra fazer análise da disseminação de informações, sentimentos, fofocas e rumores. A fofoca é algo muito importante nas sociedades humanas. Por exemplo, entender como ela se dispersa e como pessoas mudam de opinião pode levar à manipulação da opinião pública, alterando o rumo de uma eleição.

A NLP pode ainda ajudar a preencher a lacuna que existe atualmente entre ciências sociais, epidemiologia e inteligência artificial. Desde 1950, a pesquisa em IA tem aumentado muito. Entretanto, algumas áreas da ciência não têm incorporado elementos de IA, o que poderia ajudar a resolver muitos problemas. Por exemplo, isso pode ajudar a compreender as inúmeras facetas da pandemia vigente.

Então como a NLP ajuda profissionais a lidarem com a pandemia?

Uma variedade de aplicações

Análise de sentimentos, análise de texto ou NLP podem ser utilizadas para medir o comportamento do público em análises de cultura e tendências. Além disso, processos multi-fatoriais, como o diagnóstico de uma doença ou uma tomada rápida de decisão, podem ser auxiliados por NLP e ML. A análise rápida de sintomas e condições (ter ou não ter COVID-19, por exemplo) também auxilia profissionais da saúde a “ligar os pontos” e calcular a incidência esperada de COVID-19 nos níveis populacional e individual.

Engatinhando em NLP

Uma ferramenta simples que pode ser considerada como o primeiro passo para engatinhar em NLP são as fofas nuvens de palavras, como a que eu postei na capa do post. Para gerá-la, é só jogar um texto num website ou programa e ver quais são as palavras mais utilizadas nesse texto, que vão aparecer maiores que as palavras menos citadas na nuvem. Nuvens de palavras podem nos ajudar a ter insights diversos e também a comunicar os resultados de um projeto.

Quais as tendências e o que se comenta por aí?

Uma das coisas que têm sido feitas nessa pandemia é utilizar NLP para compreender a opinião pública e sumarizar as tendências de discussões sobre COVID-19. Isso é feito através da técnica conhecida como deep sentiment classification. Esse tipo de análise pode mostrar como as pessoas estão aderindo a ideia de usar máscaras, por exemplo, o que pode ajudar tomadores de decisão a desenvolver forma de conscientização mais eficientes.

Com o aumento exponencial da COVID-19 e dos estudos sobre a pandemia, ficou complicado se atualizar na literatura científica. Por isso, ferramentas de NLP podem nos ajudar a minerar o que vale a pena ser lido, ou extrair alguma informação alvo que é necessária para compreender tópicos ou resolver problemas.

Plataformas para exploração de textos da literatura acadêmica também têm sido desenvolvidas, incluindo iniciativas open incríveis, como a iKnow. O iKnow é uma plataforma que junta um montão de artigos científicos sobre a COVID-19 e permite ao usuário fazer uma exploração de dados por NLP direto no navegador. Caso você queira experimentar, confira nesse link. Você também pode baixar uma demo aqui.

Outras iniciativas open disponibilizam ferramentas que podem auxiliar nas análises baseadas em NLP, como dicionários ou conjuntos de padrões tipicamente utilizados na linguagem médica e epidemiológica, como neste preprint. Nele os autores disponibilizaram uma caixa de ferramentas de NLP para análise do conhecimento publicado sobre a COVID-19 em bases de periódicos importantes, como MedRxiv, OMS, Wiley, CDC e muitas outras (como bases não-acadêmicas, tipo Twitter). Parte dessa grande colaboração inclui o COVID-graph, que junta o que se sabe de COVID-19 até o momento e plota em mapas mentais muito úteis utilizando ferramentas de visualização de dados avançadas e IA. Confira aqui, é super legal!

A ajuda da inteligência artificial pode vir também na forma de programas que conversam com você e tiram suas dúvidas. Isso é especialmente relevante quando muitas fake news atrapalham a compreensão sobre um tema, como o que está acontecendo com a COVID-19. A iniciativa CoronaAI, da Universidade Estadual de Londrina, permite que o usuário interaja com o “Agente Inteligente CoronaAI” e tire dúvidas sobre a COVID-19. Veja a seguir como o AI respondeu minha dúvida:

corona AI
Chat com CORONA AI, iniciativa da UEL, Londrina, Paraná.

Os agentes AI são imperfeitos, mas podem ser aperfeiçoados com o tempo, conforme mais inputs de informação e e mais dados de treino são aplicados a eles. Veja como o AI respondeu a minha pergunta imperfeitamente, porém sem sair do tópico, quando eu perguntei quando teremos uma vacina:

vacina
Chat com um agente de inteligência artificial que utiliza NLP para responder perguntas sobre COVID-19.

Outra ferramenta superinteressante é a CLAMP, que ajuda a extrair padrões a partir de notas clínicas escritas por profissionais da saúde. Essa ferramenta de IA  usa NLP para identificar sintomas típicos da COVID-19, sua severidade e outras características essenciais para o diagnóstico e tratamento dos pacientes.

Quando isso é aplicado a milhares de notas clínicas, vários padrões podem ser avaliados ao mesmo tempo, coisa que seria impossível (ou um processo longo e extenuante) para um humano olhando nota por nota. Essa ferramenta tem sido utilizada por diferentes organizações de saúde para processar o enorme volume de notas clínicas publicadas diariamente por conta da pandemia.

Hoje mais do que nunca podemos ver a conexão entre ecologia, economia e saúde humana. Essa conexão tem sido chamada de one health ou saúde única. Vemos uma grande reação em cadeia acontecendo no mundo, com processos acontecendo em diversas escalas, que levam a um grande impacto global.

Precisamos enfrentar a crise com ferramentas poderosas e precisamos dar um passo adiante na maneira como fazemos ciência. Nunca soubemos tanto sobre um vírus, mas esse tanto não foi suficiente para evitar 1 milhão de mortes até o momento. Que nós possamos, um dia de cada vez, aplicar a IA cada vez melhor nas nossas pesquisas!

Resumindo este post introdutório sobre IA e NLP, temos que:

  1. Um dos principais ramos da inteligência artificial e da linguística é o processamento de linguagem natural (NLP, do inglês: natural language processing).
  2. NLP tem sido utilizado para auxiliar profissionais da saúde a acompanhar e quantificar padrões em notas clínicas.
  3. NLP é de grande valia para tirar dúvidas rapidamente, principalmente quando há muitas fake news atrapalhando a comunicação.
  4. NLP pode nos ajudar a fazer cienciometria e a ligar áreas que necessitam de integração (como na iniciativa One Health).
  5. IA e NLP nos ajudam diariamente a entender padrões e resolver problemas em sistemas complexos.

Agradecimentos

Agradeço ao Marco e ao Alê pela revisão do texto e ao Ricardo Cerri pelas discussões.

Para saber mais:

  1. Turing (1950)
  2. The History of Artificial Intelligence
  3. Conversa com Bial sobre o futuro da tradução literária
  4. The Games That AI Won
  5. A Inteligência Artificial hoje: dados, treinamento e inferência

 

2 respostas para “Pandemia do novo coronavírus: Parte 6 e inteligência artificial (NLP)”

Deixe um comentário

Faça o login usando um destes métodos para comentar:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.