Como fazer uma nuvem de palavras

Múltiplas ideias têm rondado a sua mente? Está difícil sumarizar os conceitos que guiam o seu projeto? Que tal aprender a fazer uma nuvem de palavras usando alguns códigos bem legais no R?

O que é uma nuvem de palavras?

Recentemente, soltei um post sobre inteligência artificial e o uso de processamento de linguagem natural (NPL) no combate à pandemia de COVID-19. A capa desse post era uma nuvem de palavras, ou seja, uma lista de palavras arranjadas de maneira a evidenciar as mais mencionadas em um texto.

Nuvens de palavras são utilizadas como ferramenta para visualização de dados de linguagem natural. Quanto maior a palavra, mais citada ela foi no texto de entrada. Juntamente com infográficos, gráficos elegantes e relatórios interativos e em tempo real, as nuvens de palavras fazem parte da incrível evolução na ciência da visualização de dados.

Quer aprender a fazer uma nuvem de palavras? Então siga comigo!

Há diversas aplicações para uma nuvem de palavras

Nuvens de palavras são úteis para análise de texto, pois podem evidenciar trending topics, ou seja, qual temas que recebem grande atenção. Você também pode usar uma nuvem de palavras para analisar a sua trajetória acadêmica, por exemplo, tomando como base o seu currículo.

Veja uma nuvem de palavras feita nesta plataforma, usando os títulos dos meus artigos científicos publicados até o momento:

nuvem titulos
Nuvem de palavras feita com os títulos dos meus artigos preparados e publicados.

As nuvens de palavras também podem ser super úteis para avaliar rapidamente as ideias de alunos em uma turma. Por exemplo, se a professora quiser entender o que vem à mente da turma, quando ela é estimulada a pensar em um dado objeto, pessoa, lugar ou conceito. Para esse uso didático eu recomendo muito o Mentimeter, que cria nuvem de palavras em tempo real de acordo com a participação dos alunos em uma aula ou do público em uma palestra.

Como fazer uma nuvem de palavras no R?

Nuvens de palavras também podem ser feitas manualmente usando diferentes critérios (por exemplo, uma representação artística). Ou podem ser feitas automaticamente utilizando apps em sites (semi-supervisionada) ou por programação. Por exemplo, para gerar o post sobre inteligência artificial eu usei um site gratuito que gera nuvens de palavras bem legais.

Mas vocês sabem como eu amo o R, né? E sabem também que há diversas vantagens em aprender a fazer análises e gráficos por programação, né?

Bom, como muitos dos nossos leitores não são fluentes em R, resolvi escrever este post. Quero ajudar vocês a fazerem nuvens de palavras bonitas, além de exportá-las como imagens de alta resolução ou em HTML para serem usadas de diferentes formas.

Prepare-se

Para o código de hoje, usei o próprio post sobre inteligência artificial, baixado diretamente do R. Olha só que legal, você vai aprender a minerar textos da internet e fazer nuvens de palavras, tudo de uma vez só! 🙂

Para criar uma nuvem de palavras no R, você precisa baixar e instalar os programas R e RStudio no seu computador. Além disso, você vai precisar de diversos pacotes do R para diferentes funções. Você pode acessar o código e utilizá-lo à vontade. Como? Veja a seguir!

GitHub

Para facilitar o compartilhamento do código com vocês, utilizei a plataforma GitHub, como de costume aqui no blog.

O Git é um sistema de controle de versões (VCS) e o GitHub é uma interface gráfica desse sistema na internet. Além de controlar versões, o GitHub é excelente para compartilhar códigos e fazer trabalhos colaborativos. Isso porque ele nos ajuda a criar códigos reproduzíveis em diferentes dispositivos, que podem ser rodados por diferentes pessoas, gerando os mesmos resultados. Ou seja, o GitHub é um grande aliado da reprodutibilidade, crucial na Ciência!

Além disso, ele permite que diferentes usuários proponham correções e melhorias aos códigos alheios através dos chamados pull requests. É assim que, por exemplo, o Marco, o Alexandre e eu trabalhamos juntos nas nossas análises estatísticas e também nos scripts que disponibilizamos aqui no blog!

Caso você já tenha o R e o RStudio instalados no seu computador, clique neste link e faça download do repositório, seguindo as instruções dadas no README. Se você tiver intimidade com Git, pode até fazer um fork do repositório.

Se você tiver dúvidas, pode comentar aqui no post ou abrir uma issue lá no GitHub. O resultado final do código é este aqui:

nuvem2
Nuvem de palavras feita com o pacote wordcloud2 no R.

Sumarizando o que vimos neste post:

  1. Uma nuvem de palavras evidencia quais palavras foram mais mencionadas em um texto;
  2. Nuvens de palavras são uma maneira gráfica de sumarizar informação, ajudar a ter insights, fazer brainstorms, comunicar e decorar ambientes de criação com palavras que ilustram percepções, valores, tendências e metas;
  3. Nuvens de palavras podem ser usadas, por exemplo, para sumarizar o que você fez em um projeto concluído ou o que espera de um projeto em andamento;
  4. Nuvens de palavras podem ser feitas de diferentes maneiras, como por exemplo, no Wordclouds.com, no Mentimeter (interativo) ou no R.

Mais leituras

Este post faz parte do pacote sobre figuras lançado recentemente aqui no blog. Ele também faz parte do pacote sobre data science.

4 respostas para “Como fazer uma nuvem de palavras”

  1. Obrigada, Renata!
    Suas postagens são ótimas e instigantes.
    Atenciosamente

    Profa. Ilma Saramago de Souza
    Doutora em Educação
    (67) 99924-9943

    ________________________________

Deixe um comentário

Faça o login usando um destes métodos para comentar:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.