Os perigos do abuso da estatística e da modelagem matemática por ecólogos

As análises quantitativas, como tudo na vida, têm uma dualidade yin-yang. Vamos falar mais sobre isso.

A Ecologia é uma ciência que mal entrou na idade adulta, se comparada a ciências mais antigas como a Astronomia, ou mais novas como a Computação.  Portanto, os ecólogos ainda estão tentando definir o seu espaço e delimitar o universo de interesse e as abordagens da sua comunidade.

Nessa busca por uma identidade mais bem definida, alguns fenômenos peculiares acontecem. Por exemplo, o culto às abordagens quantitativas, fonte de muito atrito. Apesar de eu mesmo ser um fã dos números, aqui vou comentar um problema que julgo importante: o abuso de ferramentas matemáticas na Ecologia e suas conseqüências.

Many – perhaps most – of the great issues of science are qualitative, not quantitative, even in physics and chemistry. Equations and measurements are useful when and only when they are related to proof: but proof or disproof comes first and is in fact strongest when it is absolutely convincing without any quantitative measurement.”

Platt 1964, “Strong Inference”

Ecólogos procuram entender relações entre seres vivos e destes com o meio onde vivem. Isso, em diferentes níveis de complexidade, do gene ao bioma, usando uma enorme variedade de ferramentas. Muitas vezes atuamos na interface entre duas ou mais ciências. A escolha de ferramentas é ampla, mas uma delas é a preferida de nove entre dez ecólogos: a Estatística.

Os conceitos desenvolvidos pela Estatística, uma ciência independente que serve a várias outras, são especialmente apreciados pelos ecólogos contemporâneos. Eles nos permitem analisar de forma eficiente montanhas de informações coletadas no campo, no laboratório ou a partir de bancos de dados. Isso é uma mão na roda, especialmente se considerarmos que muitos fenômenos ecológicos têm um caráter inerentemente quantitativo.

Por exemplo, pensemos na seguinte pergunta: a produtividade primária influencia o número de espécies que vivem em um dado habitat? A resposta a essa pergunta não precisa ser necessariamente quantitativa, mas que ela pede uns numerozinhos, ah, isso pede.

Em muitos casos, usando estatística como ferramenta, torna-se mais fácil criar previsões a partir de hipóteses ecológicas e testá-las de maneira formal. A modelagem matemática também caiu no gosto dos ecólogos, pois ela permite dar mais rigor a hipóteses e teorias, evitando  interpretações deturpadas. Esse telefone sem fio é mais frequente, quando se expõe uma idéia apenas na forma discursiva. Por isso, a estatística e a modelagem tornaram-se uma febre entre ecólogos, tanto os mais empíricos, quanto os mais teóricos.

“Mas, Marco, um estudo ecológico precisa necessariamente de estatística ou modelagem para ser relevante?”

É claro que não, meu caro aspira! Essas são excelentes ferramentas que levam a abordagens muito interessantes. Algumas vezes, é preciso de fato trabalhar um problema ecológico de forma quantitativa. Só que também é possível propor e responder perguntas ecológicas interessantes com um olhar qualitativo.

Especialmente quando se trata de um fenômeno novo ou pouco estudado, as abordagens qualitativas ajudam a abrir a estrada, a definir ângulos pelos quais o fenômeno pode ser pensado. Depois, quando já se sabe mais sobre o fenômeno, abordagens quantitativas podem ajudar a aprofundar o conhecimento e criar aplicações para ele.

Um bom exemplo disso são estudos pioneiros que descreveram novos tipos de interações ecológicas, como o mutualismo entre aranhas e bromélias, a granivoria em morcegos ou a inclusão de espécies marinhas na dieta de anfíbios. Um estudo que apresenta um tipo completamente novo de interação não precisa ser necessariamente quantitativo. Pode-se dar essa abordagem, caso o autor ache interessante, mas ela não é necessária, pelo menos em um primeiro momento.

Além do uso desnecessário de abordagens quantitativas em estudos ecológicos, um outro problema muito comum hoje em dia é o mau uso da estatística. A grande maioria dos biólogos não tem muita habilidade com os números. Não se sabe ao certo se isso é fruto de viés cerebral ou falhas na formação. Para piorar, as disciplinas de cálculo e estatística para biólogos costumam ser oferecidas mal e porcamente em várias universidades. Elas são vistas como “castigo” pelos colegas dos respectivos departamentos, já que os biólogos não mostram muito interesse por elas.

Desta maneira, normalmente um biólogo acaba tendo um primeiro contato mais sério com a análise estatística apenas quando vai fazer um estágio. E só aprende direito essa ferramenta na pós-graduação. Isso, quando aprende. O estudo da análise estatística acaba ocorrendo de maneira fragmentada, confusa, incompleta e, muitas vezes, errada. É o famoso fenômeno do “usei este índice porque meu orientador mandou”, também conhecido como “calculei assim porque todos fazem desse jeito”. Que confiabilidade tem uma análise feita por alguém sem perícia alguma?

Essa imperícia aumenta muito o poder da moda na escolha das análises estatísticas. Quando um determinado tipo de índice, análise ou abordagem está in, sendo usado em um grande número de artigos, muitos ecólogos acabam tratando essa abordagem como se fosse a única possível.

Isso leva até mesmo à rejeição de artigos em revistas por revisores bitolados, que só sabem repetir a mesma ladainha e idolatrar uma ferramenta específica que aprenderam no último verão. Alguns chegam a exigir análises estatísticas mesmo quando as diferenças ou efeitos são óbvios e poderiam ser demonstrados apenas graficamente.

É surreal ver como colegas ecólogos, que obviamente não são profissionais estatísticos, criticam análises corretas sem a menor fundamentação, simplesmente por as desconhecerem ou por acharem que só análises complicadas são sérias.

“É como um dedo apontando para a Lua: não se concentre no dedo, ou perderá toda a glória celestial!”

Bruce Lee, parafraseando Lao-Tsu

O poder da moda é observado frequentemente na Ecologia, assim como em outras ciências biológicas. Basta lembrar das febres do índice de Shannon, da análise multivariada, das metapopulações, da fragmentação florestal, da teoria de redes, dos modelos lineares mistos e, mais recentemente, da seleção de modelos (ai, meu São Akaike!). Não que essas análises sejam ruins, muito pelo contrário, elas são ótimas para os respectivos fins. Mas não se pode usar um martelo para colocar um parafuso!

“A ferramenta certa para o trabalho certo“.

Sabedoria popular inglesa

Às vezes a moda beira o ridículo. Por exemplo, quando em um estudo há apenas meia dúzia de variáveis. Ao invés de usarem análises simples para entender qual influencia qual, os autores tacam em cima dos dados uma equação estrutural seguida de seleção de modelos, deixando a tarefa de pensar sobre isso para o computador.

Muitos ecológos não se dão ao trabalho nem mesmo de pensar em hipóteses e previsões ecológicas a serem testadas, ignorando às vezes uma literatura com séculos de informações relevantes. Eles apenas colocam uma montanha de dados no multiprocessador mágico conhecido como “R” e deixam para fazer todas as interpretações a posteriori. Onde fica a história natural?

Novamente, não que o R não seja bom. Ele é uma ferramenta excelente, que vale a pena ser explorada e usada, tanto para análises corriqueiras, quanto para análises que precisam ser adaptadas ou desenvolvidas do zero. A seleção de modelos, comentada anteriormente, também é uma ferramenta excelente, que poderia ser muito mais bem aplicada, por exemplo, para operacionalizar a estratégia da “inferência forte”, como proposta por Chamberlin e Platt, a fim de desemaranhar hipóteses múltiplas.

De qualquer forma, vale lembrar ainda que artigos brilhantes, publicados em revistas top como Nature e Science, às vezes usam análises extremamente simples para testar as predições propostas, como qui-quadrado ou regressão linear.

Meu caro aspira, o R, o Python ou a Julia não vão interpretar os dados sozinhos. Isso cabe a você, que precisa construir um pano de fundo biológico com muito cuidado! Se o seu trabalho sobre interações, por exemplo, não tiver hipóteses biológicas claras e convincentes, não vai ser uma modelagem baseada na teoria de redes que vai salvá-lo do limbo bibliográfico.

Mesmo que o seu trabalho tenha um contexto claro e uma boa justificativa, ainda é preciso que ele tenha um bom planejamento experimental, senão fica impossível definir até mesmo qual análise seria a mais adequada. Não adianta encher o artigo com resultados de testes e valores de P, ou com um belo modelo nulo, se uma pseudo-replicação mandar tudo por água abaixo.

O mais engraçado é que muitos ecólogos se perdem em discussões tolas sobre a normalidade ou homocedasticidade dos dados, mas se esquecem de que o pressuposto mais importante de qualquer teste estatístico, no fundo, é a independência das observações. Não há teste ou correção que salvem dados mal coletados!

Outro erro mais banal ainda, porém muito comum, é coletar dados de menos, por não pensar sobre o poder estatístico mínimo aceitável para a análise escolhida.

Para concluir, repito a sabedoria popular inglesa: “a ferramenta certa para o trabalho certo”. Quando for planejar o seu trabalho, pense bem se a melhor escolha é uma abordagem qualitativa ou quantitativa. Se optar pelo caminho matemático, escolha com muito cuidado as análises que vai usar. De preferência, consulte colegas que tenham boa experiência com cada abordagem. Quando for rodar uma análise muito cabeluda, consulte também matemáticos e estatísticos.

Ecólogos não precisam fazer uma segunda graduação em Estatística para rodarem um teste t. Mas precisam, sim, estudar o suficiente para se tornarem usuários competentes da ferramenta.

Sugestões de leitura:

  1. On the Appropriate Use of Statistics in Ecology: an interview with Ben Bolker
  2. Great scientists don’t need math
  3. Yes, statistical errors are slowing down scientific progress!
  4. Lack of quantitative training among early-career ecologists: a survey of the problem and potential solutions
  5. Paths to statistical fluency for ecologists
  6. Ecologists need to do a better job of prediction – part I – the insidious evils of ANOVA
  7. Why are your statistical models more complex these days?

Aprenda com o Grande Mestre:

(Fonte da imagem destacada)

21 respostas para “Os perigos do abuso da estatística e da modelagem matemática por ecólogos”

  1. Eu tive um artigo nao aceito porque nao usei estimadores de riqueza e argumentei, nao preciso usar, os graficos e tabelas respondem a minha pergunta. O editor nao aceitou e tivemos que incluir a analise. Eu nao era o primeiro autor e se fosse, teria negado mudar a analise. Todos usam chao1, jacknife mas….. pergunte quais as diferenças nas formulas e as consequencias disso, ninguem sabe…

    Curtir

    1. Julio, já passei por isso também… Infelizmente, como em toda cultura humana, a ciência também tem suas modas e, atualmente, as pessoas cultuam cegamente as análises quantitativas. Elas são, sim, ótimas ferramentas. Mas, se usadas sem critério, podem produzir ficção biológica…

      Curtir

  2. Até o Mick Crawley, autor entre outros do The R Book, acostuma dizerq que, provavelmente, u 80% das perguntas em ecologia podem responderse com um simples chi-quadrado se a pergunta está bem formulada e os dados sao os certos. Muito bom post, Marco.

    Curtir

    1. Obrigado, Joaquin. Pois é, geralmente esses grandes caras que desenvolvem as análises mais maneiras são muito mais cuidadosos do que a maioria dos usuários. O cara que desenvolveu o pacote SEM para R (de equações estruturais e seleção de modelos) diz a mesma coisa, algo como “não deixe a tarefa de construir o modelo para o computador, se você conhecer bem o seu sistema”.

      Curtir

  3. Interessante o texto, mas infelizmente nenhuma boa revista aceita trabalhos sem abordagem quantitativa (mesmo uma regressãozinha), a menos que seja algo extremamente inédito, o que não é sempre que temos em mãos. Acho que mais eficaz do que “duvidarmos” da importância da estatística nas ciências biológicas, é investir na melhoria das disciplinas de estatística e de matemática aplicadas à biologia durante a graduação. Assim é possível formar pessoal que saiba usar de fato essas ferramentas valiosas.

    Curtir

    1. Oi Vitor, concordo contigo. Não duvido da importância da estatística, muito pelo contrário, eu adoro usá-la nos meus trabalhos. Eu desconfio é de revisores que, apesar de serem ecólogos, se acham experts em estatística e se metem a criticar análises sem base alguma. Geralmente, exigem que você complique uma análise adequada, porém “simples demais”. Também adoram criticar análises antigas e exigir que só se façam as novas, mesmo quando as antigas são perfeitamente adequadas. Desconfio também dos ecólogos que saem apertando botões em programas, sem terem a menor idéia sobre os fundamentos de cada índice que estão calculando. Isso é gritante no caso dos índices de estimativa de riqueza de espécies em comunidades; é muito chute e muita moda nessa área. É uma pena que trabalhos qualitativos estejam tão desvalorizados na Ecologia; grandes insights já surgiram de trabalhos sem matemática alguma.

      Curtir

Deixe um comentário

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.