Um dedo apontando para a Lua: os perigos do abuso da estatística e da modelagem matemática por ecólogos

A Ecologia é uma ciência que mal entrou na idade adulta, se comparada a ciências mais antigas como a Astronomia, ou mais novas como a Computação.  Portanto, os ecólogos ainda estão tentando definir o seu espaço e delimitar o universo de interesse e as abordagens da sua comunidade. Nessa busca por uma identidade mais bem definida, alguns fenômenos peculiares acontecem. Por exemplo, o culto às abordagens quantitativas, fonte de muito atrito. Apesar de eu mesmo ser um fã dos números, aqui vou comentar um problema que julgo importante: o abuso de ferramentas matemáticas na Ecologia e suas conseqüências.

Many – perhaps most – of the great issues of science are qualitative, not quantitative, even in physics and chemistry. Equations and measurements are useful when and only when they are related to proof: but proof or disproof comes first and is in fact strongest when it is absolutely convincing without any quantitative measurement.” (Platt 1964, “Strong Inference”)

Ecólogos procuram entender relações entre seres vivos e destes com o meio onde vivem em diferentes níveis de complexidade, do gene ao bioma, usando uma enorme variedade de ferramentas. Muitas vezes atuamos na interface entre duas ou mais ciências. A escolha de ferramentas é ampla, mas uma delas é a preferida de nove entre dez ecólogos: a Estatística.

Os conceitos desenvolvidos pela Estatística, uma ciência independente que serve a várias outras, são especialmente apreciados pelos ecólogos contemporâneos, pois permitem analisar de forma eficiente montanhas de informações coletadas no campo, no laboratório ou a partir de bancos de dados. Isso é uma mão na roda, especialmente se considerarmos que muitos fenômenos ecológicos têm um caráter inerentemente quantitativo. Por exemplo, pensemos na seguinte pergunta: a produtividade primária influencia o número de espécies que vivem em um dado habitat? A resposta a essa pergunta não precisa ser necessariamente quantitativa, mas que ela pede uns numerozinhos, ah, isso pede. Em muitos casos, usando estatística como ferramenta, torna-se mais fácil criar previsões a partir de hipóteses ecológicas e testá-las de maneira formal. A modelagem matemática também caiu no gosto dos ecólogos, pois ela permite dar mais rigor a hipóteses e teorias, evitando  interpretações deturpadas, que são mais frequentes quando se expõe uma idéia apenas na forma discursiva, e facilitando a derivação de previsões testáveis. Por isso, a estatística e a modelagem tornaram-se uma febre entre ecólogos, tanto os mais empíricos, quanto os mais teóricos.

Mas será que um estudo ecológico precisa necessariamente de estatística ou modelagem para ser relevante? É claro que não! Essas são excelentes ferramentas que levam a abordagens muito interessantes. Algumas vezes, é preciso de fato trabalhar um problema ecológico de forma quantitativa. Só que também é possível propor e responder perguntas ecológicas interessantes com um olhar qualitativo. Especialmente quando se trata de um fenômeno novo ou pouco estudado, as abordagens qualitativas ajudam a abrir a estrada, a definir ângulos pelos quais o fenômeno pode ser pensado. Depois, quando já se sabe mais sobre o fenômeno, abordagens quantitativas podem ajudar a aprofundar o conhecimento e criar aplicações para ele. Um bom exemplo disso são estudos pioneiros que descreveram novos tipos de interações ecológicas, como o mutualismo entre aranhas e bromélias, a granivoria em morcegos ou a inclusão de espécies marinhas na dieta de anfíbios. Um estudo que apresenta um tipo completamente novo de interação não precisa ser necessariamente quantitativo. Pode-se dar essa abordagem, caso o autor ache interessante, mas ela não é necessária, pelo menos em um primeiro momento.

Além do uso desnecessário de abordagens quantitativas em estudos ecológicos, um outro problema muito comum hoje em dia é o mau uso da estatística. A grande maioria dos biólogos não tem muito talento para Matemática (não se sabe bem se isso é fruto de preguiça, costume ou viés cerebral). Para piorar, as disciplinas de cálculo e estatística para Biologia costumam ser oferecidas mal e porcamente em várias universidades, pois são vistas como “castigo” pelos colegas dos respectivos departamentos, já que os biólogos não mostram muito interesse por elas. Desta maneira, normalmente um biólogo acaba tendo um primeiro contato mais sério com a análise estatística apenas quando vai fazer um estágio e só aprende direito essa ferramenta na pós-graduação. Isso, quando aprende. O estudo da análise estatística acaba ocorrendo de maneira fragmentada, confusa, incompleta e, muitas vezes, errada. É o famoso fenômeno do “usei este índice porque meu orientador mandou”, também conhecido como “calculei assim porque todos fazem desse jeito”. Que confiabilidade tem uma análise feita por alguém sem perícia alguma?

Essa imperícia aumenta muito o poder da moda na escolha das análises estatísticas. Quando um determinado tipo de índice, análise ou abordagem está in, sendo usado em um grande número de artigos, muitos ecólogos acabam tratando essa abordagem como se fosse a única possível. Isso leva até mesmo à rejeição de artigos em revistas por revisores “nerds”, que só sabem repetir a mesma ladainha e idolatrar uma ferramentinha específica que aprenderam no último verão. Alguns chegam a exigir análises estatísticas mesmo quando as diferenças ou efeitos são óbvios e poderiam ser demonstrados apenas graficamente. É surreal ver como colegas ecólogos, que obviamente não são profissionais estatísticos, criticam análises corretas sem a menor fundamentação, simplesmente por as desconhecerem ou por acharem que só análises complicadas são sérias. É como um dedo apontando para a Lua: não se concentre no dedo, ou perderá toda a glória celestial!

O poder da moda é observado frequentemente na Ecologia, assim como em outras ciências. Basta lembrar das febres do índice de Shannon, da análise multivariada, das metapopulações, da fragmentação florestal, da teoria de redes, dos modelos lineares mistos e, mais recentemente, da seleção de modelos (ai, meu São Akaike!). Não que essas análises sejam ruins, muito pelo contrário, elas são ótimas para alguns fins. Mas não se pode usar um martelo para colocar um parafuso! Como dizem os ingleses, “a ferramenta certa para o trabalho certo“.

Às vezes a moda beira o ridículo. Por exemplo, quando em um estudo há apenas meia dúzia de variáveis e os autores, ao invés de usarem análises simples para entender qual influencia qual, tacam em cima dos dados uma equação estrutural seguida de seleção de modelos, deixando a tarefa de pensar sobre isso para o computador. Muitos ecológos não se dão ao trabalho nem mesmo de pensar em hipóteses e previsões ecológicas a serem testadas, ignorando às vezes uma literatura com séculos de informações relevantes. Eles apenas colocam uma montanha de dados no multiprocessador mágico conhecido como “R” e deixam para fazer todas as interpretações a posteriori. Onde fica a história natural?

Novamente, não que o R não seja bom. Ele é uma excelente ferramenta, que vale a pena ser explorada e usada, principalmente em situações onde o fenômeno de interesse é complexo e envolve diversas variáveis, ou em que análises adequadas a um determinado caso precisam ser adaptadas ou desenvolvidas do zero. A seleção de modelos, comentada anteriormente, é uma ferramenta excelente, que poderia ser muito mais bem aplicada, por exemplo, para operacionalizar a estratégia da “inferência forte”, como proposta por Chamberlin e Platt, a fim de desemaranhar hipóteses múltiplas. De qualquer forma, vale lembrar que artigos muitos brilhantes, publicados em revistas top como Nature e Science, às vezes usam análises extremamente simples para testar as predições propostas, como qui-quadrado ou regressão linear.

Meu chapa, o R não vai interpretar os dados sozinho. Isso cabe a você, que precisa construir um pano de fundo biológico com muito cuidado! Se o seu trabalho sobre interações não tiver hipóteses biológicas claras e convincentes, não vai ser uma modelagem baseada na teoria de redes que vai salvá-lo do limbo bibliográfico. Mesmo que o seu trabalho tenha um contexto claro e uma boa justificativa, ainda é preciso que ele tenha um bom planejamento experimental, senão fica impossível definir até mesmo qual análise seria a mais adequada. Não adianta encher o artigo com resultados de testes e valores de P, ou com um belo modelo nulo, se uma pseudo-replicação mandar tudo por água abaixo. O mais engraçado é que muitos ecólogos se perdem em discussões tolas sobre a normalidade ou homocedasticidade dos dados, mas se esquecem de que o pressuposto mais importante de qualquer teste estatístico, no fundo, é a independência das observações. Não há teste ou correção que salvem dados mal coletados! Outro erro mais banal ainda, porém muito comum, é coletar dados de menos, por não pensar sobre o poder estatístico mínimo aceitável para a análise escolhida.

Para concluir, repito a máxima: “a ferramenta certa para o trabalho certo”. Quando for planejar o seu trabalho, pense bem se a melhor escolha é uma abordagem qualitativa ou quantitativa. Se optar pelo caminho matemático, escolha com muito cuidado as análises que vai usar. De preferência, consulte colegas que tenham boa experiência com cada abordagem. Quando for rodar uma análise muito cabeluda, consulte também matemáticos e estatísticos. Ecólogos não precisam fazer uma graduação em Estatística para rodar um teste t, mas precisam, sim, estudar o suficiente para se tornarem usuários competentes da ferramenta.

Sugestões de leitura:

Aprenda com o Grande Mestre:

Anúncios

16 respostas para “Um dedo apontando para a Lua: os perigos do abuso da estatística e da modelagem matemática por ecólogos”

  1. Eu tive um artigo nao aceito porque nao usei estimadores de riqueza e argumentei, nao preciso usar, os graficos e tabelas respondem a minha pergunta. O editor nao aceitou e tivemos que incluir a analise. Eu nao era o primeiro autor e se fosse, teria negado mudar a analise. Todos usam chao1, jacknife mas….. pergunte quais as diferenças nas formulas e as consequencias disso, ninguem sabe…

    1. Julio, já passei por isso também… Infelizmente, como em toda cultura humana, a ciência também tem suas modas e, atualmente, as pessoas cultuam cegamente as análises quantitativas. Elas são, sim, ótimas ferramentas. Mas, se usadas sem critério, podem produzir ficção biológica…

  2. Até o Mick Crawley, autor entre outros do The R Book, acostuma dizerq que, provavelmente, u 80% das perguntas em ecologia podem responderse com um simples chi-quadrado se a pergunta está bem formulada e os dados sao os certos. Muito bom post, Marco.

    1. Obrigado, Joaquin. Pois é, geralmente esses grandes caras que desenvolvem as análises mais maneiras são muito mais cuidadosos do que a maioria dos usuários. O cara que desenvolveu o pacote SEM para R (de equações estruturais e seleção de modelos) diz a mesma coisa, algo como “não deixe a tarefa de construir o modelo para o computador, se você conhecer bem o seu sistema”.

  3. Interessante o texto, mas infelizmente nenhuma boa revista aceita trabalhos sem abordagem quantitativa (mesmo uma regressãozinha), a menos que seja algo extremamente inédito, o que não é sempre que temos em mãos. Acho que mais eficaz do que “duvidarmos” da importância da estatística nas ciências biológicas, é investir na melhoria das disciplinas de estatística e de matemática aplicadas à biologia durante a graduação. Assim é possível formar pessoal que saiba usar de fato essas ferramentas valiosas.

    1. Oi Vitor, concordo contigo. Não duvido da importância da estatística, muito pelo contrário, eu adoro usá-la nos meus trabalhos. Eu desconfio é de revisores que, apesar de serem ecólogos, se acham experts em estatística e se metem a criticar análises sem base alguma. Geralmente, exigem que você complique uma análise adequada, porém “simples demais”. Também adoram criticar análises antigas e exigir que só se façam as novas, mesmo quando as antigas são perfeitamente adequadas. Desconfio também dos ecólogos que saem apertando botões em programas, sem terem a menor idéia sobre os fundamentos de cada índice que estão calculando. Isso é gritante no caso dos índices de estimativa de riqueza de espécies em comunidades; é muito chute e muita moda nessa área. É uma pena que trabalhos qualitativos estejam tão desvalorizados na Ecologia; grandes insights já surgiram de trabalhos sem matemática alguma.

    1. Com certeza, Nena! Isso eu aprendi aí na UERJ. Primeiro olho a matriz, depois olho o gráfico e só então faço a análise matemática.

Deixe um comentário

Faça o login usando um destes métodos para comentar:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s