P estatístico, pandemia, probabilidades, e a vida


Em estatística inferencial há um conceito muito interessante, o conceito de p estatístico. O p estatístico é uma probabilidade (ou seja varia de 0 a 1), e em suma é simplesmente um número que expressa a chance de que um dado efeito tenha ocorrido por acaso*. Isso tem implicações profundas, a lógica é: assumindo que esse tratamento não é eficaz contra esta doença, qual a chance de eu observar uma melhora como a observada em meus dados? A profundidade dessa lógica está no fato de que podemos nos enganar, podemos ver um efeito aparente, quando na realidade ele não existe. Podemos ver uma correlação em nossos dados, quando na realidade ela não existe (na natureza, além de nossos dados). E muitas pessoas com titulação acadêmica se enganam muito neste ponto, e induzem muitas pessoas leigas ao erro. 

Podemos notar isso observando o que ocorreu durante a Pandemia da Covid 19, em que aproximadamente de 90% a 99% das pessoas que contraiam a doença não vinham a óbito**. Embora uma parcela dos infectados tenha ficado com sequelas variadas, muitas a longo prazo, e até ainda pouco compreendidas, a maior parte apresentaria uma boa recuperação espontaneamente. 

Digamos que um médico que não sabe sobre p estatístico, tenha tratado 50 pacientes com um chá de uma erva que coletou na fazenda de sua tia. Todos os 50 ficam curados da Covid, nenhum veio a óbito. Qual a conclusão mais óbvia? que o chá tem 100% de eficácia, e salvou 50 vidas! (e  está errado, mas isto é o que muitos pensam). Vamos assumir que naquele momento a letalidade do vírus fosse de 1%. Ou seja, temos um fenômeno em que apenas 1% dos acometidos vem a óbito, 1% de 50 é 0,5, não existe 0,5 pessoas, ou seja, precisamos de pelo menos 100 pessoas para uma chance minimamente razoável de que uma viesse a óbito (e ainda não se trata de certeza, trata-se de probabilidade). Então, se de cada 100 pessoas, apenas uma viesse a óbito, o que nosso médico pensaria? "meu tratamento tem 99% de eficácia, pois tratei 100 pessoas em meu consultório lutando contra este vírus mortal, e salvei a vida de 99". E esse médico possivelmente gravaria vídeos e postaria nas redes sociais que "por experiência própria" ele sabia o que funcionava. Mas infelizmente não seria verdade, seu tratamento não teria absolutamente nenhuma eficácia, pois assumindo uma letalidade de 1%, 99% das pessoas acometidas pelo vírus se curariam. As pessoas poderiam estar tomando Coca-Cola ao invés do chá, e ainda assim, a maioria não viriam a óbito. E aqui vem a parte triste: se deixarmos milhões de pessoas se contaminarem, e as tratarmos com o suposto chá, o número de mortes seria idêntico ao que aconteceria sem qualquer chá, ou seja, ele não faz a menor diferença. E 1% de muita gente, é invariavelmente muita gente. Não só médicos, mas inúmeras autoridades públicas muito frequentemente se equivocam neste sentido.

E aí entra a importância do p estatístico, e de se desenvolver uma percepção probabilística de fenômenos. Imaginemos um experimento mental, onde estaríamos comparando as melhoras de dois grupos, um grupo controle (de pessoas que não recebem tratamento algum) e um grupo tratado com o chá.  Ao compararmos alguma variável chave de melhora clínica entre os dois grupos com um teste estatístico clássico de hipótese, o resultado mostraria um valor de p muitíssimo elevado, ou seja, o resultado nos diria: "assumindo que o chá não tem efeito, a probabilidade de encontrarmos um resultado como este é muito elevada". E isso já protegeria um médico de receitar algo que não funciona. E se um chá tivesse de fato efeito? aí o p estatístico seria muito, muito pequeno, muito menor que 1% (algo como p=0.00001 por exemplo), nesse caso a conclusão seria: assumindo que o chá não tem efeito, a chance de observarmos uma melhora como esta é muito menor que 1%, logo, o mais provável é que ele tenha sim efeito. E daí se seguiriam muitos outros testes clínicos.

Mas qual o problema em assumirmos que um medicamento faz efeito (ou que uma correlação qualquer exista) dado um valor de p estatístico elevado (digamos p=0.98), ou pior, sem qualquer p estatístico? é que a chance de estarmos cometendo um erro (mais precisamente um erro tipo 1, afirmar que há efeito quando não há) é grande. É bom ressaltarmos que não haviam experimentos controlados durante a pandemia, mas justamente por isto mesmo, a desconfiança sobre qualquer eficácia aparente deveria ser redobrada, e não relaxada, como ocorreu muito frequentemente.

Portanto, é muito importante termos uma intuição estatística probabilística (mesmo que rústica) sobre fenômenos. A falta desta percepção probabilística fez com que muitas pessoas fizessem coisas bem inusitadas durante a pandemia. Eu cheguei a ver amigos que são pessoas bem instruídas e sensatas, estranhamente andando com colares de magia, máquinas de gas ozônio, e outras coisas mais, afirmando categoricamente e as vezes arrogantemente: isso é eficaz contra a Covid, acredito porque  um amigo que conheço fez isto e ficou curado, e também um médico me sugeriu. Se tivessem a percepção probabilística das chances de serem falsos efeitos aparentes observados, eles entenderiam que: sim, o amigo ficou curado, mas claramente não foi por causa do colar, ou do gás, e o médico que lhe sugeriu isso, pouco ou nada sabia de estatística e de método científico, muito provavelmente.

E aqui alguém poderia argumentar de modo entusiasmado: "mas faz sentido, veja, o gás ozônio é letal para o vírus, o gás mata o vírus no ar, e também o gás entra no sangue, e mata o vírus, é perfeito, eu vou usar sim".

Uma lição que aprendemos com o p estatístico (e com o método científico) é que: coisas que fazem sentido lógico, não necessariamente são verdades, e são os dados de um experimento adequadamente estruturado para testar aquela ideia que definem isto. O que mais acontece em ciência são modelos matemáticos e conceituais perfeitamente lógicos, falharem miseravelmente ao serem confrontados com os dados. Ou seja, a seguinte sentença: "sim, é uma ideia e tanto, faz todo sentido, mas está errada, pois não funciona, não explica a realidade" é algo muito frequente na atividade científica. 

Isso implica que as supostas teorias criadas por pessoas com graus variados (por vezes duvidosos) de conhecimento sobre fisiologia, virologia ou química, de como o gás ozônio mataria o vírus, e inúmeras outras, embora fizessem algum sentido, não tinham e não têm qualquer suporte experimental. E muitas pessoas ignoravam e ignoram isto dizendo: "esses cientistas não sabem de nada, um amigo meu fez isso e está curado", ou então: "acredito na minha experiência pessoal", ou "respeite minha opinião sobre a eficácia de tal tratamento". É muito importante que as pessoas tenham opiniões respeitadas, ainda assim, ciência não é sobre opinião, não se trata de respeitar ou desrespeitar opiniões, se trata de testar predições com métodos adequados, e aqui o p estatístico e o pensamento probabilístico são ferramentas indispensáveis. Nem sempre o que vemos é realidade, mágicos ilusionistas sabem muito bem disto, e os dados neste sentido, se não adequadamente analisados, são como grandes mágicos ilusionistas.

Então, sempre que nos vermos diante de um fenômeno que queremos compreender, principalmente no sentido de causa e efeito, é muito importante nos perguntarmos: assumindo que não há efeito, qual a probabilidade de se observar um resultado assim? no caso do experimento do chá acima citado, a pergunta seria: assumindo que este chá da tia do médico não tem efeito, qual a probabilidade de que 50 pacientes que ele tratou com o chá ficassem curados? a resposta é: quase 100%, pois a letalidade do vírus sendo de 1%, a maior parte das pessoas vai se curar, seja com chá, seja com Coca-Cola, seja com água.

Assim, pensarmos em um número que nos indica a probabilidade de, assumindo que não há qualquer efeito, observamos um resultado como o encontrado, é algo de grande utilidade na busca de entendimento da relação causal entre fenômenos. Embora não seja uma ferramenta perfeita, nos auxilia, evitando que cometamos erros de conclusão, na ciência, e na vida.

 

*Veja: Nuzzo, R. Scientific method: Statistical errors. Nature 506, 150–152 (2014). https://doi.org/10.1038/506150a

** A letalidade variou ao longo do tempo na pandemia e também de acordo com a localidade, 1% é uma estimativa bastante razoável para o Brasil e diversos outros países em meados de 2021. Ver https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9874414/ para mais detalhamento.


 



Comentários