Section outline

    • A Importância da Estatística no Mundo Atual

      A estatística é fundamental para compreendermos o mundo ao nosso redor. Ela não se restringe à matemática: está presente em todas as áreas do conhecimento. Para termos confiança nos resultados de qualquer observação ou experimento, é necessário repetir várias vezes o mesmo procedimento. É justamente a estatística que nos ajuda a analisar esses dados e entender o que eles realmente estão nos dizendo.

      Por isso, a estatística é amplamente utilizada não apenas nas ciências exatas, mas também nas ciências biológicas e humanas. Ela permite tomar decisões com base em evidências e identificar padrões em meio à incerteza.

      Além do uso científico, é importante compreender estatística no dia a dia. Muitas vezes, ela é usada para manipular ou distorcer informações, especialmente em propagandas ou discursos políticos. Saber interpretar dados estatísticos nos torna cidadãos mais críticos e conscientes.

      🎯 Como identificar estatísticas enganosas na media ou na publicidade

      Reconhecer estatísticas enganosas é uma competência essencial — e pode ser bastante interessante de explorar com alunos ou em discussões críticas. Eis alguns dos truques mais comuns, com exemplos que podes usar:


      📈 1. Falta de referência (valor base)

      Truque: “As vendas aumentaram 50%!”
      O que falta? Aumentaram de quanto para quanto? Se passaram de 2 para 3 unidades, é de facto 50% — mas o número total continua a ser muito pequeno.

      Pergunta crítica: “50% de quê?”


      📉 2. Eixos manipulados ou truncados

      Truque: Gráficos de barras ou linhas onde o eixo Y não começa no zero, fazendo pequenas diferenças parecerem grandes.

      Exemplo:
      Se o eixo Y começa nos 90 em vez de 0, uma mudança de 91 para 93 parece enorme.

      Sugestão: Verifica sempre a escala dos eixos — o visual corresponde aos números?


      📊 3. Médias enganosas

      Truque: Usar a média aritmética quando a mediana seria mais representativa (especialmente se há valores extremos).

      Exemplo:
      “A empresa paga, em média, 70.000 € por ano.”
      Mas a maioria dos trabalhadores recebe 10.000 € — apenas os diretores ganham milhões.

      Discussão útil: Diferença entre média, mediana e moda — e quando usar cada uma.


      🔗 4. Confundir correlação com causalidade

       

      Termo Significado
      Correlação É uma relação estatística entre duas variáveis. Elas se movimentam juntas, mas uma não necessariamente causa a outra.
      Causalidade Quando um evento ou variável causa diretamente a mudança na outra.

      Exemplos de correlação (sem causalidade)

      1. Vendas de sorvete ↔ Afogamentos
      • Correlação: Ambos aumentam no verão.

      • Sem causalidade: O calor causa o aumento de ambos, separadamente.

      2. Número de igrejas ↔ Taxa de criminalidade
      • Cidades grandes têm mais igrejas e mais crimes — mas o real fator é o  tamanho da população.

      Exemplo de Causalidade

      Casos em que uma coisa claramente causa a outra.

      1. Fumar → Câncer de pulmão
      • Causalidade: O fumo danifica os pulmões e aumenta o risco de câncer.

      • Comprovado por mecanismos biológicos e estudos de longo prazo.


      📏 5. Amostras muito pequenas

      Truque: “80% das pessoas preferem o nosso produto!”
      Mas o inquérito foi feito a... 5 pessoas.

      Pergunta crítica: Quantas pessoas participaram? Foi uma amostra representativa?


      🧮 6. Seleção parcial dos dados (cherry-picking)

      Truque: Mostrar só uma parte da linha temporal que favorece uma tendência.

      Exemplo: Um gráfico mostra crescimento de 2020 a 2021, mas omite a queda em 2022.

      Recomendação: Procura ver a tendência completa, não apenas trechos favoráveis.


      🥧 7. Percentagens que não somam 100%

      Truque: Gráficos de setores (pizza) ou inquéritos onde a soma ultrapassa os 100%.

      Verifica: As percentagens batem certo? As categorias sobrepõem-se?

    • O livro Bad Pharma, de Ben Goldacre, descreve em detalhe muitos truques usados na área médico-farmacêutica para facilitar a provação de uma nova droga, por exemplo, ou tratamento. A table abaixo apresenta um resumo:

       

      📊 Tabela: Enganos Estatísticos em Pesquisa Médica 

      Tipo de Manipulação Explicação Exemplo Simples
      1 Viés de Publicação Estudos com resultados negativos não são publicados. 5 estudos negativos + 1 positivo → só o positivo é publicado.
      2 P-hacking Testes múltiplos até encontrar p < 0.05 por acaso. Tenta 20 análises → 1 parece “significativa” por sorte.
      3 Tamanho de amostra pequeno Pequenos estudos mostram flutuações grandes por acaso. Estudo com 10 pessoas mostra efeito forte, mas não se repete com 100.
      4 Encerramento precoce de estudo Interrompe estudo cedo quando resultados ainda estão instáveis. Para o estudo ao ver melhora temporária → superestima o benefício.
      5 Risco relativo vs. absoluto Apresenta redução de risco relativa (grande) sem contexto absoluto. “50% menos risco” = de 2% para 1% (só 1% de diferença real).
      6 Comparações não representativas Compara com placebo ou dose ineficaz de concorrente. Novo remédio comparado com placebo, mesmo existindo tratamento eficaz.
      7 Seleção de subgrupos Só reporta subgrupos com bons resultados (pós-estudo). Medicamento “funciona para mulheres de 52 anos” → achado por acaso.
      8 Ocultação de dados brutos Dados completos não são divulgados → impossível verificar. Apenas resultados resumidos em artigo → não se pode repetir a análise.
      9 Meta-análises enviesadas Incluem só estudos positivos ou patrocinados pela indústria. Revisão inclui apenas estudos da própria empresa farmacêutica.
      10 Regressão à média mal interpretada Melhora natural é atribuída ao tratamento. Paciente com pressão alta melhora naturalmente → parece efeito do remédio.
    • 🎯 O que é p-hacking (ou data dredging)?

      É a prática de realizar vários testes estatísticos diferentes até encontrar p < 0,05 — ou seja, um resultado considerado estatisticamente significativo por acaso.


      🧪 Exemplo típico:

      Um pesquisador testa 20 variáveis para ver se há relação com um certo efeito. Mesmo que nenhuma tenha efeito real, estatisticamente, 1 em 20 pode dar p < 0,05 apenas por sorte (erro do tipo I).

      Poderia ser um estudo de várias frutas para ver se alguma pode ajudar a tratar algum problema, digamos, glaucoma ou falta de atenção nos estudos.

      De 20 frutas, percebemos que apenas uma oferece uma melhora de mais de 5% nos resultados, e então publicamos apenas o estudo desta fruta em particular e escondemos os outros estudos que não ofereceram uma melhora nem de 5% (o que seria uma tática do tipo I-viés de publicação). “Graviola melhora a concentração em estudantes” já seria uma possível manchete de jornal , até mesmo um mais técnico sobre escolas. Perceba que 5% é um limite até baixo (low bar) para uma droga farmacêutica. Deveríamos esperar uma proporção maior de casos em que se observa melhora. Talvez 20 % seria razoável esperar? Eu acho que sim.

      O ponto é que um estudo que ofereça mais de 5% de melhoras ( p < 0,05) já é tratado como tendo um resultado positivo e pode ser publicado num jornal médico.

      🧪 Exemplo 2

      A Crise de Replicação na Psicologia

      • Em 2015, um projeto tentou replicar 100 estudos de psicologia: só 39% tiveram os mesmos resultados.

      • Causa Principal: P-hacking + viés de publicação (revistas preferem resultados "positivos").