Section outline

    • Quando eu estava na escola, eu me perguntava:
      “Já não basta aprender a média? Por que complicar inventando essa tal de moda e mediana?”
      Parecia que era só para dificultar. Mas depois percebi que essas outras medidas são muito úteis! E para mostrar isso, vou dar um exemplo bem claro —aqui abaixo-  baseado no item 3 do capítulo anterior: médias podem ser enganosas.

      Primeiro vamos ver as definições 

       

      1. Média:

      • Pode ser usada para calcular o preço médio de peças de roupa em uma coleção. Basta somar todos os valores e dividir pelo número de peças.

      • Sensível a valores extremos (ex.: um vestido de luxo caro eleva a média).

      2. Moda

      • É o valor que mais aparece em um conjunto de dados

      • Útil quando há outliers (ex.: poucas peças muito caras não afetam a mediana).

      Outliers seriam os pontos “fora da curva” que ficam muito afastados.

      Como calcular a moda

      🔸 Exemplo 1 – Sem repetição:
       
      dados = [3, 7, 1, 9, 4]
      • Cada número aparece uma vezsem moda

      🔸 Exemplo 2 – Com repetição:
       
      dados = [3, 7, 3, 1, 4]
      • O número 3 aparece 2 vezesmoda = 3

      3. Mediana:

      • Representa o valor do meio (ex.: mediana de tamanhos mostra o ponto central, ignorando extremos).

      • Também útil quando há outliers (ex.: poucas peças muito caras não afetam a mediana).

      Como calcular a mediana
      🔹 1. Organize os dados em ordem crescente.

      Exemplo:
      [7, 2, 9, 4, 6] → fica: [2, 4, 6, 7, 9]

      🔹 2. Veja se o número de dados é ímpar ou par:
      • Se for ímpar, a mediana é o número do meio.
        Exemplo:
        [2, 4, 6, 7, 9] → 5 números → o 3º número é a mediana → 6

      • Se for par, a mediana é a média dos dois números do meio.
        Exemplo:
        [2, 4, 6, 8] → 4 números → os dois do meio são 4 e 6
        Mediana = (4 + 6) ÷ 2 = 5

      EXEMPLOS usando Pyhton

      A vantagem de produzir estes resultados via computador, como feito aqui, é que se pode variá-los o quanto quiser e ver o que sai! Assim é mais fácil de entender as ideias que estão por trás.... Na próxima seção mostrarei como você pode fazer isso por conta propria. De momento darei exemplos:

      Data: [1, 1, 1, 1, 99, 99, 99, 99]
      Média: 50.0
      Mediana: 50.0
      Moda(s): [1, 99]

      perceba que se 2 números aparecem com a mesma quantidade de repetições, há duas modas!


      Data: [1, 1, 1, 1, 99, 99, 99, 99, 99] Média: 55.44444444444444 Mediana: 99.0 Moda(s): [99]


      Data: [1, 2, 3, 4, 5] Média: 3.0 Mediana: 3.0 Moda(s): não tem

      Data: [1, 2, 3, 3, 4, 5]
      Média: 3.0
      Mediana: 3.0
      Moda(s): [3]

      Podemos mandar o computador calcular conjuntos maiores, Nesse caso o computador vai gerar o input (Data) usando o comando de criação de números aleatórios(mais detalhes na próxima seção):

      Numeros aleatórios: [13 30 10 13 2 3 16 52 28 39 50 29 46 87 50 88 49 46 60 38] Números ordenados: [ 2 3 10 13 13 16 28 29 30 38 39 46 46 49 50 50 52 60 87 88] Mean: 37.45 Median: 38.5 Mode(s): [13, 46, 50]

      Perceba que os numeros , após criados, são ordenados para facilitar a observação da mediana.


      📊Exemplo baseado no item 3 do capítulo anterior: médias podem ser enganosas.

      Imagine uma empresa em que 30 funcionarios ganham 1500 reais por mês e 5 funcionários ganham 200 mil por mês. O que seria mais adequado para se ter uma ideia da distribuição de salários, a média ou a moda e a mediana?

      Teríamos o seguinte output do programa:

      Data: [1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 200000, 200000, 200000, 200000, 200000] Média: 29857.14285714286 Mediana: 1500.0 Moda(s): [1500]

      Perceba que a média é próxima de 30 mil reais, o que não reflete a situação salarial da maioria. A mediana e a moda fornecem um resultado melhor neste caso: 1500 reais