Section outline
-
-
Quando eu estava na escola, eu me perguntava:
“Já não basta aprender a média? Por que complicar inventando essa tal de moda e mediana?”
Parecia que era só para dificultar. Mas depois percebi que essas outras medidas são muito úteis! E para mostrar isso, vou dar um exemplo bem claro —aqui abaixo- baseado no item 3 do capítulo anterior: médias podem ser enganosas.Primeiro vamos ver as definições
1. Média:
-
Pode ser usada para calcular o preço médio de peças de roupa em uma coleção. Basta somar todos os valores e dividir pelo número de peças.
-
Sensível a valores extremos (ex.: um vestido de luxo caro eleva a média).
2. Moda
-
É o valor que mais aparece em um conjunto de dados
-
Útil quando há outliers (ex.: poucas peças muito caras não afetam a mediana).
Outliers seriam os pontos “fora da curva” que ficam muito afastados.
Como calcular a moda
🔸 Exemplo 1 – Sem repetição:
dados = [3, 7, 1, 9, 4]
-
Cada número aparece uma vez → sem moda
🔸 Exemplo 2 – Com repetição:
dados = [3, 7, 3, 1, 4]
-
O número 3 aparece 2 vezes → moda = 3
3. Mediana:
-
Representa o valor do meio (ex.: mediana de tamanhos mostra o ponto central, ignorando extremos).
-
Também útil quando há outliers (ex.: poucas peças muito caras não afetam a mediana).
Como calcular a mediana
🔹 1. Organize os dados em ordem crescente.
Exemplo:
[7, 2, 9, 4, 6]
→ fica:[2, 4, 6, 7, 9]
🔹 2. Veja se o número de dados é ímpar ou par:
-
Se for ímpar, a mediana é o número do meio.
Exemplo:[2, 4, 6, 7, 9]
→ 5 números → o 3º número é a mediana → 6 -
Se for par, a mediana é a média dos dois números do meio.
Exemplo:[2, 4, 6, 8]
→ 4 números → os dois do meio são 4 e 6
Mediana = (4 + 6) ÷ 2 = 5
EXEMPLOS usando Pyhton
A vantagem de produzir estes resultados via computador, como feito aqui, é que se pode variá-los o quanto quiser e ver o que sai! Assim é mais fácil de entender as ideias que estão por trás.... Na próxima seção mostrarei como você pode fazer isso por conta propria. De momento darei exemplos:
Data: [1, 1, 1, 1, 99, 99, 99, 99] Média: 50.0 Mediana: 50.0 Moda(s): [1, 99]
perceba que se 2 números aparecem com a mesma quantidade de repetições, há duas modas!
Data: [1, 1, 1, 1, 99, 99, 99, 99, 99] Média: 55.44444444444444 Mediana: 99.0 Moda(s): [99]
Data: [1, 2, 3, 4, 5] Média: 3.0 Mediana: 3.0 Moda(s): não temData: [1, 2, 3, 3, 4, 5] Média: 3.0 Mediana: 3.0 Moda(s): [3]
Podemos mandar o computador calcular conjuntos maiores, Nesse caso o computador vai gerar o input (Data) usando o comando de criação de números aleatórios(mais detalhes na próxima seção):
Numeros aleatórios: [13 30 10 13 2 3 16 52 28 39 50 29 46 87 50 88 49 46 60 38] Números ordenados: [ 2 3 10 13 13 16 28 29 30 38 39 46 46 49 50 50 52 60 87 88] Mean: 37.45 Median: 38.5 Mode(s): [13, 46, 50]
Perceba que os numeros , após criados, são ordenados para facilitar a observação da mediana.
📊Exemplo baseado no item 3 do capítulo anterior: médias podem ser enganosas.
Imagine uma empresa em que 30 funcionarios ganham 1500 reais por mês e 5 funcionários ganham 200 mil por mês. O que seria mais adequado para se ter uma ideia da distribuição de salários, a média ou a moda e a mediana?
Teríamos o seguinte output do programa:
Data: [1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 1500, 200000, 200000, 200000, 200000, 200000] Média: 29857.14285714286 Mediana: 1500.0 Moda(s): [1500]
Perceba que a média é próxima de 30 mil reais, o que não reflete a situação salarial da maioria. A mediana e a moda fornecem um resultado melhor neste caso: 1500 reais -
-