Medidas de Dispersão
Medidas de dispersão são parâmetros estatísticos usados para determinar o grau de variabilidade dos dados de um conjunto de valores.
A utilização desses parâmetros tornam a análise de uma amostra mais confiável, visto que as variáveis de tendência central (média, mediana, moda) muitas vezes encondem a homogeneidade ou não dos dados.
Por exemplo, vamos considerar que um animador de festas infantis selecione as atividades de acordo com a média das idades das crianças convidadas para uma festa.
Vamos considerar as idades de dois grupos de crianças que irão participar de duas festas diferentes:
- Festa A: 1 ano, 2 anos, 2 anos, 12 anos, 12 anos e 13 anos
- Festa B: 5 anos, 6 anos, 7 anos, 7 anos, 8 anos e 9 anos
Em ambos os casos, a média é igual a 7 anos de idade. Entretanto, ao observar as idades dos participantes podemos admitir que as atividades escolhidas sejam iguais?
Portanto, neste exemplo, a média não é uma medida eficiente, pois não indica o grau de dispersão dos dados.
As medidas de dispersão mais usadas são: amplitude, variância, desvio padrão e coeficiente de variação.
Amplitude
Essa medida de dispersão é definida como a diferença entre a maior e a menor observação de um conjunto de dados, isto é:
A = Xmaior - Xmenor
Por ser uma medida que não leva em consideração como os dados estão efetivamente distribuídos, não é muito utilizada.
Exemplo
O setor de controle de qualidade de uma empresa seleciona ao acaso peças de um lote. Quando a amplitude das medidas dos diâmetros das peças ultrapassa 0,8 cm o lote é rejeitado.
Considerando que em um lote foram encontrados os seguintes valores 2,1 cm; 2,0 cm; 2,2 cm; 2,9 cm; 2,4 cm, esse lote foi aprovado ou rejeitado?
Solução
Para calcular a amplitude, basta identificar o menor e o maior valores, que neste caso, são 2,0 cm e 2,9 cm. Calculando a amplitude, temos:
A = 2,9 - 2 = 0,9 cm
Nesta situação o lote foi rejeitado, pois a amplitude ultrapassou o valor limite.
Variância
A variância é determinada pela média dos quadrados das diferenças entre cada uma das observações e a média aritmética da amostra. O cálculo é feito com base na seguinte fórmula:
Sendo,
V: variância
xi: valor observado
MA: média aritmética da amostra
n: número de dados observados
Exemplo
Considerando as idades das crianças das duas festas indicadas anteriormente, vamos calcular a variância desses conjuntos de dados.
Festa A
Dados: 1 ano, 2 anos, 2 anos, 12 anos, 12 anos e 13 anos
Média:
Variância:
Festa B
Dados: 5 anos, 6 anos, 7 anos, 7 anos, 8 anos e 9 anos
Média:
Variância:
Observe que apesar da média ser igual, o valor da variância é bem diferente, ou seja, os dados do primeiro conjunto são bem mais heterogêneos.
Desvio Padrão
O desvio padrão é definido como a raiz quadrada da variância. Desta forma, a unidade de medida do desvio padrão será a mesma da unidade de medida dos dados, o que não acontece com a variância.
Assim, o desvio padrão é encontrado fazendo-se:
Quando todos os valores de uma amostra são iguais, o desvio padrão é igual a 0. Sendo que, quanto mais próximo de 0, menor é a dispersão dos dados.
Exemplo
Considerando ainda o exemplo anterior, vamos calcular o desvio padrão para as duas situações:
Agora, sabemos que a variação das idades do primeiro grupo em relação a média é de aproximadamente 5 anos, enquanto que a do segundo grupo é de apenas 1 ano.
Saiba mais sobre Variância e Desvio Padrão.
Coeficiente de Variação
Para encontrar o coeficiente de variação, devemos multiplicar o desvio padrão por 100 e dividir o resultado pela média. Essa medida é expressa em porcentagem.
O coeficiente de variação é utilizado quando precisamos comparar variáveis que apresentam médias diferentes.
Como o desvio padrão representa o quanto os dados estão dispersos em relação a uma média, ao comparar amostras com médias diferentes, a sua utilização pode gerar erros de interpretação.
Desta forma, ao confrontar dois conjuntos de dados, o mais homogêneo será aquele que apresentar menor coeficiente de variação.
Exemplo
Um professor aplicou uma prova para duas turmas e calculou a média e o desvio padrão das notas obtidas. Os valores encontrados estão na tabela abaixo.
Desvio Padrão | Média | |
---|---|---|
Turma 1 | 2,6 | 6,2 |
Turma 2 | 3,0 | 8,5 |
Com base nesses valores, determine o coeficiente de variação de cada turma e indique a turma mais homogênea.
Solução
Calculando o coeficiente de variação de cada turma, temos:
Desta forma, a turma mais homogênea é a turma 2, apesar de apresentar maior desvio padrão.
Exercícios Resolvidos
1) Em um dia de verão as temperaturas registradas em uma cidade ao longo de um dia estão apresentadas na tabela abaixo:
Horário | Temperatura | Horário | Temperatura | Horário | Temperatura | Horário | Temperatura |
---|---|---|---|---|---|---|---|
1 h | 19 ºC | 7 h | 16 ºC | 13 h | 24 ºC | 19 h | 23 ºC |
2 h | 18 ºC | 8 h | 18 ºC | 14 h | 25 ºC | 20 h | 22 ºC |
3 h | 17 ºC | 9 h | 19 ºC | 15 h | 26 ºC | 21 h | 20 ºC |
4 h | 17 ºC | 10 h | 21 ºC | 16 h | 27 ºC | 22 h | 19 ºC |
5 h | 16ºC | 11 h | 22 ºC | 17 h | 25 ºC | 23 h | 18 ºC |
6 h | 16 ºC | 12 h | 23 ºC | 18 h | 24 ºC | 0 h | 17 ºC |
Com base na tabela, indique o valor da amplitude térmica registrada neste dia.
2) O treinador de uma equipe de voleibol resolveu medir a altura dos jogadores da sua equipe e encontrou os seguintes valores: 1,86 m; 1,97 m; 1,78 m; 2,05 m; 1,91 m; 1,80 m. Em seguida, calculou a variância e o coeficiente de variação das alturas. Os valores aproximados foram respectivamente:
a) 0,08 m2 e 50%
b) 0,3 m e 0,5%
c) 0,0089 m2 e 4,97%
d) 0,1 m e 40%
Pratique com:
- Exercícios sobre medidas de dispersão
- Estatística - Exercícios
- Exercícios de Média, Moda e Mediana
- Exercícios sobre frequência absoluta e relativa
- Exercícios de Média Aritmética
Para saber mais sobre este tema, veja também:
GOUVEIA, Rosimar. Medidas de Dispersão. Toda Matéria, [s.d.]. Disponível em: https://www.todamateria.com.br/medidas-de-dispersao/. Acesso em: