Quantis para dados agrupados por valor ou dados em rol

por Vítor Menezes em 07/07/2015
Existe uma série de diferentes medidas separatrizes, também chamadas de quantis:
  • mediana
  • quartis
  • decis
  • percentis
  • etc
 
No nosso curso de estatística aqui no TEC, vimos que, para dados agrupados por valor ou em rol, há uma série de dificuldades para se determinar medidas separatrizes. A determinação exata dos quantis, nesses casos, depende de alguma regra arbitrariamente escolhida.
 
Nós até estudamos especificamente o cálculo da mediana e dos quartis. Quanto às demais, deixamos de lado, porque não são cobradas em prova (*). Nós vimos que, no caso da mediana, tomamos sempre o valor central da série (caso tenhamos quantidade ímpar de elementos), ou a média entre os termos centrais (caso a quantidade seja par). 
 
O detalhe, que não foi abordado em nosso curso, é que existe sim uma forma sistemática de cálculo de qualquer medida separatriz para dados em rol/agrupados por valor. Nós só não abordamos esse método porque ele, infelizmente, não é cobrado em provas.
 
Apenas para não passar batido, vou mostrar nesse artigo como funciona a metodologia.
 
Como exemplo, considere o seguinte conjunto de dados:
 
2, 3, 3, 4, 4, 5, 6, 6, 6, 7, 7, 9, 11, 11, 12, 13, 13, 13, 13, 15
 
Para determinar os quantis, a gente trabalha com a função que passa pelos pontos:
 
X_i, \, {i-0,5 \over n}
 
Em que X_i representa o i-ésimo elemento e "n" indica o número de dados. No nosso exemplo, n = 20.
 
Exemplo. O primeiro termo vale 2. Logo:
 
X_1=2
 
{i-0,5 \over 20} = {1-0,5 \over 20} = 0,025
 
Esta função nada mais é que uma adaptação da frequência relativa acumulada.
 
Na tabela abaixo eu resumo os resultados:
 
i X_i i-0,5 \over 20
1 2 0,025
2 3 0,075
3 3 0,125
4 4 0,175
5 4 0,225
6 5 0,275
7 6 0,325
8 6 0,375
9 6 0,425
10 7 0,475
11 7 0,525
12 9 0,575
13 11 0,625
14 11 0,675
15 12 0,725
16 13 0,775
17 13 0,825
18 13 0,875
19 13 0,925
20 15 0,975
 
Pronto, feito isso, o próximo passo é aplicar a interpolação linear, exatamente como fazemos para dados em classe.
 
Exemplo: a mediana é o valor que corresponde a 0,5 (=50%). Só que 0,5 não tem na tabela acima. Fazemos interpolação linear considerando os valores vizinhos a 0,5. Ou seja, considerando que o primeiro 7 corresponde a 0,475 e o segundo 7 corresponde a 0,525.
Fazendo interpolação linear, obtém-se que a mediana é igual a 7.

O primeiro quartil é o valor que corresponde a 0,25 (=25%). Só que 0,25 não tem na coluna de freqüências relativas acumuladas adaptadas. Consideramos, novamente, os valores vizinhos. Consideramos que o segundo 4 corresponde a 0,225 e 5 corresponde a 0,275.

Fazendo interpolação linear, descobrimos que o primeiro quartil é igual a 4,5. Vejam:
 
{Q_1 - 4 \over 0,25-0,225} = {5-4 \over 0,275-0,225}
 
{Q_1 - 4 \over 0,025} = {1 \over 0,05} \to Q_1 = 4,5
 
E com esse mesmo raciocínio poderíamos descobrir qualquer outra medida separatriz.
 
E fica o alerta: nunca vi isso sendo cobrado em prova, por isso nunca abordei isso em curso algum. Mas fica aí a informação de que há uma forma sistemática para cálculo de qualquer medida separatriz, ainda que os dados estejam em rol ou agrupados por valor.

(*) Não confundir com medidas separatrizes para dados em classe - isso sim, algo que é extremamente frequente em provas
 
 
Deixe seu comentário:
Ocorreu um erro na requisição, tente executar a operação novamente.