A moda das médias e medianas
Hoje replicamos o artigo que escrevemos para o nosso colega Out-of-The-Box, talvez o melhor blogue de finanças e imobiliário, sobre a moda das médias e medianas:
"
“Dois amigos vão ao restaurante e pedem um frango. Um só comeu uma asa, o outro comeu o resto do frango. De acordo com a estatística, aqueles dois indivíduos comeram, em média, meio frango cada um.”
Permitam-me o desabafo, mas estou a ficar saturado de ouvir falar, no imobiliário, de médias e medianas, sem mais nenhuma explicação!
Assim, de repente, lembro-me que o INE publica, por exemplo, os valores médios das avaliações bancárias e os valores medianos das rendas e das vendas. Da mesma forma, o sítio da internet “finder.com” publicou o preço médio de um apartamento T2 em Portugal, localizado no centro da cidade de Lisboa.
Uma análise superficial destas métricas permite títulos jornalísticos fantásticos, com impacto, mas que, verdadeiramente, não passam de frases que induzem em erro a opinião pública. Ainda mais grave é o aproveitamento que se faz daqueles conceitos, conforme o jeito que dá!
Daí, a metáfora no início do artigo!
Bem, mas afinal o que é a média e o que é a mediana?
A média e a mediana são duas medidas da tendência central de uma amostra. A média corresponde à divisão entre a soma de todos os valores das observações de uma amostra pela quantidade de elementos da amostra. Por outro lado, a mediana define-se como sendo o valor em que metade dos valores da amostra se situa acima deste valor e a outra metade se situa abaixo.
Estas duas medidas, apesar de fáceis de estimar, sem o acompanhamento de medidas de dispersão, podem conduzir a leituras muito erradas.
A média é uma medida de tendência central que, por uniformizar os valores de um conjunto de dados, não representa fielmente os conjuntos que revelam tendências extremas, ou seja, é muito influenciada pelos valores extremos de um conjunto.
Permite apenas uma descrição incompleta da distribuição, por não fornecer informações a respeito do número de casos que estão acima ou abaixo do valor da média aritmética nem informações do valor mais frequente de uma amostra (moda).
Por seu lado, a mediana flutua mais de amostra para amostra do que a média aritmética, sendo, portanto, menos confiável. Não utiliza a totalidade dos dados, a mediana apenas depende do valor central que em certos casos, quando existe uma grande dispersão de resultados, não demonstra verdadeiramente a realidade.
A mediana é também um valor posicional, que não vem definido por uma expressão matemática, não permitindo, portanto, um tratamento algébrico. Não é possível calcular a mediana de um grupo total a partir das medianas de dois subgrupos. É também muito difícil de estimar para grande volume de dados.
Se somente nos é fornecida uma das medidas de tendência central, como é que podemos saber se um conjunto de dados tem uma distribuição simétrica ou assimétrica à esquerda ou à direita?
Numa distribuição simétrica, a média coincide com a mediana e com a moda, sendo um valor representativo da amostra. Numa distribuição assimétrica, normalmente não deve ser escolhida para a representar.
O poder central pretende implementar legislação que dê benefícios fiscais aos senhorios de promovam contratos de arrendamento de longa duração. A sua base de trabalho, ao que consta no mercado, assentará no valor das medianas dos contratos de arrendamento obtidas pelo INE. A análise da simetria de uma amostra poderá ser muito importante para os senhorios decidirem se aceitam ou não esta oferta de incentivos fiscais.
Por estes motivos, achamos importante divulgar, com a informação da média ou da mediana, uma medida de dispersão muito importante, que é o desvio padrão.
O desvio padrão é uma medida estatística de dispersão que deve ser usada conjuntamente com a média. O desvio padrão dá-nos a informação sobre até que ponto os dados de uma determinada amostra se afastam da média.
Conjuntamente com o conceito de desvio padrão, existe a noção de coeficiente de variação, que não é menos que a relação entre o desvio padrão e a média de uma amostra.
Quando estamos na presença de dois conjuntos de dados que apresentam iguais médias e necessitamos de saber qual deles apresenta a menor variabilidade, utilizamos o cálculo da medida de dispersão coeficiente de variação.
No caso do quadro acima apresentado, ambas as amostras têm a mesma média. No entanto, a amostra A tem uma dispersão menor, com um desvio padrão e um coeficiente de variação que são 50% dos que se verificam na amostra B. É aceitável que se considere uma baixa dispersão quando o coeficiente de variação é inferior a 15%.
Se pretendemos mais transparência no mercado imobiliário, também devemos ser mais transparentes na informação que lhe prestamos!
Se pretendemos mais transparência no mercado imobiliário, também devemos ser mais transparentes na informação que lhe prestamos!
"
Sem comentários: