Saneamento da Amostra na avaliação de imóveis
Apresentamos o último de nove artigos gentilmente disponibilizados pelo Eng. Mário Pinho Miranda, que versam uma temática muito importante para a abordagem de mercado, a inferência estatística. A literatura disponível para o perito avaliador de imóveis certificado sobre a inferência estatística aplicada à avaliação imobiliária é escassa.
Agradeço muito a colaboração prestada do Eng. Mário Pinho de Miranda, dizendo ainda que a porta estará sempre aberta para quando achar que deve usar este espaço.
Os oito primeiros artigos foram:
-A Amostra na Regressão Linear;
-A Capacidade Explicativa do Modelo
-A Significância Estatística de um Modelo de Regressão Linear
-Análise de Resíduos na avaliação de um modelo de regressão linear
-Variáveis Qualitativas na avaliação de imóveis
-Modelos Não-Lineares na avaliação de imóveis
-Seleção de regressores na avaliação imobiliária
-Intervalos de confiança na avaliação imobiliária
9 – Saneamento da Amostra
Mário Pinho Miranda
Resumo
O saneamento da amostra visa limpá-la das observações que
perturbam o modelo. Os valores que os elementos amostrais perturbadores trazem
para a análise são os valores suspeitos («outliers») e os valores
influenciadores.
1. Introdução
A regressão linear é muito sensível a valores das variáveis
explicadas que se afastem muito do conjunto médio dos seus valores, tornando
obrigatório o saneamento da amostra sempre que isso aconteça. Devem considerar-se
dois tipos diferentes de valores incomuns:
1.
Valores suspeitos, atípicos ou «outliers»;
2.
Valores influenciadores.
Vejamos em que consiste cada um deles.
2. Valores Suspeitos
Entende-se por valores suspeitos, atípicos ou «outliers»
aqueles cujos resíduos são muito grandes e muito divergentes da maioria.
Resíduos padronizados fora do intervalo [-2;2] podem considerar-se suspeitos em amostras
pequenas (amostras de dimensão n <=20). Contudo, a
eliminação imediata dos itens cujos valores não respeitem esta regra pode ser
imprudente porque pode corresponder a situações em que a população de onde as
amostras são extraídas tenha uma distribuição diferente da normal. Reforça-se a
importância da análise dos gráficos de resíduos.
Na Figura 1 os elementos da amostra com os números #5 e #9
reúnem condições para serem considerados suspeitos porque os seus resíduos
padronizados são superiores a 2 embora n = 25 > 20.
Uma vez que um elemento seja considerado suspeito deverá ser
eliminado da amostra. Tenha--se em atenção que, por vezes, a eliminação dum
elemento suspeito promove outros elementos a esta categoria!
3. Valores Influenciadores
Os valores influenciadores são aqueles que, embora com
pequenos resíduos, correspondem a elementos da amostra cujos valores da
variável explicativa são muito diferentes dos da restante amostra,
influenciando desse modo a regressão.
A Figura
2
demonstra a existência de uma observação – elemento influenciador – cuja
área é muito superior às áreas dos restantes elementos da amostra as quais se
concentram entre os valores 150 e 200 m2. Se esse elemento for
retirado da amostra obtém-se o gráfico da Figura 3.
Comparando estes dois gráficos conclui-se que, na presença do elemento
influenciador (Figura 2),
a regressão dos preços sobre as áreas apresenta uma boa capacidade explicativa
(R2=0,62) mas, ao ser eliminado esse elemento (Figura 3),
a capacidade explicativa da regressão regride muito (R2 = 0,14). É
óbvio que este tipo de elementos, que são denunciados com o recurso a estes
gráficos, devem ser eliminados da amostra.
|
4. Referências
[1] |
M. P. MIRANDA e R. S.
CAMPOSINHOS, Avaliação Imobiliária, Porto: Edição dos Autores, 2022. |
Sem comentários: