Saneamento da Amostra na avaliação de imóveis

Apresentamos o último de nove artigos gentilmente disponibilizados pelo Eng. Mário Pinho Miranda, que versam uma temática muito importante para a abordagem de mercado, a inferência estatística. A literatura disponível para o perito avaliador de imóveis certificado sobre a inferência estatística aplicada à avaliação imobiliária é escassa.

Agradeço muito a colaboração prestada do Eng. Mário Pinho de Miranda, dizendo ainda que a porta estará sempre aberta para quando achar que deve usar este espaço.



Os oito primeiros artigos foram:


-A Amostra na Regressão Linear;

-A Capacidade Explicativa do Modelo

-A Significância Estatística de um Modelo de Regressão Linear

-Análise de Resíduos na avaliação de um modelo de regressão linear

-Variáveis Qualitativas na avaliação de imóveis

-Modelos Não-Lineares na avaliação de imóveis

-Seleção de regressores na avaliação imobiliária

-Intervalos de confiança na avaliação imobiliária



9 – Saneamento da Amostra

 

Mário Pinho Miranda

 

Resumo

O saneamento da amostra visa limpá-la das observações que perturbam o modelo. Os valores que os elementos amostrais perturbadores trazem para a análise são os valores suspeitosoutliers») e os valores influenciadores.


1. Introdução


A regressão linear é muito sensível a valores das variáveis explicadas que se afastem muito do conjunto médio dos seus valores, tornando obrigatório o saneamento da amostra sempre que isso aconteça. Devem considerar-se dois tipos diferentes de valores incomuns:

1.    Valores suspeitos, atípicos ou «outliers»;

2.    Valores influenciadores.

Vejamos em que consiste cada um deles.


2. Valores Suspeitos


Entende-se por valores suspeitos, atípicos ou «outliers» aqueles cujos resíduos são muito grandes e muito divergentes da maioria. Resíduos padronizados fora do intervalo [-2;2] podem considerar-se suspeitos em amostras pequenas (amostras de dimensão n <=20). Contudo, a eliminação imediata dos itens cujos valores não respeitem esta regra pode ser imprudente porque pode corresponder a situações em que a população de onde as amostras são extraídas tenha uma distribuição diferente da normal. Reforça-se a importância da análise dos gráficos de resíduos.



Na Figura 1 os elementos da amostra com os números #5 e #9 reúnem condições para serem considerados suspeitos porque os seus resíduos padronizados são superiores a 2 embora n = 25 > 20.


Uma vez que um elemento seja considerado suspeito deverá ser eliminado da amostra. Tenha--se em atenção que, por vezes, a eliminação dum elemento suspeito promove outros elementos a esta categoria!


3. Valores Influenciadores


Os valores influenciadores são aqueles que, embora com pequenos resíduos, correspondem a elementos da amostra cujos valores da variável explicativa são muito diferentes dos da restante amostra, influenciando desse modo a regressão.


A Figura 2 demonstra a existência de uma observação – elemento influenciador – cuja área é muito superior às áreas dos restantes elementos da amostra as quais se concentram entre os valores 150 e 200 m2. Se esse elemento for retirado da amostra obtém-se o gráfico da Figura 3. Comparando estes dois gráficos conclui-se que, na presença do elemento influenciador (Figura 2), a regressão dos preços sobre as áreas apresenta uma boa capacidade explicativa (R2=0,62) mas, ao ser eliminado esse elemento (Figura 3), a capacidade explicativa da regressão regride muito (R2 = 0,14). É óbvio que este tipo de elementos, que são denunciados com o recurso a estes gráficos, devem ser eliminados da amostra.




4. Referências

[1]

M. P. MIRANDA e R. S. CAMPOSINHOS, Avaliação Imobiliária, Porto: Edição dos Autores, 2022.

 

Sem comentários:

Com tecnologia do Blogger.