Transformação de variáveis?

É recorrente, na avaliação de imóveis, a aplicação de técnicas de regressão linear múltipla como suporte ao método comparativo de mercado.


Fervorosos adeptos desta metodologia, consideramos que a sua grande vantagem é expurgar ao máximo qualquer subjetividade que os avaliadores de imóveis possam introduzir nas suas avaliações.

Traduzindo num exemplo muito simples. 

Suponhamos, recorrendo ao absurdo, que só temos imóveis, na nossa amostra de comparáveis, na Rua A e na Rua B. 

Numa avaliação “normal”, o perito avaliador de imóveis terá que, subjetivamente, afirmar que a Rua A é melhor que a Rua B e introduzir a sua ponderação para esta diferença de “estatuto” da localização relativa, que poderá ser diferente da sensibilidade de qualquer outro colega que estude o mesmo imóvel.

Recorrendo à inferência estatística, são as técnicas de regressão linear simples ou múltipla que, objetivamente, vão estabelecer essa diferença. 



Acontece no entanto que algumas relações entre a variável dependente e as variáveis independentes não são lineares. 

Nestes casos, devemos realizar transformação nas variáveis. 

Normalmente, as transformações simples da variável dependente, das variáveis independentes ou de ambas possibilitam a construção de um modelo de regressão linear apropriado ao conjunto de dados transformados. 

Quando se procura ajustar modelos a dados imobiliários, a transformação logarítmica é a mais utilizada. No entanto existem muitas possibilidades de transformações, e muitos modelos podem ser escolhidos: semilogaritmica, inversa, quadrática, entre outras. 

Num trabalho por nós realizado, estudamos a transformação linear de todas as variáveis em vários modelos, tendo verificado os seguintes valores de R, R2, f de significância:

João Fonseca / Avaliador de imóveis / 919375417

Perante os resultados obtidos, é correto afirmar que a transformação quadrática é a que melhor se ajusta.

Dois dos modelos utilizados (linear e logarítmico), além de apresentarem valores de R e R2 mais baixos, apresentam um fator f de significância superior a 1%, o que não convém.

Em termos práticos, afirmar que f de significância é superior a 1% é confirmar que existe mais de 99% de certeza que a equação de regressão é válida!

Sem comentários:

Com tecnologia do Blogger.