Article thumbnail

The Effect of Log Transformation in Multivariate Liner Regression Models for Software Effort Prediction

By 暁人 門田 and 健一 小林


ソフトウェア開発工数予測において,線形重回帰モデルは最も基本的な予測モデルとして多くの採用実績がある.その適用の前処理として,変数変換(特に,対数変換)が有効であるが,その理論的根拠は必ずしも明らかでなかった.本論文では,対数変換を行った線形回帰モデルは,指数曲線モデルと等価であり,ソフトウェア開発データの特徴を表すのに適していることを示す.ただし,対数変換を行ってから線形回帰を行うと,逆変換する際に過小予測するバイアスが発生してしまうことは見過ごさがれがちである.本論文ではその補正方法も示す.Multivariate linear regression models have been commonly used as software effort prediction models. To improve the prediction accuracy, it is a common practice to transform (especially, log-transform) the data before building a model, althourgh its theoretical basis is not necessarily clear. This paper reveals that the log- transformed linear regression model (log-log regrssion model) is equal to the exponential model, which is suitable to characterize various relationships among software related metrics. However, when using a log-log regression model, the result of inverse transformation tends to under-estimate the effort. This paper also introduces a method to correct such bias

Publisher: 'Geological Society of America'
Year: 2010
DOI identifier: 10.11309/jssst.27.4_234
OAI identifier:

Suggested articles

To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.