在多重線型迴歸分析中,當模型已被適當建立時,為精簡的理由而選擇重要獨立變數 是項極重要的工作,但在選擇的過程中,又因互相衝突的目的或要求,所以在取捨之 間有多種不同的標準或準則來選取較具有代表性之變數子集。而在傳統選擇最佳變數 子集的方法中,尤其以逐步迴歸法最被廣泛使用,但是其缺乏一些統計理論上的支持 ,所以容易被一般使用者所誤用。而本文的重點即在研究逐步迴歸法法中比較統計量 的分配有關性質以及如何較簡化且合理的決定臨界值,以使選擇變數的檢定過程更具 有代表性。 本文所提的修改臨界值的計算牽涉雙重無心F 分配的情形,所以在計算累積分配或百 分位點時,需利用近似公式(見於26∼29頁)在第三章中,舉出三個例子,以說明此 修改臨界值方法的應用。 我們可由兩個方向來看:①因為所有已發展出的統計程式,其臨界值皆必須固定取值 ,始可進行。所以我們可將所有可能選擇過程的臨界值中,找其最小值以作為統計程 式方固定取捨標準②在選擇變數的每一步驟,皆依當時變數選入和欲選入的不同組合 而變動其臨界值,後面附錄1 之程式就在作此項工作,並且三個例子的資料經過程式 1 所得的最佳變數子集結果分別列在附錄3 ,5 ,7。 最後在第36頁,列了一個表,以作為所舉三組資料分別執行BMDP和上面所提的兩個方 向之後,所各別得到的最佳變數子集結果,作個比較。
|