本論文期望以模糊熵改善決策樹歸納學習法的預測正確率。傳統的決策樹 歸納學習法中,分界點附近的事物常因些微的數值差距而產生截然不同的 分類預測結果,這種不當的判斷方法導致決策樹的預測正確率一直不高。 有些學者以機率或模糊理論來改善這些分界點附近的不當分類方式,結果 使得預測正確率增加不少,由此顯示分界點確實是提昇預測正確率的關鍵 。不過以往的研究皆針對分類預測方法做改善,本論文嘗試在決策樹的建 樹過程中,以模糊理論改善負責挑選分界點的熵函數,期望能夠改變決策 樹的分割屬性,提高其預測正確率。本論文在個人電腦上撰寫程式,模擬 提出的模糊熵概念,並以數個應用領域的資料集來評估模糊熵決策樹歸納 學習法的預測正確率。實驗結果顯示,模糊熵決策樹確實比傳統決策樹擁 有更高的預測正確率,但是改善的幅度略低於改善分類預測方法的改善幅 度,若將這兩種改善方法合併使用,改善的幅度略高於改善分類預測方法 的改善幅度。
|