資料複製 (data replication) 在容錯系統(fault tolerant system) 中是不可缺 少的,在本論文中我們將介紹在DMINIX分散式系統中利用資料複製的技術,提供一 可靠的檔案存取環境,這個環境將使使用者程式在執行時,可以防止資料因硬體錯 誤而無法順利存取資料,導致系統中斷。 在我們的系統中所使用之技術是在檔案層次 (file level) 上,利用 Available Copies的方式來達到資料複製,並且使用原來stateful檔案系統之架構,以期使原 有程式可不經任何修改或編譯即可存取複製檔案。在我們的實現中,對使用者而言 ,是完全透通的 (transparent),存取複製檔案與一般檔案無任何不同,使用者亦 可不須考慮複製檔案存放何處,如此,使本系統之容錯能力達到高度 application transparency之優點。 除了一般程式之檔案存取外,我們也提供DMINIX中堅韌處理元的檔案存取,但堅韌 處理元在recovery時,可能會重做 non-idempotent 之 file request ,因此,我 們在本檔案服務系統中,運用有效的方法解決此類 non-idempotent 問題,使得堅 韌處理元可在DMINIX之容錯環境中能正常存取檔案。 當複製節點當機再修復後,複製資料一致性之維持是必須的,在本系統中我們提供 一程式,使用離線 (off-line) 的方式,讓系統管理者可以很容易執行 recovery 之動件,保持系統之一致性。
|