由於高可靠度電腦系統的需要以及分散式電腦系統的需求及重要性導致可容錯分散式 系統的研究. 分散式電腦系統上的工作可以由分散在不同電腦上的工作元(process) 同時執行, 且以資料傳送的方式互相溝通而合力完成.以此方式建構的可容錯軟體,當錯誤發生 時會因為資料傳送而把錯誤擴散到別的工作元,因此原子作用(atomic action) 的 觀念就被運用來建造分散式系統中容錯的處理單元. 本研究完全以一個去年由逢甲大學在UNIX系統上所模擬,建構的分散式環境為基礎, 針對欲達成供原子作用的目的,系統必需支援的兩種機置(mechanism): 一是同時 性控制(concurrency control), 另一是檔案的錯誤回復(file error revovery ).由於各種同時性控制演算法各有適用的環境,因此我們選擇了一種不會發生死結 (deadlock)的同時性控制演算法應用到我們的環境.這種演算法假設每一個原子作 用都有一個不同的順序(order), 我們提出了一個決定順序的方法,這種分散式的 做法不同於以往集中式的做法,能夠得到更好的可靠度與可用性及更好的效率. 我們在原先的UNIX系統上設計並製作一個檔案管理界面- 可回復檔案管理者(recove rable file manager),由這個界面提供一些讓使用者可以存取可回復檔案(recove rable file)的指令.以往檔案的錯誤回復方法只針對一個工作元,我們所提供的方 法則可以同時處理多個工作的錯誤回復. 本研究提出了同時性控制與檔案的錯誤回復的方法來支援可容錯分散系統,我們的方 法有下列三個優點:(一)防止死結的發生,(二)確保每一個原子作用能夠依其順 序執行完畢,(三)檔案的錯誤回復的工作由系統來管理而非使用者,因此確保檔案 的錯誤回復的工作能夠完整地完成.
|