跳到主要內容

臺灣博碩士論文加值系統

(44.211.117.197) 您好!臺灣時間:2024/05/23 10:31
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:蘇家生
研究生(外文):Jia-Sheng Su
論文名稱:多引線分散式共用記憶體系統之集中式負載共享機構的研製
論文名稱(外文):A Centralized Load Sharing Mechanism for Multi-Threaded Distributed Shared Memory Systems
指導教授:謝錫
指導教授(外文):Ce-Kuen Shieh
學位類別:碩士
校院名稱:國立成功大學
系所名稱:電機工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:1996
畢業學年度:84
語文別:英文
論文頁數:44
中文關鍵詞:負載共享
外文關鍵詞:Load Sharing
相關次數:
  • 被引用被引用:0
  • 點閱點閱:96
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
現今發表的分散式共用記憶體系統大多是屬於單引線系統。因此,若要得
到一個好的執行效能,工作量必須平均分配(負載平衡),以便當其他的
處理器在忙碌工作時,不會有某些處理器處在閒置狀態。然而,有某些原
因可能會導致負載不平衡的現象發生。例如:動態地產生子工作或用處理
速度互異的處理器來架構出一個系統。在本論文中,我們提出了透過「引
線遷移」方式來消除此種現象的「集中式負載共享」(CLS) 演算法- 適
合多引線分散式共用記憶體系統的「動態排程」演算法。本演算法並不嘗
試平衡系統的工作量,我們所著重的是在縮短應用程式的總執行時間,並
保證要比純粹採用「靜態式排程器」所執行出的時間還短。此演算法採用
了集中式的決策者,其根據各節點在執行期間內所收集的資料來決定哪一
個節點上的哪一個引線應該被遷移到哪一個節點上。「引線間的資料相依
性」在此決策過程中有納入考量。本演算法已實現在我們實驗室所發展出
的多引線分散式共用記憶體系統 - Cohesion 上。實驗結果顯示:在由
不同數目的 486 DX-33 所組成的系統下執行具三角負載分佈形式、1024
x 1024 的資料矩陣及 100 次迴路的 SOR 應用程式時,其約可將執行
時間縮短 10% 到 30%。 另外,在 8 個節點上執行具 16K 個質點的
N-BODY 程式且在計算量平均分配下,本演算法依不同的系統組態而會有
6% 到 20% 的縮短程度。快速的處理器加入的越多,系統效能就會變的
越好。甚至,在組態會變動的 4 個節點上執行具 1024x1024 資料矩陣
、100 次迴路及計算量平均分配的 SOR 應用程式時,我們的演算法能將其
執行時間縮短約 20% 到 40%。若加入的高速處理器越多,系統效能就會變
的越好。

Most published DSM systems are single-threaded. Therefore, a
better performance requires the equal distributed workload
(load balance) so that no processor is idle while others are
busy working. However,some factors may induce the load
imbalance phenomenon,such as dynamically creating jobs and
constructing a system with processors of different speed. In
this thesis,the Centralized Load Sharing (CLS) algorithm,a
dynamic scheduling algorithm suitable for multi-threaded DSM
systems,is proposed to eliminate this phenomenon through the
thread migration method. Instead of trying to balance the
system's workload,our algorithm focuses on shortening the
application's execution time compared to the time with only the
static scheduler's support. It adopts a centralized decision-
maker to decide which thread on which node should be migrated
to which node according to the information collected at run-
time by all nodes. The data dependency between threads is taken
into account here. We have implemented this algorithm on
Cohesion,a multi- threaded DSM system developed by our
laboratory. The experimental results show that our algorithm
shortens the execution time by about 10% to 30% when the SOR
application is run on the varying node count of 486 DX-33 with
the load distribution of triangle form on the 1024x1024 matrix
and 100 iterations. Besides,when the N-BODY application of 16K
particles is run on 8 nodes with the equal computation workload,
this algorithm can shorten the execution time by about 6% to
20% corresponding to the varying configuration. The more the
faster processors are added,the better the performance is.
Moreover,when the SOR application of 1024x 1024 matrix and 100
iterations is run on the varying 4 nodes with equal partition,
our algorithm can shorten the execution time by 20% to 40%. The
performance is better if more processors of high speed are
added.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top