資料載入處理中...
跳到主要內容
臺灣博碩士論文加值系統
:::
網站導覽
|
首頁
|
關於本站
|
聯絡我們
|
國圖首頁
|
常見問題
|
操作說明
English
|
FB 專頁
|
Mobile
免費會員
登入
|
註冊
切換版面粉紅色
切換版面綠色
切換版面橘色
切換版面淡藍色
切換版面黃色
切換版面藍色
功能切換導覽列
(18.97.9.170) 您好!臺灣時間:2024/12/07 19:18
字體大小:
字級大小SCRIPT,如您的瀏覽器不支援,IE6請利用鍵盤按住ALT鍵 + V → X → (G)最大(L)較大(M)中(S)較小(A)小,來選擇適合您的文字大小,如為IE7或Firefoxy瀏覽器則可利用鍵盤 Ctrl + (+)放大 (-)縮小來改變字型大小。
字體大小變更功能,需開啟瀏覽器的JAVASCRIPT功能
:::
詳目顯示
recordfocus
第 1 筆 / 共 1 筆
/1
頁
論文基本資料
摘要
外文摘要
目次
參考文獻
電子全文
紙本論文
論文連結
QR Code
本論文永久網址
:
複製永久網址
Twitter
研究生:
賴韋諺
研究生(外文):
Wei-YanLai
論文名稱:
使用CUDA及圖形處理器作有限元素法計算分析
論文名稱(外文):
Finite Element Analysis with CUDA and Graphics Processor
指導教授:
何旭彬
指導教授(外文):
Shi-Pin Ho
學位類別:
碩士
校院名稱:
國立成功大學
系所名稱:
機械工程學系碩博士班
學門:
工程學門
學類:
機械工程學類
論文種類:
學術論文
論文出版年:
2013
畢業學年度:
101
語文別:
中文
論文頁數:
60
中文關鍵詞:
圖形處理器
、
有限元素法
、
CUDA
外文關鍵詞:
graphic processor
、
finite element
、
CUDA
相關次數:
被引用:
2
點閱:306
評分:
下載:9
書目收藏:0
近年來,圖形處理器在浮點數運算能力上已經超越了中央處理器許多,且已支援雙精度浮點數運算。對於大量且重複性很高的計算使用圖形處理器會比中央處理器有更好的效率。
使用有限元素法求解問題所得到的線性聯立方程組占整體運算的一大部分,而本文使用共軛梯度法配合Jacobi預選矩陣求解聯立方程組。我們將使用圖形處理器運算並分析迭代過程中的向量內積、向量加乘及稀疏矩陣向量相乘運算。此外,將使用圖形處理器對全矩陣相乘及全矩陣向量相乘作運算分析。最後,分別使用圖形處理器及中央處理器求解有限元素問題,並分析比較其結果。
本文使用NVIDIA公司的CUDA整合技術及其出品的圖形處理器,Fermi架構的GeForce GTX 580與Kepler架構的GeForce GTX TITAN。
測試結果在求解有限元素問題時,GeForce GTX 580比中央處理器Intel® Core™ i5-2500之單個核心運算速度快79.09倍,而GeForce GTX TITAN則快93.14倍。
In the capability of floating point operations, the graphic processor is better than the central processor recently. In addition, the graphic processor provides the double precision floating point operations already. Therefore, the efficiency of computations with numerous and repeated, the graphic processor would be better than the central processor.
In finite element computations, it spends most of the computation time solving a set of linear equation. In this paper, the Jacobi conjugate gradient method has been used to solve a set of linear equation. There are the vector product, the vector-vector addition and multiplication, and the sparse matrix-vector multiplication in the iterative process. These computations have been calculated and analyzed by the graphic processor. Furthermore, the full matrix-matrix multiplication and the full matrix-vector multiplication have been calculated and analyzed too. Finally, a finite element problem has been solved by the graphic processor and the central processor respectively.
In this paper, we use CUDA(Compute Unified Device Architecture) technology and the graphic processor manufactured by NVIDIA. The graphic processor GTX 580 of Fermi architecture and GTX TITAN of Kepler architecture have been used. The testing result shows that the efficiency of GTX 580 and GTX TITAN compared to the Intel® Core™ i5-2500 by single core are 79.09 times and 93.14 times respectively.
摘要 I
Abstract II
致謝 III
目錄 IV
表目錄 VI
圖目錄 VII
符號說明 IX
第一章 緒論 1
1.1 研究動機 1
1.2 文獻回顧 5
1.3 文章架構 5
第二章 相關理論 7
2.1 預加條件共軛梯度法 7
2.2 資料儲存方式 10
第三章 圖形處理器架構 12
3.1 回顧 12
3.2 CUDA 13
3.3 Fermi架構 14
3.4 Kepler架構 16
3.5 記憶體架構 20
3.6 運作模式 22
3.6.1 執行緒層級 22
3.6.2 記憶體層級 23
3.6.3異構計算 24
3.6.4 計算能力 25
第四章 效能最佳化評估 26
4.1 記憶體最佳化 26
4.1.1 Global記憶體 26
4.1.2 Constant記憶體 28
4.1.3 Texture記憶體 28
4.1.4 Shared記憶體 28
4.2 程式碼最佳化 31
4.2.1 block及warp 31
4.2.2 避免資料在host與device間傳遞 31
4.2.3 控制流指令的使用 31
第五章 研究成果 32
5.1 向量內積 33
5.2 向量加乘 39
5.3 全矩陣相乘 41
5.4 全矩陣向量相乘 43
5.5 稀疏矩陣向量相乘 47
5.6 B-Spline有限元素法求解 51
第六章 結論 57
參考文獻 58
自述 60
[1] Bolz, J., Farmer, I., Grinspun, E., Schröder, P., Sparse matrix solvers on the GPU:Conjugate gradient and multigrid, ACM, Inc, 2003.
[2] Kelmelis, E. J., Humphrey, J. R., Durbano, J. P., Ortiz, F. E., Accelerated modeling and simulation with a desktop supercomputer, SPIE, Vol. 6227 62270N, 2006.
[3] Galoppo, N., Govindaraju, N. K., Henson, M., Manocha, D., LU-GPU:Efficient algorithms for solving dense linear systems on graphics hardware, University of North Carolina chapel hill, 2005.
[4] NVIDIA GeForce 8800 GPU architecture overview:World’s first unified directX 10 GPU delivering unparalleled performance and image quality, NVIDIA Corp., 2006.
[5] 林香君, 多處理器個人電腦上的平行有限元素程式設計, 碩士論文, 國立成功大學機械工程系, 1998.
[6] 許育展, 在奔騰4處理器及個人電腦叢集上的計算最佳化, 碩士論文, 國立成功大學機械工程系, 2002.
[7] 陳武勇, 使用圖形處理器於B-spline有限元素分析, 碩士論文, 國立成功大學機械工程學系, 2007.
[8] 林瑞益, 使用圖形處理器作有限元素計算之效能評估, 碩士論文, 國立成功大學機械工程學, 2010.
[9] NVIDIA Corp., CUDA C Programming Guild v5.0, NVIDIA Corp., 2012.
.
[10] NVIDIA Corp., NVIDIA’s Next Generation CUDA Compute Architecture: Fermi, NVIDIA Corp., 2009.
[11] NVIDIA Corp., NVIDIA 下個世代CUDA技術™ 運算架構KeplerTM GK110, NVIDIA Corp., 2012.
電子全文
國圖紙本論文
連結至畢業學校之論文網頁
點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
推文
當script無法執行時可按︰
推文
網路書籤
當script無法執行時可按︰
網路書籤
推薦
當script無法執行時可按︰
推薦
評分
當script無法執行時可按︰
評分
引用網址
當script無法執行時可按︰
引用網址
轉寄
當script無法執行時可按︰
轉寄
top
相關論文
相關期刊
熱門點閱論文
1.
多處理器個人電腦上的平行有限元素程式設計
2.
使用圖形處理器於B-Spline有限元素分析
3.
使用圖形處理器作有限元素計算之效能評估
4.
在奔騰4處理器及個人電腦叢集上的計算最佳化
5.
使用Xeon Phi進行有限元素法計算之效能評估
6.
使用OpenCL及HSA架構加速處理器作有限元素法計算分析
7.
發展一波數誤差最佳化有限元素 GPU 平行計算模型以求解不可壓縮 Navier-Stokes 方程式
8.
應用CUDA及OpenGL於有限元素分析
1.
許良榮(1998):國小自然科過程技能教學的潛在問題。國教輔導,38(1),19-22。
2.
許良榮(1998):國小自然科過程技能教學的潛在問題。國教輔導,38(1),19-22。
3.
許良榮(1998):國小自然科過程技能教學的潛在問題。國教輔導,38(1),19-22。
4.
張惠博(1993)。邁向科學探究實驗教學。教師天地,26,12-20。
5.
張惠博(1993)。邁向科學探究實驗教學。教師天地,26,12-20。
6.
張惠博(1993)。邁向科學探究實驗教學。教師天地,26,12-20。
7.
張宏亮(1996)。大學運動績優保送生之學習困擾來源。臺灣師大體育研究,2,33-44。
8.
張宏亮(1996)。大學運動績優保送生之學習困擾來源。臺灣師大體育研究,2,33-44。
9.
張宏亮(1996)。大學運動績優保送生之學習困擾來源。臺灣師大體育研究,2,33-44。
10.
吳新華(1983)。小朋友快樂嗎?---國小學童生活適應問題之研究。國教之友,3(44),131-141。
11.
吳新華(1983)。小朋友快樂嗎?---國小學童生活適應問題之研究。國教之友,3(44),131-141。
12.
吳新華(1983)。小朋友快樂嗎?---國小學童生活適應問題之研究。國教之友,3(44),131-141。
13.
吳武典(2000)。環境對科學資優生的影響-我國參與國際理化奧林匹亞競賽學生的追蹤研究。載於中華資優教育學會(主編),資優教育的全方位發展(頁243-281)。臺
14.
吳武典(2000)。環境對科學資優生的影響-我國參與國際理化奧林匹亞競賽學生的追蹤研究。載於中華資優教育學會(主編),資優教育的全方位發展(頁243-281)。臺
15.
吳武典(2000)。環境對科學資優生的影響-我國參與國際理化奧林匹亞競賽學生的追蹤研究。載於中華資優教育學會(主編),資優教育的全方位發展(頁243-281)。臺
1.
高效率變角度百葉窗型鰭片之三維熱液動分析
2.
奈米流體於波形渠道熱傳增強之數值最佳化
3.
廢氣煙道熱擷取暨熱電系統設計
4.
藉擋板與條板配置調整微小物件之進料姿態
5.
(Cu2Ge)x/3Zn1-xSe奈米晶液相合成及可調控能隙研究
6.
應用CUDA及OpenGL於有限元素分析
7.
基於模糊推論方法推薦潛在運動夥伴以提升個人運動動機
8.
飛安風險評估系統精進探討
9.
台灣慢性透析病患罹患心房顫動之盛行率及抗血栓劑處方型態分析
10.
大風起兮,歸故鄉-漢代懷鄉的政治脈絡與歷史意涵
11.
挾帶床氣化爐中煤炭及生質物氣化之數值模擬及最佳化
12.
口碑對消費者的績效評估之影響 - 以免費行動遊戲為例
13.
物化處理系統污泥特性調查及其水泥材料化之可行性研究-以處理大專院校實驗室廢棄物之系統為例
14.
應用多項式簡易貝氏分類器於文件分類的推導廣義狄氏分配參數之方法
15.
南投縣觀光產業發展能源使用之研究
簡易查詢
|
進階查詢
|
熱門排行
|
我的研究室