跳到主要內容

臺灣博碩士論文加值系統

(44.210.149.218) 您好!臺灣時間:2024/11/07 21:38
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:林瑞益
研究生(外文):Ruei-YiLin
論文名稱:使用圖形處理器作有限元素計算之效能評估
論文名稱(外文):Performance Evaluation of Graphics Processor in Finite Element Computation
指導教授:何旭彬
指導教授(外文):Shi-Pin Ho
學位類別:碩士
校院名稱:國立成功大學
系所名稱:機械工程學系碩博士班
學門:工程學門
學類:機械工程學類
論文種類:學術論文
論文出版年:2010
畢業學年度:98
語文別:中文
論文頁數:66
中文關鍵詞:有限元素計算圖形處理器評估
外文關鍵詞:finite element computationgraphics processorevaluate
相關次數:
  • 被引用被引用:4
  • 點閱點閱:173
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
新型圖形處理器已發展多年,其運算速度的峰值一直在提升,然而當使用圖形處理器作科學計算時,效能實際提升的程度是我們所要探討的。

本文使用的圖形處理器為NVIDIA公司中擁有雙精度浮點運算的第二代圖形處理器GT200的GTX 260,以及最近剛上市的第三代圖形處理器Fermi的GTX 470。我們將利用圖形處理器的多運算單元及高記憶體頻寬的優點,搭配新型CUDA架構整合並獨立了所有運算單元的計算能力,使得計算效能提升。

在有限元素計算中,求解線性聯立方程組所花費的時間與計算量,在整體上所佔的比重是很大的。對於大型線性聯立方程組,本文將使用共軛梯度法配合Jocobi預選矩陣來求解,其中包括向量內積、向量加乘及稀疏矩陣向量相乘的運算,我們將使用圖形處理器作其運算並評估效能;此外,我們也將對全矩陣相乘及全矩陣向量相乘的運算作探討。最後,分別使用圖形處理器與中央處理器求解一有限元素問題,並作其效能評估與分析。

經過測試後,使用圖形處理器作有限元素計算的求解部分時,GeForce GTX 260圖形處理器的運算效能比Inter? CoreTM2 Quad Q6600中央處理器的單核心運算效能提升約27.3倍,GeForce GTX 470圖形處理器則提升約81.7倍。但是,我們也得知相對於圖形處理器的運算速度峰值,實際在有限元素計算的效能往往是受限於記憶體頻寬。
The graphics processor has been evolved into manycore processor with tremendous computational horsepower, however, we focused on the real performance increasement of graphics processor in scientific computation.

In this paper, the graphics processors used are the GTX 260 of GT200 architecture and the GTX 470 of Fermi architecture with double precision floating point operation. We will speed up the computation performance by utilizing the multi-processor and high bandwidth with the new architecture called CUDA(Compute Unified Device Architecture) that is integrated and independent of processor's calculation capability.

In finite element computation, it spend most of the computation time solving a set of linear equation. We will use the Jocobi conjugate gradient method to solve a set of linear equations in this paper. The iterative method includes vector product, vector-vector addition and multiplication, and sparse matrix-vector multiplication. We will use the graphics processor to calculate these computations, and evaluate their performance. Besides, full matrix-matrix multiplication and full matrix-vector multiplication are also studied. Finally, we solve a finite element problem using graphics processor and central processor respectively, and evaluate the performance.

The numerical testing shows that the speed up are 27.3 for GeForce GTX 260 and 81.7 for GeForce GTX 470 compare to the Inter? CoreTM2 Quad Q6600 processor. However, relative to peak performance of graphics processor, we knew that the real computational performance in finite element computation was restricted by memory bandwidth.

摘要 I
Abstract III
誌謝 V
目錄 VI
表目錄 IX
圖目錄 XI
符號說明 XIII
第一章 緒論 1
1.1 前言 1
1.2 文獻回顧 4
1.3 動機與目的 5
1.4 論文架構 6
第二章 基本理論 7
2.1 有限元素法 7
2.2 資料儲存方式 8
2.3 求解線性聯立方程組 10
第三章 圖形處理器架構 13
3.1 回顧 13
3.2 CUDA(Compute Unified Device Architecture) 14
3.2.1 整合(unified) 14
3.2.2 CUDA 15
3.3 新型圖形處理器硬體架構 15
3.3.1 概述 15
3.3.2 平行程式在硬體上的實現 18
3.3.2.1 可執行SIMD的SMs 18
3.3.2.2 記憶體架構 19
3.4 運作模式 22
3.4.1 Thread層級 22
3.4.2 記憶體層級 23
3.4.3 主要裝置與計算裝置 24
3.4.4 計算相容性 26
第四章 效能最佳化 27
4.1 記憶體最佳化 27
4.1.1 Global記憶體 27
4.1.2 Constant記憶體 29
4.1.3 Texture記憶體 29
4.1.4 Shared記憶體 29
4.2 程式碼最佳化 31
4.2.1 block數與warp數最大化 31
4.1.2 計算強度最大化 32
4.1.3 控制流指令的使用 33
4.3 最佳化總結 33
第五章 研究成果 34
5.1 向量內積 35
5.2 向量加乘 40
5.3 全矩陣相乘 44
5.4 全矩陣向量相乘 47
5.5 稀疏矩陣向量相乘 52
5.6 效能評估 56
第六章 結論 61
參考文獻 63
自述 66

[1] Bolz, J., Farmer, I., Grinspun, E., Schroder, P., “Sparse matrix solvers on the GPU : Conjugate gradient and multigrid, ACM, Inc, 2003.

[2] Kelmelis, E. J., Humphrey, J. R., Durvano, J. P., Ortiz, F. E., “Accelerated modeling and simulation with a desktop supercomputer, SPIE, Vol. 6227 62270N, 2006.

[3] Galoppo, N., Govindaraju, N., K., Henson, M., Manocha, D., “LU-GPU : Efficient algorithms for solving dense linear system on graphics hardware, University of North Carolina chapel hill, 2005.

[4] 林香君,“多處理器個人電腦上的平行有限元素程式設計,碩士論文,國立成功大學機械工程學系,1998。

[5] 吳宗穎,“平行處理應用於有限元素計算之使用評估,碩士論文, 國立成功大學機械工程學系,1999。

[6] 黃建彰,“個人電腦叢集之平行有限元素計算,碩士論文,國立成功大學機械工程學系,2000。

[7] 陳明凱,“平行有限元素法之負載平衡探討,碩士論文,國立成功大學機械工程學系,2001。

[8] 許裕展,“在奔騰4處理器及個人電腦叢及上的計算最佳化,碩士論文,國立成功大學機械工程學系,2002。

[9] NVIDIA Corp., “CUDA Programming Guide version 3.0, NVIDIA Corp., 2010.

[10] NVIDIA Corp., “NVIDIA GeForce GTX 200 GPU Architectural Overview, NVIDIA Corp., 2006.

[11] NVIDIA Corp., “NVIDIA’s Next Generation CUDA Compute Architecture: Fermi, NVIDIA Corp., 2009.

[12] S. Ryoo, C. Rodrigues, S. Stone., S. Baghsorkhi, S.-Z. Ueng, J. Stratton, and W. W. Hwu, “Program optimization space pruning for a multithreaded GPU, in Proc. 6th Int’l Symp. On Code Generation and Optimization(CGO), pages 195-204, 2008.

[13] Yinan Li, Jack Dongarra, and Stanimire Tomov, “A Note on Auto-tuning GEMM for FPUs, University of Tennessee Computer Science Technical Report, 2009.

[14] V. Volkov and J. W. Demmel, “Benchmarking GPUs to tune dense linear algebra, In Proc. 2008 ACM/IEEE Conference on Supercomputing, pages 1-11, 2008.

[15] N. Bell and M. Garland, “Efficient sparse matrix-vector multiplication on CUDA, NVIDIA Technical Report NVR-2008-004, NVIDIA Corporation, 2008.

[16] 陳武勇,“使用圖形處理器於B-Spline有限元素分析,碩士論文, 國立成功大學機械工程學系,2007。

[17] E. B. Becker, G. F. Carey, J. T. Oden, “Finite Element, An Introduction Volumn(I), Prentice-Hall International Inc., 1981.

[18] D. C. Robert, “Finite Element Modeling For Stress Analysis, John Wiley & Sons, Inc., 1995.

[19] Richard Barrett, Michael Berry, Tony F. Chan, James Demmel, June Donato, Jack Dongarra, Victortor Eijkhout, Roldan Pozo, Charles Romine, and Henk van der Vorst, “Templates for the Solution of Linear Systems : Building Blocks for Itertive Methods, Society for Industrial and Applied Mathematics, 1994.

[20] L. N. Trefethen, D. Bau, III, “Numerical Linear Algebra, SIAM, 1997.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊