研究生(外文):Yung-Lun Chen
論文名稱(外文):A Dynamic Programming Framework for Modeling and Recognizing 3D Human Body Gestures through Multiple Principal Plane Analysis
指導教授(外文):Shyi-Chyi ChengChin-Chun Chang
外文關鍵詞:Multiple Principal Plane Analysis3D human bodyRecognizing Gestures
本論文提出一個基於多平面分析之動態規劃平台及其在三維人體姿勢辨識的新架構。演算法首先利用著名的k-means分群演算法和主平面分析(Principal Plane Analysis)來近似3D外形。對於每個主平面我們擷取旋轉、大小和轉換不變的平面描述特徵,用來描述3D外形的內容資訊,接著我們利用先進的bag-of-words(BoW)方法來描述3D外形。在模型視角與人體尺寸不變下,其3D外形之間的相似度估計是利用計算兩個BoW直方圖間的差異。基於這個相似度的測量,分群使訓練3D外形可獲得一個3D外形字典, 這個3D外形字典可用來標示輸入的3D資料序列的姿勢序列,再利用拓樸排序(topological sort),輸入之3D資料序列可表示為一個經過正規化的關鍵姿勢序列,以確保屬於相同動作類別的所有序列都具有相同的起始外形姿勢。最後,訓練階段得到的每個動作的樣板資料序列和使用字串核心(string kernel)之支援向量分類器(Support Vector Machine,SVM) ,可用於辨識輸入3D資料序列的關鍵姿勢之集合分類其動作類型。實驗結果顯示本論文所提出的演算法可獲得良好的分類準確度。
壹、 緒論 1
1.1 研究動機 1
1.2 研究背景 1
1.3 研究方法簡介 3
1.4 論文架構 4
貳、 相關研究 5
參、 主平面分析 8
3.1 k-means 分群演算法 8
3.2 3D模型之主平面分析 9
3.3 建立3D外形逼近模型 11
3.3.1 15
3.3.2 17
肆、 利用BoW估算3D外形的距離 19
4.1 表面描述特徵擷取 19
4.2 估計3D外形距離 24
伍、 3D人體姿勢辨識 25
5.1 BoW方法之關鍵姿勢偵測 26
5.2 優化3D外形碼本 29
陸、 實驗結果 32
6.1 資料集合 32
6.2 多主平面分析 35
6.3 未使特定姿勢碼本之關鍵姿勢分析 37
6.4 使用為特定姿勢碼本之關鍵姿勢分析 40
6.5 混淆矩陣 45
柒、 結論與未來展望 52
參考文件 53

