研究生(外文):Biing-Kun Sheen
論文名稱(外文):TWHD:Taiwan Pioneering Deepfake Dataset for Multi-Face Forgery Detection
指導教授(外文):Iuon-Chang LinChin-Feng Lee
口試委員(外文):Yung-Chen Chou
外文關鍵詞:DeepFakesMedia ForensicsFace ManipulationFace SwappingImage translationFace RecognitionBiometricsDatabasesBenchmark
隨著深度學習技術的迅速發展,Deepfake技術已成為當今社會中引起關注的熱門話題之一。本研究的目標是比較多種不同方法和資料集在Deepfake檢測方面的性能,並評估不同資料集對檢測結果的影響。我們雇用了100位臺灣的素人演員,通過多種方法確保他們的臺灣身份。我們採用錄影棚內攝影的方式收集演員的臉孔,並取得他們的同意,生成多種Deepfake影片,以建立臺灣人自己的Deepfake 資料集,稱之為台灣高品質深偽資料庫(TaiwanHigh-qualityDeepfake dataset,簡稱 TWHD-Dataset)。我們註冊並下載了目前知名的多個深偽影像資料集,例如FaceForensics、DFDC、DeeperForensics-1.0,以及來自韓國的 KoDF 等。同時,我們選擇了一些常見的Deepfake方法,包括基於生成對抗網絡(Generative Adversarial Networks,GANs)和自編碼器(Autoencoders)等。總結來說,本研究提供了一個大型的台灣人臉深偽資料集,透過對比多種不同的Deepfake生成方法以及評估資料集對於深偽影像生成的綜合分析。這將有助於研究人員更好地理解Deepfake 生成方法的優勢和限制,並在實際應用中作出更明智的選擇。未來的研究可以進一步探索和改進Deepfake方法,以提高生成結果的真實性和可靠性。
With the rapid development of deep learning technology, Deepfake has emerged as one of the hot topics of concern in today’s society. This study aims to compare the performance of various methods and datasets in Deepfake detection and assess the impact of different datasets on detection results.

We hired 100 amateur actors from Taiwan, ensuring their Taiwanese identity through various methods. Using in-studio filming, we collected the actors’ facial images and obtained their consent to generate multiple Deepfake videos, establishing a Taiwanese-owned Deepfake dataset called the Taiwan High-quality Deepfake dataset (TWHD-Dataset).

We registered and downloaded several well-known Deepfake image datasets, such as FaceForensics, DFDC, DeeperForensics-1.0, and the Korean KoDF dataset. Additionally, we selected several commonly used Deepfake methods, including those based on Generative Adversarial Networks (GANs) and Autoencoders.

In summary, this study provides a large-scale Taiwanese facial Deepfake dataset, enabling a comprehensive analysis of different Deepfake generation methods and the evaluation of dataset impacts on Deepfake image generation. This will help researchers better understand the advantages and limitations of Deepfake generation methods and make more informed choices in practical applications. Future research can further explore and improve Deepfake methods to enhance the realism and reliability of generated results.
摘要 i
Abstract ii
目錄 iii
列表目次 v
圖目次 vi

第一章 緒論 1
1.1 深偽技術的崛起 1
1.2 豐富多樣的深度偽造技術 1
1.3 深偽技術的多種方法和高品質資料集建立 3

第二章 參考文獻 5
2.1 臉部偽造的檢測方法 5
2.2 著名的深偽資料集 5
2.2.1 Deepfake Detection Challenge (DFDC) Dataset 6
2.2.2 FaceForensics++ Dataset 8
2.2.3 Korean Deepfake Detection Dataset 9
2.2.4 Openforensics Dataset 11
2.2.5 Deeperforensics-1.0 Dataset 13
2.3 不同深偽影像資料集的比較與討論 15

第三章 研究內容與方法 20
3.1 台灣高品質深偽資料集 (TWHD-Dataset) 20
3.2 演員素材收集 20
3.3 Deepfakes 的訓練與生成 22
3.3.1 DeepFaceLab 23
3.3.2 FaceSwap 26
3.3.3 Reface: AI 28
3.4 生成 Deepfake 影片後的標註與整理 29
3.5 TWHD 資料集總結 29

第四章 實驗結果 34
4.1 主觀評估:TWHD 資料集的人眼觀察 34
4.1.1 問卷設計和受試者回應率 35
4.1.2 受試者對深偽影片的辨識能力 36
4.1.3 受試者對資料集的真假判斷 38
4.1.4 資料集的潛在缺陷與探討 40
4.2 數值評估:TWHD 資料集的客觀分析 41
4.2.1 實作細節 43
4.2.2 資料集的品質比較 44
4.2.3 資料集的深偽判別比較 47

第五章 結論與未來研究 49
5.1 研究貢獻 49
5.2 未來研究 50
5.3 研究限制 50
5.4 致謝 51

參考文獻 52
