論文名稱(外文):A Research of FCED-CLIP Algorithm on Human Sketch Generation
外文關鍵詞:Convolutional Neural NetworksData AugmentationSketch GenerationCLIP
隨著網路技術和行動裝置的廣泛應用,圖片已成為重要的訊息傳遞方式。原本傳統的CBIR,以關鍵字檢索圖片已經無法滿足現代人對於快速便利的需求,因此,使用草圖作為檢索方式的SBIR開始興起。然而,由於草圖訓練資料的不足,導致 SBIR 研究進展緩慢。
為了解決這個問題,本研究提出了 FCED-CLIP 模型,利用資料增強技術生成多樣化且高品質的草圖。 FCED-CLIP 模型在Top-1和Top-5分數分別達到66.16% 和81.94%,這證明 FCED-CLIP 模型生成的草圖,能夠有效地擴展 SBIR 的草圖數據集,進而加快 SBIR 研究的速度。

With the widespread application of internet technology and mobile devices, images have become an important means of information transmission. The traditional CBIR, which uses keyword searches for images, no longer meets the modern need for quick and convenient access. Therefore, the emergence of SBIR, which uses sketches as a retrieval method, has begun to rise. However, due to the insufficient training data for sketches, the progress of SBIR research has been slow.
To solve this problem, this study introduces the FCED-CLIP model, which employs data augmentation techniques to produce diverse and high-quality sketches. The FCED-CLIP model achieves Top-1 and Top-5 scores of 66.16% and 81.94%, respectively. This proves that the sketches generated by the FCED-CLIP model can effectively expand the sketch dataset of SBIR, thereby accelerating SBIR research.

1. 緒論 1
1.1 研究背景與動機 1
1.2 過去草圖生成研究 3
1.3 研究目的 4
2. 文獻探討 5
2.1 卷積神經網路(CNN) 5
2.2 反卷積 6
2.3 自動編碼器 7
2.4 AlexNet 8
2.5 VGGNet 9
2.6 ResNet 10
2.7 CLIP 11
2.8 AdaIN 14
2.9 FCED架構 15
2.9.1 跳躍連接 16
2.9.2 條件輸入 16
2.9.3 感知損失 17
3. 研究方法 19
3.1 研究架構 19
3.1.1 FCED 20
3.1.2 CLIP損失 27
3.2 數據資料集 31
3.3 資料增強 32
3.4 訓練流程 32
3.5 程式虛擬碼 33
3.6 預測流程 34
4. 實驗結果 35
4.1 實驗流程 35
4.2 ResNet分類器 36
4.3 分類評估指標 36
4.4 實驗環境 37
4.5 實驗評估結果分析 37
4.6 主觀評估 39
5. 結論與未來展望 42
5.1 結論 42
5.2 未來展望 42
參考文獻 43

