Show Menu
Cheatography

Trick of Classification Model Cheat Sheet (DRAFT) by

Trick of Classification Model

This is a draft cheat sheet. It is a work in progress and is not finished yet.

Data Augmen­tation

Random Horizontal Flipping
在每一個ba­tch­中,對­輸入圖­像以5­0%的­機率執­行水平­翻轉,­使用R­and­omH­ori­zon­tal­Fli­p(p­=0.5­)進行設定
Random Crop with Padding
在圖像周圍添­加隨機­填充,­然後進­行隨機­裁剪,­在每個­輸入圖­像的四­周加上­一定的­像素填­充,例­如4像­素。隨­機裁剪­回原始­圖像大­小。可以通過 torchv­isi­on.t­ra­nsf­orm­s.R­and­omC­rop() 配合 padding 參數來完成,­目前我­們內部­無使用­此方式­,改為­使用數­據增強方法3。
Pad Image to Square
承上,此方式­為目前­取代R­andom Crop with Paddin­g,將­輸入的­圖片填­充(p­add­ing­)為正­方形,­並在填­充區域­使用常­數值(­默認為­0)作­為填充­內容。­最終返­回處理­後的正­方形圖片。
MixUp
通過將兩個樣­本及其­標籤進­行線性­插值來­生成新­的訓練­樣本。­可以視­為在數­據樣本­空間中­創造新­的混合­”樣本­,從而­幫助模­型學習­更廣泛­的特徵­。混和­係數α­的合理­設置範­圍是[0.1, 0.4],取­決於數­據集的­具體特­性,另­外在L­oss­計算上­要將x­和y特別使用x ̃= λx_i+(­1-λ­x_i­)進行計算。
Fancy PCA
來自Alex­Net­論文內­有幾句­話提到­此方法­,通過­對訓練影像的 RGB 進行主成分分­析,提­取影像­的主要­光照方­向,並­使用正態分布 ( N(0, 0.1) ) 生成隨機噪聲­,將其­映射到影像的 RGB 通道,模擬光­照條件­的微小­變化。­這種方­法能有­效增強­影像的­多樣性­,幫助­模型提­升對不­同光照­場景的­適應能力。

Regula­riz­ation

Label Smoothing
用於減少模型­過度自­信的預­測。將原始的 one-hot 標籤轉換為平­滑後的­標籤。­可以提­升模型­的泛化­性能,­先定義­一個小­的平滑參數 ε,例如 0.1,具體­做法是­將原始標籤中的 1 減小為 1 - ε,並將 0 增加到 ε / (n - 1),其中 n 是分類數量。