Exhibited Works
展出作品

量化後門攻擊的實作與評估

課程名稱:可信任人工智慧

領域:人工智慧小組

師資:游家牧

作者:賴子永

本專案依據近期頂級會議論文,實作一種最先進的量化後門攻擊方法,並以 VGG13 與 CIFAR-10 資料集進行評估。此攻擊採用高度隱匿、肉眼難以察覺且非固定的觸發樣式,以達到最大程度的隱蔽性,貼近真實且現代化的威脅情境。專案同時結合 Quantization-Aware Training (QAT),模擬實際 AI 系統中常見的低位元部署環境。
本研究以 乾淨準確率(Clean Accuracy, CA) 與 攻擊成功率(Attack Success Rate, ASR) 作為主要評估指標,分析後門在不同量化程度下的持久性與穩定性。此成果展現學生成功重現前沿 AI 安全研究的能力,也凸顯量化模型在可信任 AI 應用中仍可能面臨的潛在弱點。