課程名稱:深度學習
領域:人工智慧小組
師資:彭文孝、陳永昇、謝秉均
作者:Cheng-Liang Chi、Zi-Hui Li、Ting-Wan Chang
團隊開發了一套互動式髮型編輯框架,整合 SAM2 用於精準的影像分割、LLaVA 用於語言理解,以及 Stable Diffusion 用於高品質的視覺生成。他們的系統讓使用者能利用自然語言提示修改髮型,同時透過分割引導的修補(inpainting)保持空間控制。評估結果顯示,他們的方法在視覺品質與結構保留方面優於傳統的修補及擴散式方法。