Exhibited Works
展出作品

利用多模型輸出排序與逐步蒸餾訓練具推理能力的小型語言模型

課程名稱:深度學習

領域:人工智慧小組

師資:彭文孝、陳永昇、謝秉均

作者:Eric Lin、Tim Kuo、Hsing-Yu Chen

這個團隊設計了一個高成本效率的流程,用於訓練具備強推理能力的小型語言模型。他們收集多個大型語言模型(LLMs)的輸出,透過成對排序(pairwise ranking)挑選高品質的推理過程(rationales),並進行逐步蒸餾(progressive distillation)來訓練學生模型(T5-Base 與 T5-Large)。他們的方法在準確率上可與使用真實標註資料的訓練相當,且優於未使用回覆排序的其他方法。