利用多模型輸出排序與逐步蒸餾訓練具推理能力的小型語言模型

課程名稱：深度學習

領域：人工智慧小組

師資：彭文孝、陳永昇、謝秉均

作者：Eric Lin、Tim Kuo、Hsing-Yu Chen

這個團隊設計了一個高成本效率的流程，用於訓練具備強推理能力的小型語言模型。他們收集多個大型語言模型（LLMs）的輸出，透過成對排序（pairwise ranking）挑選高品質的推理過程（rationales），並進行逐步蒸餾（progressive distillation）來訓練學生模型（T5-Base 與 T5-Large）。他們的方法在準確率上可與使用真實標註資料的訓練相當，且優於未使用回覆排序的其他方法。

利用多模型輸出排序與逐步蒸餾訓練具推理能力的小型語言模型

指導單位

教育部高等教育深耕計畫、國立陽明交通大學教務處

主辦單位

國立陽明交通大學教學發展中心創創工坊

聯繫窗口

聯絡電話｜ 03-5712121#50146 林小姐

電子信箱｜ ict@nycu.edu.tw

Instagram

Facebook

官方網站

選課系統