讓 SLM 走進金融場景：國泰如何建構大規模資料、模型架構到評測的實戰經驗

12:00 - 12:30

讓 SLM 走進金融場景：國泰如何建構大規模資料、模型架構到評測的實戰經驗

探索國泰如何微調開源小型語言模型（SLM），與閉源 LLM API 比較成本效益，用於銀行 APP 智慧搜尋功能——在準確度與 Claude Sonnet 3.7 差距僅 6% 的前提下，將單次推論成本降低 380 倍。

我們採用雙軌實驗策略，比較專用型模型（單一場景微調）與通用型模型（多任務微調，涵蓋分類、金融問答與考題），針對 7 款 3B 至 20B 參數的開源模型，系統性測試 prompt 複雜度、RAG 整合、輸出格式與資料集配比等變因。實驗揭示多項發現：微調模型對 prompt 變化的敏感度遠低於 API 模型；同時驗證了「資料品質 > 資料量 > 模型大小」的核心原則，以及邏輯推理能力難以透過標準微調習得的限制。

在成本面，我們提供自建 GPU 與閉源模型 API 在不同日請求量情境下的完整比較，算出損益平衡點。我們將整個流程萃取為可複用的四階段微調 SOP——從實驗定義、資料準備、實驗設計到訓練評估——為評估 SLM 導入金融合規場景的團隊提供實戰指南。無論你正在優化 LLM 推論成本，或為敏感業務場景打造專屬模型，本場次都能提供可立即應用的策略與經驗。

張睿昇

國泰金控數據暨人工智慧發展部人工智慧科技科資料科學分析師

現任職於國泰金控，專注於人工智慧與金融科技的研發與應用。

擁有 5 年以上軟體工程與深度學習開發經驗，熟練掌握 Python、C/C++、PyTorch、TensorFlow 等技術，並具備 Docker、FastAPI、Linux 等工具的實務部署能力。早期工程經歷涵蓋物件偵測、人臉辨識、文字辨識、瑕疵檢測、物件追蹤等多項應用開發，曾透過 NVIDIA Deepstream 將推論效能提升 20 倍，並具備 24/7 高可用、高負載系統的開發經驗。

現階段深耕金融 AI 領域，主要負責 RAG 系統設計與混合檢索參數調優，主導大型語言模型微調與優化實驗，涵蓋量化、剪枝及 TensorRT-LLM 加速推論，運用高效能運算資源（HPC）進行系統性評估。在生成式 AI 方面，具備 Diffusion 模型研究與影像生成應用經驗。此外，積極投入 AI Agent 系統開發，熟悉多智能體架構（Multi-Agent）與 LLM 工具調用設計。在雲端基礎架構方面，具備完整的 Kubernetes 容器化部署經驗，持續推動 AI 技術在金融服務場景的規模化應用。

ROOM
701F
LEVEL
中階
TAGS
LLM/VLM
Prompt Engineering

讓 SLM 走進金融場景：國泰如何建構大規模資料、模型架構到評測的實戰經驗

張睿昇

國泰金控 數據暨人工智慧發展部 人工智慧科技科 資料科學分析師

國泰金控數據暨人工智慧發展部人工智慧科技科資料科學分析師