• 12:00 - 12:30

讓 SLM 走進金融場景:國泰如何建構大規模資料、模型架構到評測的實戰經驗

探索國泰如何微調開源小型語言模型(SLM),與閉源 LLM API 比較成本效益,用於銀行 APP 智慧搜尋功能——在準確度與 Claude Sonnet 3.7 差距僅 6% 的前提下,將單次推論成本降低 380 倍。

我們採用雙軌實驗策略,比較專用型模型(單一場景微調)與通用型模型(多任務微調,涵蓋分類、金融問答與考題),針對 7 款 3B 至 20B 參數的開源模型,系統性測試 prompt 複雜度、RAG 整合、輸出格式與資料集配比等變因。實驗揭示多項發現:微調模型對 prompt 變化的敏感度遠低於 API 模型;同時驗證了「資料品質 > 資料量 > 模型大小」的核心原則,以及邏輯推理能力難以透過標準微調習得的限制。

在成本面,我們提供自建 GPU 與 閉源模型 API 在不同日請求量情境下的完整比較,算出損益平衡點。我們將整個流程萃取為可複用的四階段微調 SOP——從實驗定義、資料準備、實驗設計到訓練評估——為評估 SLM 導入金融合規場景的團隊提供實戰指南。無論你正在優化 LLM 推論成本,或為敏感業務場景打造專屬模型,本場次都能提供可立即應用的策略與經驗。

張睿昇

張睿昇

國泰金控 人工智慧科技科

現任職於國泰金控,專注於人工智慧與金融科技的研發與應用。

擁有 5 年以上軟體工程與深度學習開發經驗,熟練掌握 Python、C/C++、PyTorch、TensorFlow 等技術,並具備 Docker、FastAPI、Linux 等工具的實務部署能力。早期工程經歷涵蓋物件偵測、人臉辨識、文字辨識、瑕疵檢測、物件追蹤等多項應用開發,曾透過 NVIDIA Deepstream 將推論效能提升 20 倍,並具備 24/7 高可用、高負載系統的開發經驗。

現階段深耕金融 AI 領域,主要負責 RAG 系統設計與混合檢索參數調優,主導大型語言模型微調與優化實驗,涵蓋量化、剪枝及 TensorRT-LLM 加速推論,運用高效能運算資源(HPC)進行系統性評估。在生成式 AI 方面,具備 Diffusion 模型研究與影像生成應用經驗。此外,積極投入 AI Agent 系統開發,熟悉多智能體架構(Multi-Agent)與 LLM 工具調用設計。在雲端基礎架構方面,具備完整的 Kubernetes 容器化部署經驗,持續推動 AI 技術在金融服務場景的規模化應用。

  • ROOM
  • Track D
  • LEVEL
  • 中階
  • TAGS
  • LLM/VLM
  • Prompt Engineering