專案計畫書:土地銀行 AI 模型開發案
1. 專案背景與目標
本專案旨在透過人工智慧技術強化土地銀行的數位防詐能力與數據分析效率。核心目標包含優化既有「鷹眼模型」、建置「新型態防詐模型」,並導入「AutoML 自動化框架」以維持模型的長期生命週期與效能。
2. 核心開發模組
I. 鷹眼模型與聯合學習優化
針對現有防詐模型進行精進,並建立一套動態的標籤回饋與觀察機制。
- 標籤定義協助: 與業務端協作,針對交易帳戶與特定事件進行精準標註,建立高品質訓練集。
- 未判斷名單(Gray Zone)機制:
- 目的: 攔截模型判斷不明確的邊緣案例,避免漏報或誤報。
- 處理流程:
- 資料輸入與初步判定。
- 判斷不一致或不明確者,進入「未判斷名單」。
- 透過人工審核或聯合學習模型持續觀察。
-
結果回饋(Feedback Loop)進行模型再訓練。
-
驗收指標: 以 準確度 (Accuracy) 與 召回率 (Recall) 作為期中階段性成果之關鍵指標 (KPI)。
II. 新型態防詐模型 (行為序列預測)
利用深度學習技術,針對用戶的行為模式建立「個人化基準」。
- 資料特徵: 梳理硬體、軟體及客戶端資料,建構序列式資料 (Time-series)。
- 技術路徑: 運用 RNN (循環神經網路) 與 LSTM (長短期記憶模型) 進行建模。
- 風險判斷邏輯: 透過「預測行為」與「實際行為」的差異分析,定義風險等級並制定應對策略。
III. AutoML 模組與自動化框架
提升模型開發與維運的自動化程度。
- 自動化訓練: 整合鷹眼模型與防詐模型,實現自動化模型選擇與參數調優。
- 多維度分析: 提供收入趨勢、下載變化量等市場分析,協助業務決策。
3. 工作內容與交付物
作為團隊成員,你的主要職責將包含:
A. 數據工程與模型開發
- 資料盤點與清洗: 梳理行內現有資料,並將其轉化為適合深度學習的序列格式。
- 模型實驗: 進行 RNN/LSTM 模型開發、數據實驗與回測分析。
- AutoML 整合: 建置自動化模型選擇機制,確保模型能根據新數據持續演進。
B. 文件撰寫與合規交付
- 文件要求: 須產出可編輯之電子檔(相容於 MS Office)及 ODF 開放標準格式文件。
- 內容包含: 技術設計規格書、模型訓練紀錄、驗收測試報告等。
C. 知識轉移 (Knowledge Transfer)
- 教育訓練: 協助規劃並執行至少 3 場次(每場 1 小時以上)的教育訓練。
- 主題涵蓋: 資料蒐集方式、模型原理、精進建議等。
4. 技術棧 (Tech Stack)
- Programming Language: Python
- Deep Learning: PyTorch / TensorFlow (Keras)
- AutoML Tools: Scikit-learn, Auto-Sklearn, or MLflow
- Data Process: Pandas, NumPy
- Documentation: Microsoft Word, LibreOffice (for ODF compliance)