99
Granite 4.0 採用創新的 Mamba/Transformer 混合架構,突破傳統 Transformer 模型處理長文本的效能瓶頸。Mamba 架構可線性擴展上下文長度,讓 Granite 4.0 在處理複雜任務時,大幅減少記憶體的使用量達 70%,推理速度卻加快 2 倍,同時支援更平價的 GPU包括家用硬體。這項突破對台灣中小企業與開發者意味著高效能 AI 不再是高成本的同義詞,而是人人可及的技術資源。
Granite 多元模型版本,滿足各種企業需求
Granite 4.0 提供多種模型規格,靈活應對不同場景:
- Granite-4.0-H-Small:總參數量32B的混合式專家模型,活躍參數9B,適合客服自動化、多工具代理任務;
- Granite-4.0-H-Tiny:總參數量7B的混合式專家模型,活躍參數1B,適合邊緣運算與地端部署;
- Granite-4.0-H-Micro:總參數量3B 的混合式模型,快速執行關鍵任務;
- Granite-4.0-Micro:傳統 Transformer 架構,適用於尚未支援混合架構的平台。
Granite 4.0 所有模型皆提供 Base 與 Instruct 版本;並預計於2025年底推出強化邏輯推理的Thinking 模型。
小模型,大效能
Granite 4.0模型雖然尺寸精簡,但在多項基準測試中的表現,超越同級與其他大型開源模型:
- 在 Stanford IFEval 指令遵循測試中,Granite-4.0-H-Small 表現優於所有開源模型(除 Llama 4 Maverick 外);
- 在 Berkeley Function Calling Leaderboard v3 中,Granite-4.0-H-Small 以更低成本達到與大型模型相同的工具調用準確率;
- 在 MTRAG 多輪檢索增強生成測試中亦有亮眼表現。
上述成果歸功於 IBM 全面升級了模型架構、訓練方法與資料品質,包含使用一個精心編製、聚焦於企業應用的 22 兆字元規模的語料庫。Granite 4.0 的預訓練資料涵蓋多元來源,包括 DataComp-LM (DCLM)、GneissWeb、TxT360 子集、Wikipedia 以及其他與企業場景高度相關的資料來源。為了增強模型處理企業任務的表現,這些模型經過後訓練(post-training),涵蓋語言理解、程式碼生成、數學推理、多語言處理、安全性、工具調用 (tool calling)、檢索增強生成(RAG)與資安等多個領域,並結合合成資料與開放資料集進行優化。