熱門 AI 推論伺服器 Ollama 與 NVIDIA Triton 爆多項高危險漏洞

2025 / 11 / 10

編輯部

熱門 AI 推論伺服器 Ollama 與 NVIDIA Triton 爆多項高危險漏洞

資安公司 Fuzzinglabs 發現熱門 AI 模型部署工具 Ollama 與 NVIDIA Triton Inference Server 存在多項嚴重漏洞，包括可遠端執行程式碼的命令注入漏洞。兩家廠商已發布修補程式，建議企業立即檢查並更新受影響系統。

隨著越來越多企業開始在地部署 AI 模型以保護資料隱私，相關基礎設施的資安風險也隨之浮現。Fuzzinglabs 將於 12 月 10 日在 Black Hat Europe 2025 發表這項研究，揭露 AI 推論系統(inference system)中的重大安全漏洞。

Ollama 四項漏洞威脅本地 AI 部署

Ollama 是目前最受歡迎的開源 AI 模型執行工具之一，讓使用者能在本地環境運行大型語言模型。Fuzzinglabs 在 Ollama 中發現四項漏洞，涵蓋阻斷服務、身份驗證繞過、任意檔案複製以及記憶體溢位等不同攻擊向量。

其中 CVE-2024-12886 是阻斷服務漏洞，CVSS 評分為 7.5 分，屬於高危等級。CVE-2025-51471 是身份驗證繞過漏洞，攻擊者可繞過正常的身份驗證機制未經授權存取系統。CVE-2025-48889 允許任意檔案複製，攻擊者可能利用此漏洞植入惡意程式碼或竄改關鍵檔案。第四項是堆積溢位漏洞，目前尚未分配 CVE 編號。後三項漏洞尚未獲得 CVSS 評分。

NVIDIA Triton Server 命令注入漏洞「極易利用」

相較於 Ollama 的多項漏洞，NVIDIA Triton Inference Server 雖然只發現一項漏洞，但其嚴重性更高。Fuzzinglabs 在 Triton Server 的模型配置中發現命令注入漏洞。

Fuzzinglabs 執行長 Patrick Ventuzelo 在接受外媒訪問時表示，這個漏洞「非常嚴重，而且極易利用」。此漏洞最危險的特性在於不需要事先身份驗證，攻擊者就能可靠地達成遠端程式碼執行(RCE)。一旦漏洞被利用，攻擊者可在受影響的 Triton 伺服器上執行任意程式碼，完全控制伺服器。

AI 基礎設施成為新的攻擊面

這些漏洞的發現反映了 AI 安全研究的重要轉變。在 ChatGPT 於 2022 年 11 月公開發布後的早期階段，大部分 AI 安全研究聚焦於提示注入(prompt injection)。如今，隨著企業開始自行部署 AI 模型而非僅依賴雲端服務，AI 基礎設施本身成為更顯著的攻擊目標。

Ventuzelo 表示：「現在越來越多公司開始在自己的基礎設施中運行AI模型，這意味著他們需要運行軟體來管理這些模型，而這些軟體就會成為攻擊者感興趣的新目標。如果你在公司內部運行 Ollama 伺服器且暴露在網路上，這就是你企業攻擊面的新目標。」