歡迎登入資安人
若您還不是會員,請點選下方加入會員
忘記密碼
加入資安人會員
登入
新聞
觀點
專題
解決方案
活動
訂閱電子報
資安人粉絲團
聯絡我們
關於我們
合作詢問
隱私權政策
香港商法蘭克福展覽有限公司台灣傳媒分公司
110 台北市信義區市民大道六段288號8F
886-2-8729-1099
新聞
觀點
專題
解決方案
活動
訂閱電子報
登入
登入
訂閱電子報
新聞
觀點
專題
解決方案
活動
新聞
您現在位置 : 首頁 >
新聞
Meta 推 LlamaFirewall 框架以防止 AI 越獄、注入攻擊及不安全程式碼
2025 / 05 / 02
編輯部
Meta 近日宣布推出 LlamaFirewall,這是一個針對人工智慧(AI)系統安全設計的開源框架,旨在防範新興網路風險,包括提示詞注入、越獄攻擊和不安全程式碼等威脅。
據 Meta 介紹,這個框架整合了三個主要防護機制:PromptGuard 2、Agent Alignment Checks 和 CodeShield。PromptGuard 2 設計用於即時檢測直接越獄和提示詞注入嘗試,而 Agent Alignment Checks 能夠檢查代理推理過程,防範可能的目標劫持和間接提示詞注入情況。CodeShield 則是一個線上靜態分析引擎,旨在防止 AI 代理生成不安全或危險的程式碼。
Meta 在 GitHub 專案描述中表示:「LlamaFirewall 提供一個靈活的即時防護框架,用於保護 LLM 驅動的應用程式。該架構採用模組化設計,使安全團隊和開發人員能夠構建層次化防禦,涵蓋從原始輸入處理到最終輸出操作的全過程,適用於簡單的聊天模型和複雜的自主代理。」
除了 LlamaFirewall,Meta 還發布了 LlamaGuard 和 CyberSecEval 的更新版本,分別用於更好地檢測各種常見違規內容,以及評估 AI 系統的網路安全防禦能力。CyberSecEval 4 還包括一個名為 AutoPatchBench 的新基準測試,專門用於評估大型語言模型(LLM)代理自動修復各種通過模糊測試識別的 C/C++ 漏洞的能力,這一方法被稱為 AI 驅動修補。
「AutoPatchBench 提供了一個標準化的評估框架,用於評估 AI 輔助漏洞修復工具的有效性,」該公司表示。「這一基準測試旨在促進對各種 AI 驅動方法修復模糊測試發現的錯誤的能力和局限性的全面理解。」
此外,Meta 還推出了名為「Llama for Defenders」的新計畫,幫助合作組織和 AI 開發者獲取開放、早期存取和封閉的 AI 解決方案,以解決特定安全挑戰,例如檢測用於詐騙、欺詐和網路釣魚攻擊的 AI 生成內容。
這些公告的同時,WhatsApp 還預覽了一項名為「Private Processing」的新技術,該技術允許使用者利用 AI 功能而不會損害其隱私,方法是將請求轉移到安全、保密的環境中。
Meta 表示,「我們正與安全社群合作審核和改進我們的架構,並將繼續在公開環境中與研究人員合作建構和加強 Private Processing,然後才會在產品中推出。」
本文轉載自thehackernews。
AI 越獄
注入攻擊
不安全程式碼
大型語言模型
C/C++ 漏洞
最新活動
2025.10.15
2025 金融資安發展論壇
2025.09.23
漢昕科技X線上資安黑白講【零信任資安防線|FortiSIEM×FortiDLP打造全方位監控與資料防護】2025/9/23開講!
2025.09.24
資安攻防演練
2025.09.24
產品資安論壇:共築產品資安責任鏈
2025.09.25
面對勒索病毒威脅,資料遺失怎麼辦?3 招讓備份真的能用
2025.10.09
從駭客視角看社交工程:沒有演練,勒索病毒代價有多高?
2025.10.13
關鍵基礎設施-電力系統資安系列課程I(沙崙 X 成大太陽能系統)
2025.10.14
關鍵基礎設施-電力系統資安系列課程II(沙崙 X 成大饋線自動化系統)
2025.10.27
關鍵基礎設施-電力系統資安系列課程III(沙崙 X 成大 電驛系統)
2025.10.31
【雲端安全入門】CCSK 雲端安全知識證照培訓班
看更多活動
大家都在看
SonicWall 遭暴力破解攻擊 防火牆組態檔案外洩 籲用戶立即重設憑證
駭客組織ShinyHunters宣稱藉Drift漏洞竊取15億筆Salesforce資料
OpenAI修復ChatGPT Deep Research重大漏洞 駭客可零點擊竊取敏感資料
駭客升級 Docker API 攻擊工具 恐建構大型殭屍網路
Whoscall 全新改版登場!打造全球性防詐社群機制
資安人科技網
文章推薦
美國 CISA 確認持續支援 CVE 計畫 強調「品質時代」發展重
駭客組織ShinyHunters宣稱藉Drift漏洞竊取15億筆Salesforce資料
微軟聯手 Cloudflare 查封 338 網域 瓦解釣魚即服務集團「RaccoonO365」