NVIDIA 近日宣布以開源方式釋出一批「實體 AI」(Physical AI)技能與工具,透過全新的 NVIDIA Agent Toolkit,讓 AI 代理人得以直接呼叫 NVIDIA 自家的函式庫、模型與框架,目標是大幅壓縮機器人、自駕車、工業數位孿生與視覺 AI 的開發週期。相關資源已透過 GitHub 及 skills.sh 平台公開釋出,供全球開發者自由取用。
NVIDIA 創辦人暨執行長黃仁勳表示:「AI 代理人正在革新軟體開發,而這場變革如今延伸至實體 AI,進一步滲透到將重塑交通運輸、製造業、醫療照護與機器人領域的系統之中。當代理人能夠直接運用 NVIDIA 的函式庫、模型與框架,實體 AI 的開發速度將大幅提升,讓開發者得以用驚人的速度打造未來的機器人、自駕車與工業系統。」
從核心框架到可呼叫技能:NVIDIA 重新架構整個實體 AI 技術棧
此次開源行動的核心,是 NVIDIA 對旗下整體實體 AI 技術棧的系統性重構。NVIDIA 將多個原本獨立運作的核心框架,轉化為 AI 代理人可直接呼叫的工具技能,涵蓋範圍相當廣泛:用於推理與生成實體世界內容的 Cosmos 世界基礎模型(World Foundation Model)、支援模擬與數位孿生(Digital Twin)建構的 Omniverse 函式庫、聚焦機器人模擬與學習的 Isaac 框架、應用於視覺 AI 的 Metropolis、針對自駕場景優化的 Alpamayo,以及用於邊緣 AI 部署的 Jetson 平台,均已納入 Agent Toolkit 的技能體系。
這項架構轉變的實質意義在於:開發者不再需要手動串接各平台之間的工作流程,而是可以透過代理人自動執行資料生成、模擬運行、模型訓練、結果評估乃至最終部署等一連串任務,形成高度自動化的開發管線。
五大應用垂直領域同步受惠
NVIDIA 指出,此次釋出的技能包能夠加速五大垂直應用領域的開發工作。
- 在機器人與邊緣 AI 領域,開發者可透過技能加速感知與移動訓練資料的生成、自動化導航訓練流程,並針對基於 Jetson 平台的邊緣系統進行部署調校。
- 在自駕車(Autonomous Vehicle)領域,技能可引導代理人將車隊實際採集的行駛資料重建為模擬環境,大規模生成擬真駕駛場景,並執行閉迴路強化學習(Closed-Loop Reinforcement Learning)以擴大訓練與評估覆蓋範圍。
- 在即時視覺 AI 領域,技能支援合成訓練資料的生成、模型微調(Fine-Tuning)、自動化標注,以及能夠搜尋、摘要並分析即時或錄製影像的視覺 AI 代理人建置。
- 在工業 AI 領域,開發者可透過技能將工程設計資料轉換為電腦輔助設計(CAD)資產,供數位孿生模擬使用,並以更少的手動設定優化大型 OpenUSD 場景。
- 在醫療照護領域,醫療團隊可在正式將自動化部署至臨床環境之前,透過代理人技能完成醫院環境的數位孿生建構、模擬至真實(Sim-to-Real)資料生成,以及軟體在迴路(Software-in-the-Loop)政策測試。
開源同步內建安全治理機制
值得關注的是,
NVIDIA 在推動開放性的同時,也同步提供自主代理人的安全治理基礎架構。開發者可透過 NVIDIA NemoClaw 藍圖(Blueprint)與 NVIDIA OpenShell 執行環境(Runtime)部署自主代理人,兩者均內建基於政策的安全性(Policy-Based Security)與隱私治理機制,適用於本地端及雲端硬體環境。
此舉顯示 NVIDIA 有意在推動實體 AI 開放生態系的同時,也將治理能力列為不可或缺的基礎配備,為企業在評估導入代理人系統時提供合規部署的選項。
目前,NVIDIA 實體 AI 代理人工具與技能已透過 GitHub 及 skills.sh 平台正式公開,相容於任何主流程式碼代理(Coding Agent),開發者無需額外授權即可取用並整合至現有開發環境。
本文轉載自 helpnetsecurity。