AI 正在改變我們與視覺資訊互動的方式。隨著攝影機、物聯網感測器和車輛等裝置不斷產生大量視覺資料,企業和組織紛紛尋求更智慧的方法,例如 AI 代理(AI Agent)來處理這些資訊。NVIDIA 最新推出的 AI Blueprint 正瞄準這一需求。
【下載 TechOrange 資安趨勢報告】
別等到系統崩潰才後悔!提升企業競爭力「資安」是關鍵
>> 免費下載報告看關鍵技術 <<
AI Blueprint:讓視覺 AI 代理成為現實
NVIDIA 推出適用於視訊搜尋與摘要的 NVIDIA AI Blueprint,旨在讓各行各業的開發人員都能輕鬆建立視覺 AI 代理。這些 AI 代理能夠分析視訊和影像內容回答使用者的問題,產生摘要,甚至在特定情況下啟用警示功能。
這項技術是 NVIDIA Metropolis 工具套件的一部分,結合了 NVIDIA 的電腦視覺技術和生成式 AI 技術的客製化工作流程。使用者可以用自然語言提示,而非死板的軟體程式碼,來客製化這些視覺 AI 代理,目標是降低在各產業和智慧城市應用中部署虛擬助理的門檻。
NVIDIA 指出,多家全球知名的系統整合商和技術解決方案供應商,包括埃森哲(Accenture)、戴爾科技集團(Dell Technologies)和聯想集團(Lenovo),已經開始將這項技術帶給全球企業和城市使用。這意味著,從工廠、倉庫到商店、機場和交通路口,都可能很快就能看到這項技術的應用,進而提升生產效率和安全性。
AI Blueprint 如何運作?
NVIDIA AI Blueprint 利用視覺語言模型(VLM)來驅動視覺 AI 代理。VLM 是一種結合電腦視覺和語言理解的生成式 AI 模型,能夠解釋實體世界並執行推理任務。
可應用場景包含:在倉庫中,AI 代理可以在工作人員違反安全規範時立即提醒他們。在交通管理方面,AI 代理能夠識別繁忙十字路口的交通事故並生成報告,協助緊急應變。同時,在基礎設施維護方面,維護人員可以藉由 AI 代理檢視空拍畫面,找出需要維修的道路、鐵軌或橋樑。這項技術還能輔助視障人士,為其提供影片的摘要內容。此外,AI 代理可以自動產生體育賽事的精華片段,並協助標註大量視覺資料集,用於訓練其他 AI 模型。
各產業實際如何部署?
埃森哲已將 NVIDIA AI Blueprint 整合到其 Accenture AI Refinery 平台中。馬來西亞的 ITMAX 和越南的 FPT 等東南亞系統整合商正在利用這項技術開發智慧城市和智慧交通應用。
戴爾科技集團計劃將 VLM 和代理方法與其 NativeEdge 平台結合,強化現有的邊緣 AI 應用並開發新功能。聯想集團也將 NVIDIA AI Blueprint 納入其 Hybrid AI 解決方案中。
智慧城市應用供應商 K2K 正在使用 NVIDIA AI Blueprint 建立能分析即時路況攝影機的 AI 代理。這將使城市官員能夠詢問有關交通狀況的問題,並獲得改善營運方式的建議。K2K 目前也正與義大利巴勒莫的城市交通管理單位合作,部署這些視覺 AI 代理。
【推薦閱讀】
◆ SearchGPT 不夠看,傳 OpenAI 擬開發瀏覽器直接挑戰 Google
*本文由 NVIDIA 提供,內文與標題經 TechOrange 與 AI 修訂後刊登。新聞稿/產品訊息提供,可寄至:pr@fusionmedium.com,經編輯檯審核並評估合宜性後再行刊登。圖片來源:NVIDIA。
留言 0