當全球各地的企業與公部門組織都在開發人工智慧代理(AI agent),以提升工作團隊的能力,也將更依賴搜尋並摘要來自於攝影機、物聯網感測器與車輛等,越來越多裝置所產生的大量AI視覺化資料。
|
將 AI 視覺化後,任何產業現在都能搜尋並摘要大量的視覺資料 |
因此,適用於視訊搜尋與摘要的全新NVIDIA AI Blueprint,則強調能讓幾乎所有產業的開發人員,建立可分析視訊與影像內容的視覺AI代理功能,以支援他們進行各項工作。包括回答使用者的問題、產生摘要,並針對特定情境啟用警示功能;以及用自然語言提示,而非死板的軟體程式碼,來客製化這些視覺 AI 代理,降低在各產業和智慧城市應用部署虛擬助理的門檻。
該藍圖(blueprint)還為NVIDIA Metropolis專供開發人員,用於建置視覺AI應用工具的一部分,結合了NVIDIA電腦視覺與生成式AI技術的客製化工作流程。吸引了包括埃森哲(Accenture)、戴爾科技集團(Dell Technologies)與聯想集團(Lenovo)在內的全球系統整合商與技術解決方案供應商。
估計將用於視覺搜尋與摘要的NVIDIA AI Blueprint,將帶給全球企業與城市使用,將掀起下一波 AI應用的浪潮,可部署於工廠、倉庫、商店、機場、交通路口等,以提升生產效率與安全性。視覺 AI代理則可由視覺語言模型(VLM)驅動,結合電腦視覺與語言理解的生成式 AI 模型,可解釋實體世界與執行推理任務。
其中採用 NVIDIA AI Blueprint 可以為開發人員省去數個月的時間,來研究與最佳化智慧城市應用的 AI 模型。透過在邊緣、地端或雲端環境部署 NVIDIA GPU,可以大幅加快梳理視訊檔案以識別重要時刻的過程。
在倉庫環境中,利用這個工作流程建立的 AI 代理可以在工作人員違反安全規範時加以提醒。在繁忙的十字路口,AI代理可以識別交通事故,並且產生報告以協助緊急應變工作。而在公共基礎設施領域,維護人員可以要求 AI 代理檢視空拍畫面,找出老化的道路、火車軌道或橋樑,以支持更主動地維護。
因此,目前除了智慧空間之外,視覺 AI代理也可用於為視力受損人士摘要影片、自動產生體育賽事回顧,以及協助標示大量視覺資料集以訓練其他 AI 模型。如視訊搜尋與摘要工作流程加入了一系列 NVIDIA AI Blueprint,可輕鬆創造由 AI驅動數位化身、建立虛擬助理以提供個人化的客戶服務,將從 PDF 資料中擷取企業洞察。
開發人員可以免費體驗與下載NVIDIA AI Blueprint,且能透過 NVIDIA AI Enterprise端對端軟體平台,在加速資料中心與雲端進行生產部署,將加快資料科學管道及簡化生成式 AI 的開發與部署。企業與公部門客戶還能在 NVIDIA 合作夥伴生態系的協助下,利用一整套的NVIDIA AI Blueprints軟體。