当全球各地的企业与公部门组织都在开发人工智慧代理(AI agent),以提升工作团队的能力,也将更依赖搜寻并摘要来自於摄影机、物联网感测器与车辆等,越来越多装置所产生的大量AI视觉化资料。
|
将 AI 视觉化後,任何产业现在都能搜寻并摘要大量的视觉资料 |
因此,适用於视讯搜寻与摘要的全新NVIDIA AI Blueprint,则强调能让几??所有产业的开发人员,建立可分析视讯与影像内容的视觉AI代理功能,以支援他们进行各项工作。包括回答使用者的问题、产生摘要,并针对特定情境启用警示功能;以及用自然语言提示,而非死板的软体程式码,来客制化这些视觉 AI 代理,降低在各产业和智慧城市应用部署虚拟助理的门槛。
该蓝图(blueprint)还为NVIDIA Metropolis专供开发人员,用於建置视觉AI应用工具的一部分,结合了NVIDIA电脑视觉与生成式AI技术的客制化工作流程。吸引了包括埃森哲(Accenture)、戴尔科技集团(Dell Technologies)与联想集团(Lenovo)在内的全球系统整合商与技术解决方案供应商。
估计将用於视觉搜寻与摘要的NVIDIA AI Blueprint,将带给全球企业与城市使用,将掀起下一波 AI应用的浪潮,可部署於工厂、仓库、商店、机场、交通路囗等,以提升生产效率与安全性。视觉 AI代理则可由视觉语言模型(VLM)驱动,结合电脑视觉与语言理解的生成式 AI 模型,可解释实体世界与执行推理任务。
其中采用 NVIDIA AI Blueprint 可以为开发人员省去数个月的时间,来研究与最隹化智慧城市应用的 AI 模型。透过在边缘、地端或云端环境部署 NVIDIA GPU,可以大幅加快梳理视讯档案以识别重要时刻的过程。
在仓库环境中,利用这个工作流程建立的 AI 代理可以在工作人员违反安全规范时加以提醒。在繁忙的十字路囗,AI代理可以识别交通事故,并且产生报告以协助紧急应变工作。而在公共基础设施领域,维护人员可以要求 AI 代理检视空拍画面,找出老化的道路、火车轨道或桥梁,以支持更主动地维护。
因此,目前除了智慧空间之外,视觉 AI代理也可用於为视力受损人士摘要影片、自动产生体育赛事回顾,以及协助标示大量视觉资料集以训练其他 AI 模型。如视讯搜寻与摘要工作流程加入了一系列 NVIDIA AI Blueprint,可轻松创造由 AI驱动数位化身、建立虚拟助理以提供个人化的客户服务,将从 PDF 资料中撷取企业洞察。
开发人员可以免费体验与下载NVIDIA AI Blueprint,且能透过 NVIDIA AI Enterprise端对端软体平台,在加速资料中心与云端进行生产部署,将加快资料科学管道及简化生成式 AI 的开发与部署。企业与公部门客户还能在 NVIDIA 合作夥伴生态系的协助下,利用一整套的NVIDIA AI Blueprints软体。