本文敘述混合型是AI的未來第一部分:透過裝置上AI與混合式AI實現生成式AI的擴展。
隨著生成式人工智慧(AI)的採用速度出現破紀錄的成長、以及運算需求增加,混合處理的重要性更不可同日而語。然而,如同傳統運算從大型主機和精簡型電腦發展到當前的雲端和邊緣裝置混合一樣,AI處理也必須在雲端和裝置間進行妥善的分配,才能擴展並充分發揮潛力。
混合的AI架構不是只在雲端進行處理,而是在雲端和邊緣裝置之間分配並協調AI工作負載。雲端和邊緣裝置—智慧型手機、汽車、個人電腦和物聯網裝置—共同合作,能提供更強大、高效和充分最佳化的AI功能。
圖一 : AI處理必須在雲端和裝置間進行妥善的分配,才能擴展並充分發揮潛力。 |
|
主要的動機是節省成本。以每一筆搜尋的成本為例,相較於傳統的搜尋方法,使用以生成式AI為基礎的搜尋成本估計會增加10倍—而這還只是生成式AI的眾多應用之一。
混合式AI將使生成式AI開發人員和供應商能夠利用邊緣裝置中的運算能力來降低成本。此外,混合的AI架構(或僅在裝置上運行AI)在全球範圍提供效能、個人化、隱私和安全方面額外的優勢。
這些架構可以有不同的卸載選項,根據模型和查詢複雜性等要素在雲端和裝置間分配處理工作。例如,如果模型大小、提示(prompt)和生成長度小於特定閾值,並提供可接受的精確度,便能完全在裝置上運行推理。如果任務較為複雜,模型可以跨雲端和裝置之間運行。
混合式AI甚至能讓裝置和雲端同時運行模型—裝置運行模型的輕量版,而雲端同時處理完整模型的多個代碼(token),並在需要時修正裝置答案。
圖二 : 在以裝置為中心的混合AI架構中,雲端僅用於卸載裝置無法充分執行的 AI 任務。 |
|
藉由邊緣裝置擴展生成式AI
隨著強大的生成式AI模型變得越來越小,裝置上的處理能力不斷提升,混合式AI的潛力也更進一步的成長。具有超過10億個參數的AI模型已經能在效能和精確度水準與雲端相近的手機上運行;而在不久的將來,有100億個參數以上的模型預計也將能在裝置上運行。
混合的AI作法幾乎適用於所有生成式AI應用和裝置類型,包括手機、筆記型電腦、延展實境頭戴式裝置、汽車和物聯網。對於全球生成式AI的擴展以及滿足企業和消費者需求而言,這樣的作法相當關鍵。我們堅信,混合型就是AI的未來。
(本文作者為高通技術公司產品管理資深副總裁Ziad Asghar、高通技術公司工程部門副總裁Jilei Hou)