這種不使用鍵盤的輸入也是一種HMI,更像是人與人之間的對話,如果再加上高速、高頻寬通信技術的進步,更可對於各種生產設備的進行控制與監視。
自從世界上第一台電腦ENIAC被發明以來,人機之間的溝通就成為電腦科學中非常重要的一個分支學科。二戰期間的ENIAC被用於密碼破譯、炮彈彈道計算等, 但此時的人機之間的溝通還是非常的原始,需要透過打孔紙條來進行指令的輸入和輸出,即使一個功能簡單的程式,也需要幾天時間來製作打孔紙條,並且需要手動開關和電纜的設置。如此「原始」的人機對話模式極大地影響了電腦操作的便捷性,此後各領域的電腦科學專家積極的開發人機介面,來滿足操作者先進的人機對話模式需求。
就傳統而言,當操作人員對生產設備進行指令的下達,不外乎使用了鍵盤、滑鼠,和觸控等進行指示。這種重複的輸出入動作,也可以看作是人與機器之間的對話方式之一。
隨著元件技術與程式語言的進步,現已經可以將指令透過語音的方式來進行輸入,而這種技術則通稱為語音識別,例如,可以透過語音識別方式來進行網站的搜索。這種不使用鍵盤的輸入也是一種HMI(Human-Machine Interface),更像是人與人之間的對話,如果再加上高速、高頻寬通信技術的進步,更可對於各種生產設備的進行控制與監視,除了現場能達到即時資訊獲得,還能夠透過各種雲端服務來進行更為智慧化的辨識和判斷,這樣的突破,讓各種設備與操作人員之間的關係正在發生重大變化。
與鍵盤或觸控式螢幕相比,語音命令在工業環境中具有一定的優勢。首先,它不需要操作員的手或視覺焦點。這意味著操作員可以在向機器發出命令時繼續從事其他任務。
HMI的人工智慧和聊天機器人
如前所述,HMI上的設備端往往更接近人機端,使用語音識別而不是鍵盤輸入單詞是最明顯的例子之一。此外,不僅單詞,人的感官和情感都可能被傳送到設備,並讓設備開始理解它。
過去,語音識別和語音合成系統既複雜又昂貴。但如今,使用AI揚聲器和智慧型手機進行語音輸入和自動朗讀已經變得司空見慣。這些實現是由於硬體和軟體的巨大進步,但是其採用的速度也令人印象深刻。正如智慧型手機在過去十年中變得非常流行一樣,HMI的複雜性和速度可能正在進入一個新階段。
第一個聊天機器人Eliza於1960年被開發出來,但是受限於當時的程式與元件技術,Eliza的功能和執行力很快達到了極限,就像是,Eliza當接收到聊天語句之後,經常出現「我無法回答任何其他問題」,或「現在不是這種情況」等等,令人無法滿意的回覆或答案。
圖一 : 第一個聊天機器人Eliza於1960年被開發出來(照片來源:Oin Interactive) |
|
但隨著程式與元件技術的進步,如今,聊天機器人已經可以與客戶服務展開「合作」,例如當進行購買旅遊服務時,機器人可以對消費者提供有關出發時間和服務的文字或音訊資料。當今的機器人已能夠判別出關鍵字、驗證用戶輸入,並根據預設的規則和程式來進行回復。此外,現代聊天機器人還可以與人工智慧進行協同工作,例如Amazon Alexa,Google Home,Google Assistant等也是聊天機器人。
工廠智慧語音助理已正式被採用在新一代的生產設備
基於語音辨識技術的進步和成熟度,現今已經可以開始被應用在工廠生產線上的設備或管控。近幾年最引人注意的是,美國小型新創公司iT SpeeX在2018年發表了一款 CNC設備的工業用語音助理ATHENA。這套系統包括降噪耳機、一部工業用筆記型電腦,以及內建可整合不同機台設備的軟體。一般而言大多工廠生產線上的機器,往往是各種品牌設備的大雜燴,但是,透過ATHENA的技術,生產線上操作人員可以透過耳機上的麥克風,下達指令給CNC機台,或者提問並調出生產數據。
這樣的工廠智慧語音助理可以讓工廠流程更流暢、錯誤率也更低。雖然目前這款語音助理產品只能適用於工廠生產線上常用的CNC機台,不過如果未來研發至其他工廠設備,將可以大幅度降低使用設備的技術門檻,即使一位不必知道如何操作機台的操作人員也可以輕鬆操作需要處理的事項、下達各種指令。
圖二 : iT SpeeX的ATHENA讓操作人員可以透過耳機上的麥克風,下達指令給CNC機台,或者提問並調出生產數據。(source:Gardner Business Media) |
|
工廠智慧語音助理提供了可與任何控制器一起使用的通用介面,但是它不會取代控制器,而是扮演著位於控制器和操作人員之間,可有效替換鍵盤或功能表式的操控系統。令人難以置信的是,工廠智慧語音助理允許以通用方式,對任何控制器發出自然語句的命令。這使操作員可以輕鬆地在不同的生產設備之間移動,而無需瞭解這些生產設備的不同控制的方式。
工廠智慧語音助理允許操作員控制機器,設置基準和運行程式,此外還可以提供有關機器狀態的報告,執行諸如過程能力之類的計算,並回答如 「如何更換冷卻液?」 之類的問題,這些類似操作手冊中的更換工具問題,在一般功能表示的操作系統中幾乎是不被預設與內建其中的,但是透過工廠智慧語音助理的協助,現在已經成為了很簡單的一個命令執行。
例如:
操作人員:換工具,換五號工具。
工廠智慧語音助理:您確定要更改為五號工具嗎?
操作員:是的ATHENA。
工廠智慧語音助理:更改為五號工具。
日本工具機設備大廠牧野,已經將iT SpeeX的ATHENA工廠智慧語音助理應用在工具機設備中,為未來工具機的人機互動創造了無限可能。牧野透過Hyper-i控制系統將Athena連接起來。而Athena的硬體包括第二個顯示螢幕和HyperConnect 功能,該功能可以實現與個人電腦或智慧設備的完全互連,還配有遠程監控,包括電子郵件警報。
圖三 : 牧野已經將iT SpeeX的ATHENA工廠智慧語音助理應用在工具機設備中,為未來工具機的人機互動創造了無限可能。 |
|
牧野的a500Z系列產品搭配連接ATHENA來實現語音控制,來進行指示燈的ON/OFF狀態、刀具更換、主軸停止、彙報機床狀況等。當操作人員戴上耳機後就可以直接透過麥克風說出ATHENA需要做的事項,而ATHENA也能夠接收複雜的語言指令,並且執行對應工作。
不斷進步的自然語言系統
利用語音進行命令時,口語的速度非常快,大多數人每分鐘最多只能可以輸入60個單詞,但一般人與人交談的情況下,可以相當平穩且不疾不徐地以兩倍的速度說話。
早期的語音命令系統只是用語音辨識代替了鍵盤。這意味著必須按正確的順序說出特定的命令字。對控制器進行程式設計以接受這些輸入是相對簡單的,並且語音辨識引擎可以僅偵聽少量命令字,進而大大提高了識別準確性。但是,這種方法並不能減少操作複雜生產設備時所需要的訓練。實際上,如果沒有視覺回饋,記住複雜過程的順序就會讓「操控設備」這件事變得更加困難。這也意味著控制器可能需要內建一些語音提示,例如「確定」等等。
當前的語音命令系統是帶有語音辨識功能的自然語言(NLP)系統。這使電腦能夠理解句子的含義,而不是簡單地識別標準命令。從理論上講,複雜的指令可以作為操作員與控制器之間的自然對話而給出,從而節省了時間並大大減少了培訓需求。操作員應該可以簡單地告訴機器他們想要做什麼。在執行不可逆操作之前,機器可能需要進行一些澄清和最終確認,但它們都應該自然而有效。但是,目前,NLP並不總是完全可靠的,結果可能會有些混亂。
而CONICS語音機器介面(VMI)是一種更通用的工業數位助理。可以在製造,能源管理,工業自動化或智慧建築中執行一系列功能。例如,監視系統和過程的狀態,控制設備和設備以及分析KPI。VMI使用Microsoft Cortana(微軟出品的智慧語音助手),Amazon Alexa(亞馬遜出品的Amazon Alexa)和Google Assistant(谷歌助理)等消費類數位助理的語音辨識功能。例如操作人員說出「嘿,Cortana。1號生產線的能源效率是多少,與上個班次相比有什麼不同?」VMI就會提供相對應的答案,例如「1號線的能源效率為78.3%,比昨天增加了2%」。
結語
使用語音與機器和資料自然交互的能力正在徹底改變人類如何使用機器的方式。以其最基本的形式,該技術允許釋放雙手和保持視線不變的交互,以便操作員可以在執行其他任務時指揮機器並獲取資料。最新一代的基於自然語言處理的系統意味著不再需要學習複雜的功能表系統。您只要問你想要什麼。這將在減少訓練和使操作人員更靈活地在不同工作之間轉移。因此語音命令將採用大量非協作機器人技術,使人類和機器人在同一空間中並排工作。