圖一 : Arduino官方銷售9歐元的語音識別引擎(圖片來源:Arduino官網) |
|
許多創客(maker)在使用Arduino進行創作開發時通常會用到各種函式庫(library,對岸直接翻譯成一個字:庫),例如為了能操控伺服馬達需要使用servo函式庫,為了能操控步進馬達需要使用stepper函式庫,或者要使用SPI傳輸介面、使用感測器等也都需要使用對應的函式庫。
這些函式庫有些在安裝完Arduino IDE後就已經隨附內建,有些則需要使用者額外手動操作以便進行連線下載安裝,或更原始的作法是手動下載、手動安裝等,但印象中函式庫的下載使用都不用付費。基本功能的函式庫確實如此,但若是開發者花費許多心力才完成的函式庫則可能要付費才能使用。
Arduino推出語音識別引擎
過往以來Arduino官方多半只銷售硬體開發板或相關的硬體配件,軟體通常免費提供,而近期Arduino特別與Cyberon公司合作,運用Cyberon公司的開發技術推出Arduino官方版的語音識別引擎(Arduino Speech Recognition Engine,其實就是函式庫),並在Arduino官網上銷售,一套9歐元。
Arduino推出Arduino Speech Recognition Engine(以下暫時簡稱ASRE)是為了Arduino Pro領域而推的,言下之意是用於產業應用,產業應用有相對高標的功能要求,也相對較願意付費使用。
ASRE有許多特點,首先它是預先訓練成的人工智慧/機器學習(AI/ML)模型,付費取得後立即可用,不再需要自行訓練,同時只要簡單的文字輸入就能對命令(command)進行組態配置;其次是它可以識別多個喚醒字詞(wake-up word)、識別命令的連續性等;三是已經支援40多種語言,且不受語氣、腔調口音的影響。
四是一種組態配置就能用於多個喇叭(或稱揚聲器、音箱)也是不用重新訓練;五是適用於吵雜環境,此點對於產業應用特別需要,產業應用可能在戶外、可能在工廠,環境背景噪音難以控制;六是直接在現場就進行識別推論,不再需要連線到後端,借助其他軟硬體協助推論。
ASRE是運用Cyberon公司的技術但針對Arduino而開發調整而成,自然能夠支援現有Arduino的相關軟硬體。在硬體方面,ASRE支援多款Arduino開發板,包含Portenta H7、Arduino Nano RP2040 Connect、Arduino Nano 33 BLE Sense Rev2等;在軟體方面,ASRE自然支援最常使用的Arduino IDE,但除此之外也支援命令列方式操作的Arduino CLI。
雖然要付費,但其實還是有免費體驗版,體驗版必須先到Cyberon官網上,輸入個人的E-Mail、已經購買的Arduino開發板類型(前述三者之一)以及開發板的序號等才能取得免費體驗版,體驗版與付費版的識別正確性一致,但識別次數與觸發模式的時間有別,免費版只能識別50次,付費版則無限制;免費版在觸發模式時會延遲20秒時間才觸發,付費版則沒有延遲。另外要注意的是,付費版付費之後畢竟就已取得正式軟體,而軟體是可以任意拷貝、複製的,所以不合用也不允許退費。
圖二 : 免費版(Free Trial)與付費版(Cyberon License)的差異比較(圖片來源:Arduino官網) |
|
圖三 : 語音識別引擎目前支援三種Arduino官方板卡(圖片來源:Cyberon官網) |
|
小結
進一步的,Arduino官方已經幫ASRE設想數種使用情境,例如廠房裡頭因為搬運而騰不出手時的語音呼叫操作,或用於建築物自動化相關應用,或是資訊服務亭(kiosk)、自動販賣機、自動鎖、醫院的智慧病床或是緊急呼叫系統等。
最後提醒兩點,一是ASRE佈建模型不允許客製,但付費購買是可以用來產生新模型;二是軟體授權是把處理器核心Cortex-M4/M7與Cortex-M0分開的,前者適用於Portenta H7跟Nano 33 BLE Sense兩片板子,後者只適用於 Arduino Nano RP2040 Connect一片板子,兩者恐無法互通使用。
(本文由VMAKER授權轉載;連結原文網址)
延伸閱讀
[1]語音識別引擎官方網頁
https://www.arduino.cc/pro/software-speech-recognition-engine
[2]申請免費體驗版網頁
https://tool.cyberon.com.tw/ArduinoDSpotterAuth/CTMain.php
[3]ASRE官方銷售網頁
https://store.arduino.cc/products/speech-recognition-engine?variant=42904193204375