Amazon Alexa顯威 智慧家庭人機介面大躍進

2017-02-06
智慧家庭語音操作顛覆想像!繼2016年亞馬遜(Amazon)開放Alexa應用程式介面後,許多終端產品皆前仆後繼發表結合語音功能的智慧裝置,增加更加直覺化的使用者介面,成長潛力一片樂觀。
語音操作躍居智慧家庭人機介面新星。亞馬遜(Amazon)語音助手Alexa無孔不入現身於2017年國際消費電子展(CES)大展,隨處可見的電視、冰箱、空調和洗衣機等智慧家電,甚至是陪伴型機器人皆已導入語音操作功能,堪稱智慧家庭的殺手級應用。

用說的也會通! 語音操作席捲智慧家庭市

圖1 工研院通訊系統研究部經理葉恆芬表示,智慧家庭人機介面,已從手機作為控制中樞,轉為語音作為溝通的橋樑。

工研院通訊系統研究部經理葉恆芬(圖1)表示,相較於2016年的CES展會,大多智慧家庭還是圍繞著以手機作為控制中樞,遙控家中大小各種智慧裝置的局面。繼Amazon於2016年開放出Alexa應用程式介面(API)後,吸引各大廠商相繼導入語音辨識功能。至今,Alexa已具備七千項技能,一百八十家供應商在此平台開發出商品,極可能成為跨平台統一的呼叫方式。

葉恆芬分析,語音介面成長的驅動因素主要有三點,一、語音辨識錯誤率的下降,語音辨識若在85%以下,則不符合導入產品的標準,語音辨識率需達95%以上才具備應用於終端裝置資格,以現階段來說,目前的語音辨識率已高達97∼98%以上,與人類辨識語言的準確率相近;二、行動語音助理使用量提高,現在很多的語音請求來自於行動裝置,以美國用戶而言,目前已有20%的手機用戶以語音形式發起數據服務的請求,舉例來說,Google Now的語音搜尋成長達35倍之多;三、語音平台的API開放,設備、內容與應用程式相繼導入,使得語音運算將有機會成為物聯網裝置主流的輸入型態。

事實上,在智慧家庭領域已陸續出現以人工智慧(AI)晶片為基礎,結合語音和影像辨識技術的功能,以提高物與物之間溝通(Device to Device)的創新,例如樂金(LG)已有多項家電產品導入語音、影像辨識為基礎的深度學習演算法,並與開放網路基金會(ONF)、Google和Amazon策略合作,以提高產品互通性。 然而,當前的語音辨識系統大多還會受到背景雜音的干擾,說話的腔調、方式甚至是不同品牌設備連結等因素,也會影響語音辨識的準確率。有鑑於此,葉恆芬認為,下一階段語音辨識精進的方向,可能朝降低背景雜音干擾、自然辨識說話者語調和某些專用術語(Lingo)的辨識與學習發展。

圖2 工研院產經中心電子與系統研究組零組件研究部經理林澤民認為,未來人機介面朝多重辨識的人機介面技術邁進。

工研院產經中心電子與系統研究組零組件研究部經理林澤民(圖2)補充,除了語音辨識功能之外,NVIDIA CO-Pilot具備語音、臉部識別與唇形辨識三合一的多重辨識能力,可更加精準辨別使用者表達的指令,這種多重辨識的人機介面技術,強化識別的準確性與安全性,將成為未來人機介面發展的趨勢。

人工智慧添力 NVIDIA/Google聯手打造智慧家庭

另一方面,除了人機介面備受矚目之外,NVDIA日前更是與Google聯手,將人工智慧帶入尋常百姓家。NVIDIA與Google合作共同打造具備人工智慧(AI)效能的Android TV,透過NVIDIA推出的全新開放平台媒體串流設備NVIDIA SHIELD TV與NVIDIA SPOT人工智慧麥克風配件,以及Google Assistant的電視裝置的結合,使用者可以透過自然說話的方式,命令人工智慧引擎來執行一些簡單的工作。

NVIDIA執行長黃仁勳表示,SHIELD TV是一個內建Google Assistant的電視裝置,透過Google可優化電視平台上的Assistant體驗,不僅提供語音回覆,更可在家中電視上顯示影像答覆,運用語音指令取代遙控器點選按鈕。

Google Android TV總監Sascha Prueter補充,當Google Assistant在未來幾個月成為Android TV的一部分時,SHIELD的使用者將可以享有免持遙控器的使用經驗,僅需發出「Ok Google」的指令,即可遙控周遭的智慧裝置。

黃仁勳進一步指出,若要將智慧控制功能延伸到住宅的各個角落,就必須在家中布滿節點,故該公司同時推出隨插即用的SPOT人工智慧麥克風配件,內建遠場(Far-field)聲音處理和回音消除(Echo Cancellation)功能,可以擷取約20英尺距離遠的音訊,若在一個空間中布滿多個SPOT,這些SPOT還可透過波束成形(Beam Forming)辨別使用者的所在位置。

黃仁勳談到,SPOT可部署在家中每個角落,這些SPOT皆會通過單一的SHIELD來執行運算功能,透過SmartThings Hub技術讓SHIELD搖身變成一部智慧家庭中控設備,連結超過200種智慧家庭裝置。 想像家中有一個虛擬的人工智慧助理,使用者可以靠在咖啡桌上,透過說話的方式,命令家中各種不同的SPOT執行許多事情,例如呼叫Uber、泡咖啡、啟動音樂與詢問天氣等功能,這些都可在不遠的將來實現。

黃仁勳透露,NVIDIA希望做的是協助大眾可以以更簡單的方式建造智慧家庭,結合Google系統所建置的全新SHIELD平台已可開始預購,而SPOT人工智慧麥克風配件則在未來幾個月內上市。

整體而言,智慧家庭朝向更直覺化的語音操作發展已成趨勢,無論是前者Amazon所提供的語音助理Alexa,或者是後者NVIDIA與Google合作的Google Assistant,語音已成為操作裝置上不可或缺的條件,加快應用市場快速成形。

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!