AI 語音助理 物聯網 BMW Amazon NLP

從家庭走向B2B應用 AI智慧聲控全面開枝散葉

2018-12-25
語音人機界面正日趨普遍,此趨勢從歐美地區一路蔓延至亞太地區,包含亞馬遜、Google、Facebook、阿里巴巴和小米等品牌,皆競相搶奪語音市場這塊大餅,而這個趨勢也從家庭領域,逐漸步入各垂直應用領域,為相關市場帶來產業升級的契機,無論是汽車、醫療保健,甚至是智慧零售(無人商店)都開始有所布局。

語音人機界面正日趨普遍,此趨勢從歐美地區一路蔓延至亞太地區,包含亞馬遜、Google、Facebook、阿里巴巴和小米等品牌,皆競相搶奪語音市場這塊大餅,而這個趨勢也從家庭領域,逐漸步入各垂直應用領域,為相關市場帶來產業升級的契機,無論是汽車、醫療保健,甚至是智慧零售(無人商店)都開始有所布局。

IDC企業應用研究經理蔡宜秀(圖1)分析,2022年將有30%的企業透過語音平台與客戶對話;2024年語音平台將取代一些既有企業內部管理系統,包含電子商務服務、寫稿系統與企業資源規畫(ERP)系統。

圖1 IDC企業應用研究經理蔡宜秀表示,目前人工智慧語音發展處於ML Enabled階段。

IDC將語音服務平台分成五大階段,前三個階段大多屬於聊天機器人(Chatbot)服務類型,應用情境屬於常見QA問答,與人的溝通較為被動;但近兩年,隨著人工智慧技術成熟與精準度提升,進入了第四階段ML Enabled,具備基礎的知識語音和語音辨識的能力,而這也是現今語音市場的階段,預計進入第五階段自我學習(Self-learned),將會與更多具備人體五感能力的感測器進行整合,能夠更了解使用情境,實現更自動化的判別與應對。

蔡宜秀談到,從ML Enabled進入到Self-learned階段還需要一些時間演進,前兩年主要是ML Enabled與Chatbot整合,但未來兩三年,除了前兩項服務的整合外,還額外增加機器人流程自動化(RPA)整合需求,滿足企業需要RPA的協助,簡化企業運作流程與優化客戶體驗。

舉例來說,現在的電商網購(EC)平台,使用者須先登入帳號、點選想要的內容,而後進行銷售。未來可能透過語音介面的方式,只須要用「口說」的方式,即能完成所有購物的流程。

蔡宜秀強調,語音應用平台不會是Standalone的應用,其重點在於與其他服務交叉整合,使其發揮成效。所以可以看到整合RPA、ML Enabled、Chatbot這種下一代的溝通平台,主要應用範圍可聚焦於五個面向。首先是提供建議、推薦的智慧投資理財的應用範圍;其次是透過類神經網路,實現文件解鎖分析的應用,例如現在很多醫生,透過ML Enabled、Chatbot的應用,檢索龐大醫療期刊論文的重要資訊;第三與第四類型分別為整合工作自動化(Work Automation)應用與勞動力增強類型,這兩者內容差異不大,較大不同在於前者會增加機器人應用,而後者則是聚焦於生產力提升;最後應用範疇為智慧音箱、智慧家庭類型的娛樂應用為主。

根據Adobe Analytics指出,有約七成智慧音箱的使用者,每天會使用語音助理,其中更有四成的使用者每天多次使用語音助理。這也意味著語音應用已成為日常生活中的一個重要部分,改變了品牌和消費者互動的方式。

西風東漸 智慧音箱橫掃亞太區

然而,AI語音辨識系統應用不僅涉及前端辨識處理的部分,同時也包含後端邏輯分析的處理,主導裝置對語意的理解與回應,這意味著AI語音辨識本身有著地域性、在地文化限制因素,使其發展會依據不同地區狀況,而有不同的成長速度。

晶心科技總經理林志明(圖2)表示,語音辨識應用已呈現西風東漸的發展態勢,代表著採用中文進行語音辨識的風潮,已大舉進入亞太地區。事實上,智慧音箱在歐美市場發展已有一段時間,相較之下,亞太地區真正起飛的時間點,卻是在近兩年才開始有起色,究其原因在於中文的語系辨別難度較為複雜,且不同地區也暗藏不同的口音和方言,更增添語音辨識的難度,導致中文語音辨識市場發展速度較為緩慢。

圖2 晶心科技總經理林志明認為,AI語音辨識風潮已從歐美吹向亞洲,帶動智慧音箱發展起飛。

工研院產科國際所產業分析師陳右怡(圖3)補充,語音辨識除了語言文化問題,同時關乎系統對於內容的了解程度,難以用單一功能評斷語意,故從智慧音箱發展角度來看,最快的應用必將為「自動化」運作。自動化應用就像是控制家中各類型的聯網裝置,例如燈、電鍋、電視、空氣清淨機等小型家電,其技術難度相對較低,但仍有跨平台整合的挑戰有待解決。

圖3 工研院產科國際所產業分析師陳右怡談到,AI語音助理將先從自動化控制著手。

陳右怡認為,智慧音箱市場仍在持續攀升的階段,可說是一個極具潛力的藍海市場。從供應的角度來看,智慧音箱處於一種「正要爆發」的狀態,可看到2017年年底到2018年之間,各式各樣類型的智慧音箱不斷推陳出新,這也反應出廠商積極試水溫,期能透過多樣化的方式,測試消費者對於哪一類產品接受度比較高。

整體而言,2018年AI語音助理應用還是以智慧音箱最受矚目,但說到最適合採用AI語音助理的應用,勢必包括汽車這項應用場域,可看到雲端服務商與車廠皆戮力搶攻車內語音市場的應用。

解放雙手 語音助理變身完美副駕

2018年全球汽車大廠賓士(Mercedes-Benz)與BMW相繼宣布在車內導入AI語音助理功能,讓駕駛員可以解放雙手,僅需透過語音操控的方式,進行車內各式各樣的控制,語音助理儼然化身成為完美副駕駛,幫助駕駛順利又安全的行車。

事實上,這場「雙B大戰」始於2018年年初,賓士率先推出搭載AI語音控制的多媒體車載系統MBUX(Mercedes-Benz User Experience),駕駛者僅須在車內說出「Hey Mercedes」關鍵字,即能透過語音的方式進行天氣播報、道路導航、音樂播放及車內溫控調整等功能。不僅如此,MBUX亦能透過人工智慧學習的方式,習慣駕駛者的使用習慣與說話方式,進一步增強語音辨識的能力。

另一方面,雖然公布時程稍晚,但BMW也不遑多讓隨即在2018年年中宣布於2019年3月的車款中搭載IPA(Intelligent Personal Assistant)智慧型聲控系統,駕駛者同樣僅需要說出「Hey BMW」,即能進行車內所有控制,甚至獲取更多的行動資訊。值得一提的是,IPA系統除了與亞馬遜Alexa系統相容之外,同時也預計和其他數位語音助理相容,提供更廣泛的語音生態系統的連結,這也意味著駕駛者可以透過遠端軟體升級的方式,串聯智慧型手機與車載系統。

雖然汽車整合AI語音助理的前景備受看好,但陳右怡強調,透過語音控制車內系統,還存有車內系統整合與車外生態系連結的問題,這過程皆需要整合時間,讓控制環境能更加人性化與便利。

掌握語音商機 遠場/抗噪/聲紋辨識不可少

相較於國外大廠已有大數據資料的基礎,或者背後有政府靠山支撐,在自然語言處理(Natural Language Processing, NLP)占有舉足輕重的地位,台廠在市場占比跟政府支援缺乏的狀況下,又該何去何從呢?陳右怡認為,從元件角度切入找出突破點,從強化遠場、抗噪與聲紋辨識等共通性一一擊破,將是台廠掌握語音商機的入門機會。

陳右怡談到,若要實現語音辨識,首先收音的性能非常重要,背後就須要仰賴遠場、抗噪的能力。整體而言,目前語音辨識還未能支援多人下指令的功能,故在多人的環境下,若要辨識出真正下指令的用戶,即須採用聲紋辨識的性能,而這也是目前台廠需要思考的重點。

短期來說,以台灣硬體業者需要找到對的夥伴,針對特定市場做相對應的方案開發,但長期來看,還是需要下定培養人才的決心,培植資料科學家才能進一步提供加值服務。

從市場面向分析,除了家庭、車用市場之外,健康照護與商用市場也將成為語音辨識下一個藍海商機。預計語音將朝向B2B類型的應用前進,如商辦大樓、行動會議廳的整合,而這也是AI語音助理即將布局之處。在家庭中智慧音箱只是硬體,但背後商業模式的建立將會是更具潛力的藍海版圖。

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!