讓手機與人更親近 生物辨識與人性化技術日新月異

2006-01-04
藉由各種新興的生物辨識技術與人性化介面技術,手機的操作模式愈來愈接近人類的自然行為,而在引進新技術的同時,技術研發業者與手機業者也必須在辨識正確性、表現效能,以及有限的手機運算資源之間...
藉由各種新興的生物辨識技術與人性化介面技術,手機的操作模式愈來愈接近人類的自然行為,而在引進新技術的同時,技術研發業者與手機業者也必須在辨識正確性、表現效能,以及有限的手機運算資源之間,持續尋求最佳的平衡點。  

當手機成為不可或缺的通訊工具,附加的功能也愈來愈複雜,如何讓手機更貼近人性,以最自然的方式操作各種複雜功能,成為手機設計者的一大挑戰。在這樣的需求下,各種人性化技術應運而生,紛紛出現在手機應用的各層面,目的都是為了讓手機更有人味。  

手機的人性化技術,可以很複雜,也可以很簡單。公認最早的手機人性化設計,應是諾基亞手機的功能選單,極為容易上手的操作方式,讓許多使用者捨不得更換手機品牌。  

而隨著手機扮演的角色日趨複雜,人性化技術隨之多元化,在輸出、輸入、安全防護等方面,都有愈來愈多的精密技術被移植至手機中。  

在指令與文字的輸入方面,語音辨識、手寫辨識等技術已經漸漸成熟,逐漸成為手機的必備功能。而搭配照相手機而產生的字型影像辨識,以及二維條碼影像辨識,則是逐漸加溫。韓國手機業者帶動的3D動作辨識技術,更已開始被應用在手機遊戲的操控上。  

由於手機逐漸成為儲存各種資料的載具,保密性與安全性的需求愈來愈迫切,因此各種生物辨識技術也逐漸從PC移植至手機,包括發展時間較早的指紋辨識與聲紋辨識,以及近期才逐漸被移植到手機上的人臉辨識技術,都是利用人類生物特徵提供安全防護的熱門技術。而近期由日商開發的手指靜脈與手掌靜脈辨識技術,目前在筆記型電腦與提款機的應用上備受矚目,感應裝置的體積也逐漸縮小,深具未來應用於手機上的潛力。  

在輸出方面,由於智慧型手機與PDA手機的運算能力提升,即時性3D介面技術逐漸被應用在遊戲與選單介面上,讓手機使用的視覺經驗更貼近真實世界。而語音合成技術,則是讓手機可以「說話」,藉由語音合成系統的改良,儲存與運算能力有限的手機,也可以用說話的方式,報出來電者的名字,或是在結合GPS提供導航功能時,用更接近真人的語音,說出開車方向的提示訊息。  

語音辨識:向連續語句判讀發展  

語音辨識在手機上的應用已經趨於成熟,許多手機都具備語音撥號功能。早期的語音辨識在使用上較為麻煩,必須先由使用者自行預錄聲紋樣本以供比對,而近期則出現不須預錄即可直接進行辨識的聲紋辨識技術,在使用上更簡便。  

蒙恬科技核心技術部處長洪成安(圖1)指出,除了常見的語音撥號功能,用語音向手機發出指令的功能也愈來愈重要。由於手機不像個人電腦可以一次開啟多個視窗同時執行多個程式,在程式之間切換比較麻煩,如果以語音向手機發出指令,就可以更輕易地跳到另一應用程式,不須再回到主選單尋找。  

而長期進行語音技術研發的工研院電通所前瞻技術中心,也持續將語音辨識技術移植至手機上。研究員沈新民表示,目前的語音辨識技術仍有一些限制,例如必須在安靜環境之下才能判讀,手機能處理的語句也僅限於簡單的指令、人名等。未來手機的語音辨識技術將朝向抗噪以及自然語言理解等方向發展,讓手機在噪音環境下也能進行辨識,並具備語言理解能力,能處理連續句子,用以輸入更長的語句。這樣的發展,將考驗手機的運算能力。  

不過,由於3G技術提升手機頻寬,因此分散式運算的概念已逐漸被引進,未來將把一部份運算量較大的工作,以頻寬傳出去,在遠端伺服器上作運算,再將運算結果即時回傳,手機則只負責初步的指令處理工作。  

語音合成:讓手機說自然語言  

語音合成技術,是讓手機說出接近自然語言的技術,可以幫助使用者在開車或不方便閱讀螢幕時,也可以透過語音,知道來電者的身份。當手機具備GPS導航功能,語音合成技術也能提供駕駛方向指示。  

工研院電通所前瞻技術中心研究員沈新民表示,目前在GPS PDA上常見的是傳統的語音合成系統,採取串接式的語音合成技術,必須由真人預錄大量語句,占用相當大的儲存空間。而目前電通所前瞻技術中心的研發方向,則是根據特定應用,特別開發出專用的一個語音合成系統,並且發音相當接近真人,在語音表現與占用記憶體大小之間取得平衡點。  

這種特定應用型的語音合成系統,是以一般化的分析方法為核心,於上層加以修改,對應於各種不同應用的資料庫,以節省儲存空間。以目前在Symbian與Windows CE上開發的系統而言,會減少一半以上記憶空間,大致在5Mb以下,如果只為了中文人名的發音,只需要略大於1Mb的空間,相當適於手機應用。沈新民指出,目前明基(BenQ)已將這項技術用於手機通訊錄。而除了手機來電身份提示與GPS導航之外,將來語音合成技術也能應用於股票機,以及保全人員的緊急狀況提示。  

手寫辨識:解決中文輸入瓶頸  

由於手機鍵盤非常不利於中文輸入,使得手寫辨識技術在中文世界中格外重要。由於手寫辨識必須占用RAM、ROM與CPU資源,因此在低階手機上,受限於運算能力,一次只能書寫一個字,在高階的PDA手機上,則可以進行連續書寫。  

從1991年即開始投入手寫辨識技術的蒙恬科技表示,手寫辨識技術已經歷經數次進展,以該公司技術為例,第一代技術僅能一筆一畫工整書寫,並且必須符合中文筆順才能辨識,第二代則將語音辨識的演算法應用於手寫辨識,可以進行連筆書寫辨識,但仍必須遵循正確的筆順。到目前的第三代技術,則將人臉特徵辨識技術演算法與手寫辨識結合,如此一來辨識的依據是整個字的字型,輔以書寫動態資訊,不再受限於筆順,使用者可以完全依照原有的書寫習慣即可,使用上更為便利。  

在手機上搭載手寫辨識功能,目前有二種方式,一種為純軟體方式,必須使用手機原有硬體運算資源。另一種方式則為內建另一顆MCU,由該顆MCU負責手寫辨識運算,不需占用手機硬體資源,適合運算能力較低的功能型手機使用。蒙恬科技董事長蔡義泰(圖1)表示,該公司在2005年5月,即與義隆電子合作開發出一顆MCU,目前獲得台灣的英華達等手機廠採用。蒙恬另外也利用此MCU開發出手機專用的手寫版,以藍芽連接於本身不具備觸控式螢幕的手機(圖2)。蔡義泰也指出,由於中文在手機鍵盤上輸入不便,而使用中文地區對於以手機傳遞中文確有龐大的需求,手寫輸入技術在大中華地區將有極大的市場潛力。  

指紋辨識:即將迎接高成長  

指紋辨識技術在手機上的應用正逐漸萌芽。由於指紋辨識感應器體積的縮小,以及軟體技術的進化,日本與韓國業者已開始將指紋辨識功能大量應用於手機。日本NTT DoCoMo更曾經宣示,該公司將來推出的所有手機,都要具備指紋辨識功能。  

指紋辨感測技術有許多種類,包括電容式、壓感式、熱感式、光學式,以及RF皮下感測等方式。在早期即出現的門禁系統應用上,以電容式感測器為大宗,但是由於電容式感測器容易受到靜電與潮濕的影響,在手機應用上的表現較不穩定。目前在日本僅有富士通在手機上全面採用電容式指紋感測器。  

光學式的指紋感測器,則是近年來較多廠商的選擇,包括日系的恩益禧(NEC)、卡西歐(Casio)、美上美(Mitsumi),以及美國的數位人科技(Digital Persona),都已開發出可應用於手機的光學式指紋感測器。而位於台灣新竹科學園區的宜霖科技(ElecVision),則是從CMOS影像感測器的研發轉型至指紋辨識技術的台灣本土業者。  

宜霖科技總經理林瑞健(圖3)指出,傳統的光學式指紋辨識技術最大的瓶頸,在於厚重的光學機構,無法使用在行動型指紋辨識器上。較新型的光學式指紋感測器,則將體積縮小,讓使用者將手指刷過感測器即可。僅次於宜霖科技,目前全世界較輕薄的光學式指紋晶片是NEC與美上美的產品,厚度皆為2.8mm,且尚未量產,宜霖科技則開發出厚度減少為1.15mm的產品(圖4),並且已在2005年第四季導入量產(表1)。林瑞健表示,較薄的感測器將更適合安裝在空間有限的手機上,而目前已有三至四家日本手機大廠將宜霖科技的感測器納入設計。  

林瑞健指出,該公司目前以日本市場為主力,根據觀察,手機業者在選擇指紋辨識技術時,首要的考慮因素仍是成本,其次則是產品的穩定度,而在納入整體手機設計時的容易程度,也是重要關鍵,因為手機業者並不願意只為了加入指紋功能,而增加研發時間。目前在指紋辨識的處理方面,雖然大多採取軟體方式,由手機的DSP負責運算,林瑞健卻認為,為了減輕手機處理器的負擔,未來將逐漸走向硬體辨識。  

另一家手機指紋辨識技術大廠則是位於美國佛羅里達州的奧森科技(AuthenTec),該公司專門從事指紋技術研發,也最早將指紋技術帶進手機市場。該公司採用的感測方式,是以射頻(RF)對手指真皮層進行掃描。該公司台灣及東南亞地區總經理朱文鏗(圖5)指出,奧森科技的射頻電場(RF Field)技術的特點在於可以穿透皮膚,直接辨識真皮層,不受外在環境影響。  

朱文鏗舉例,光學式感測器都是感測表皮層,在判讀紋路較不明顯的女性手指、長繭的手指,或是流汗的手指時,辨識能力較容易受影響。另外,日系的電容式感測器,以及美商愛特梅爾(Atmel)的熱感式感測器,則不易判讀過於乾燥的手指。而射頻電場技術則是直接穿透皮膚,掃描內部的鹽水導電層(真皮),不受表皮狀況影響,準確性較高。  

奧森科技的指紋辨識技術目前已進入第15代產品,尺寸比前一代產品縮小20%,是全球最小的指紋感測器(圖6)。朱文鏗表示,其產品目前在整體指紋辨識市場有44.5%的占有率,其中有超過50%應用於手機產品,目前已有包括富士通、三星、LG等日、韓手機大廠採用其產品。  

觀察指紋辨識技術在手機上的應用趨勢,朱文鏗認為,目前主要仍以日、韓手機廠商在其國內市場推出為主,並應用在行動銀行、小額付費等應用等。相較於日、韓業者的積極,國際一線手機大廠則仍在觀望,尚未針對全球市場推出具備指紋辨識功能的手機。不過他也透露,目前多家日韓以外的全球手機大廠已開始進行指紋手機設計,預計在2006年底至2007年第一季,將有多款指紋辨識手機問世。  

指紋起初在手機上的應用,以安全防護,取代文字密碼的功能為主,但是隨著加值應用服務環境的成熟,指紋辨識的應用逐漸多元,新的商業應用模式應運而生,更進而帶動需求。業者也發現,以往強調的安全防護功能,對於消費者的吸引力反而不高,因此手機廠目前也特別強調指紋感測器可以取代方向鍵,用於選單控制,或是手機遊戲(圖7)等。韓國手機廠商Pantech更是推出「指紋算命」功能,廣受年輕族群歡迎。  

朱文鏗認為,根據該公司在日本進行的調查,發現日本消費者對於利用指紋來鎖住手機上的部分資料目錄的需求確實存在,例如鎖住部分不宜外洩的通訊錄資料,或是限制級圖片的資料夾等,是日本男性相當感興趣的功能。不過,朱文鏗也表示,隨著手機逐漸被加入金融功能,未來指紋技術在金融交易的安全應用,預計將是最大的市場。  

3D介面:提供視覺享受  

手機逐漸成為娛樂平台,在視覺上的表現也更瘦重視,即時性的3D介面技術,因而漸受重視。智崴資訊副總經理林政輝觀察,目前多家國際級3D繪圖晶片業者已陸續進入手機市場,包括ATI、nVIDIA等晶片業者都相當積極。而從遊戲機與個人電腦等硬體至終都必須具備3D顯示功能的趨勢來看,林政輝認為手機未來也將必須具備3D顯示能力,才能在市場上生存。  

林政輝表示,在一年多前諾基亞與索尼愛立信正式推出即時運算的3D手機,隨後日、韓手機業者迅速趕上,在日、韓國內市場推出多款即時3D手機。目前針對手機的3D技術,已有幾個主流標準,包括JSR184、OpenGL ES,以及微軟的Direct3D Mobile等,除了這些業界標準,也有廠商在標準之外自行開發專用的3D技術,智崴資訊即是專用3D技術開發業者之一。  

在早期,3D人機介面在手機上大多應用於遊戲(圖8),目前則逐漸被應用於手機的待機畫面與功能選單上(圖9),讓手機操作時的視覺經驗更豐富。林政輝舉例,例如以一個會動的3D圖案來取代單調的選單文字說明,將可以讓手機使用更貼近人性。  

手機須貼近人類自然行為  

目前積極導入人性化介面與感測技術的手機業者,仍以日、韓大廠為主,而在台灣則以英華達(OKWAP)、明基、華寶,以及多普達等業者較為積極。其中,英華達近來陸續推出具備語音辨識與手寫辨識的功能型手機,在市場中逐漸嶄露頭角。  

從手機設計製造業者的觀點,上海英華達研發副總經理蔡世光認為,手機是消費性產品,與電腦不同,必須讓人人都能輕易使用,這也是手機需要導入人性化技術的原因。蔡世光表示,英華達從2000年開始推出第一支手機以來,就在人機介面的友善程度上特別下功夫。首先就加入自行研發的中文輸入法,試圖解決中文輸入的困擾,在通訊錄上,也針對中文姓名加入百家姓功能。  

到了2004年,英華達繼續在新款手機中加入中文手寫功能。隨後,由於體認到人類最常使用的表達器官不是手,而是口,而導入智慧型且適用於不同使用者的語音回應(IVR)功能,將語音辨識應用於功能目錄與通訊錄。預期未來,英華達將進一步導入影像辨識功能,以光學字型判讀(OCR)技術應用於電子字典,利用手機上的照相機,拍下英文單字,就可以查出中文字義。  

針對各種人性化技術,蔡世光從手機設計業者的角度出發,認為決定是否採用某項技術的因素之一,在於該技術是否必須在手機設計上更換更快的CPU。以目前的手寫辨識和語音辨識技術,在中階手機7至27MHz的CPU上,大多可以正常運作,但是如果因為一項技術,而大幅增加耗電,就無法被手機業者接受。  

此外,新的技術是否符合人類行為模式,例如拇指的位置、動作量,以及與移動距離等,也是考慮因素之一。而不同產品之間也不宜出現太大的變動,而迫使消費者必須重新學習操作。蔡世光也舉例,英華達在選用其他業者開發的手寫或語音辨識技術時,會找一大群人來進行測試,首先淘汰掉辨識率未達標準者,接下來就是以成本決定採用何種技術。  

針對各種新興辨識技術,蔡世光認為,語音辨識技術的正確性仍必須更提高,而OCR與影像辨識技術,則還不夠成熟,需要再經過一段時間的發展,才有機會普遍應用於手機。  

(詳細圖表請見新通訊59期1月號)  

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!