手勢識別是一種用戶界面,允許計算機捕捉和解釋非語言交流,包括面部表情、頭部運動、身體定位和手部動作作為命令。手勢是一種越來越普遍的計算機控制模式,用于識別手勢的傳感器類型也在不斷增加。
本文將簡要回顧了當今手勢控制的實施方式,探討了手勢未來可能的應用,最后對用于識別、解釋和響應手勢的各種類型的非視頻傳感器進行了調查,包括電場感應、激光雷達、先進的電容技術和觸覺。
最初,所有手勢識別都依賴于實時視頻源的解釋。基本的基于視頻的手勢識別仍然被廣泛使用。這是一個計算密集型過程,工作原理如下:
攝像頭將圖像數據與來自深度感應設備(通常是紅外傳感器)的數據配對,輸入計算機,以捕捉三個維度的動態手勢。
手勢識別軟件將捕獲的圖像數據與手勢庫進行比較以找到匹配項。
然后,軟件將識別出的手勢與相應的命令進行匹配。
一旦手勢被識別和解釋,計算機要么確認用戶想要的命令,要么簡單地執行與該特定手勢相關的命令。
在復雜環境中,可以使用骨骼和面部跟蹤以及語音識別和其他輸入來增強基本視頻信息(圖1)。
圖1:基于攝像頭的手勢識別廣泛用于受益于非接觸式計算機控制的應用。
(圖片來源:??3D Cloud by Marxent??)
汽車應用
汽車內飾是基于視頻的手勢識別系統新興用途的一個很好的例子。當前的汽車手勢識別系統使駕駛員和乘客能夠控制信息娛樂系統或來電,而無需觸摸按鈕或屏幕。在這種環境下,手勢識別有望提高安全性,因為駕駛員可以使用簡單的手部動作代替復雜的菜單界面操作,使他們能夠更專注于駕駛車輛。
語音控制系統也可以使駕駛員能夠專注于道路,但使用起來更加復雜。大多數當前的語音控制系統不使用自然語言,它們需要精確的語音命令,并且可能涉及長菜單鏈以達到所需的特定命令。由于其對用戶的簡單性,手勢識別的汽車應用有望擴展到其他系統,例如加熱和冷卻、室內照明控制、遠程信息處理系統,甚至與遠程智能家居系統的連接。系統結合了語音識別和手勢識別的最佳特性。
攝像頭安裝在基于攝像頭的汽車內部手勢識別系統中,通常從天花板等高處獲得相關內部空間的暢通無阻的視野。當前系統只關注駕駛員。未來,隨著車內攝像頭數量的增加和圖像質量的提高,監控空間的范圍有望擴大到包括乘客在內。監控區域由紅外LED或激光照亮,即使在低光照條件下也能提供最佳圖像質量。如上所述,手勢是實時分析的,機器學習支持準確性的不斷提高。BMW7系汽車識別的一些手勢如圖2所示。
圖2:BMW Series 7汽車中編程的手勢示例。(圖片來源:??Aptiv??)
電場手勢識別
電場接近感應(EFPS)是基于輕微導電的附近物體對電場的擾動。EFPS的一個實施例是一種微電子設備,它可以檢測移動和靜止的物體,即使是非導電的固體材料。它通過感應兩個天線電極產生的極低功率電磁場的微小變化來工作。它的可調范圍從幾厘米到4米,并且它的操作與對地阻抗無關。
EFPS和其他電場傳感器提供少量數據。與光學手勢識別系統相比,它們更小、重量更輕,并且需要更少的功率。在另一個實施例中,手勢感應IC使用電極來感應電場的變化并計算手指等物體的位置,提供三維位置數據并將運動模式實時分類為手勢(圖3)。通過使用電場感應,該系統對光線、聲音和其他可能干擾其他3D手勢感應技術操作的環境條件完全不敏感。
圖3:未失真的等電位電場線(左)與被人手指扭曲的相同等電位電場線(右)的比較。(圖片來源:??Microchip??)
這種特定的3D手勢感應IC針對電池供電設備進行了優化,感應電極由低壓信號驅動,可選擇42、43、44、45和100kHz信號。由于電場傳感器可以穿透非導電材料,因此它們可以封裝在防風雨外殼或建筑物的內墻中。除了便攜式手勢感應應用外,EFPS系統目前還部署在各種感應應用中,包括:
可以確定被抓取物體屬性的機械手
汽車安全氣囊系統確定座位是否被占用
樓宇自動化系統可確定房間何時無人使用
使用激光雷達
光檢測和測距(LIDAR)被用于為消費和工業系統中的手勢識別帶來獨特的性能范圍。一個示例是基于940nm不可見光垂直腔面發射激光器(VCSEL)的LIDAR設備,該激光器具有集成驅動器和單光子雪崩二極管(SPAD)的接收陣列。該系統使用基于飛行時間(ToF)測量的多區域測距。它以集成6.4mmx3.0mmx1.5mm模塊的形式提供,其中包括VCSEL(垂直腔面發射激光器)發射器和帶有嵌入式SPAD和基于直方圖的ToF處理引擎的接收器(圖4)。
圖4:這個基于VCSEL的恢復識別模塊包括一個用于手勢識別的TOF處理引擎。(圖片來源:??意法半導體??)
這種基于LIDAR的模塊的緊湊尺寸和低功耗有望在一系列應用中實現非觸摸手勢識別的集成,包括AR/AV耳機、平板電腦、手機和住宅產品,如廚房電器、恒溫器和其他智能家居控制,以及電梯控制、交互式標牌和票務以及自動售貨機等設備。該傳感器可以在4×4(16區域)快速測距模式下提供高達每秒60幀的幀數。在高分辨率模式下,傳感器測量64個區域(8×8)。
縮小電容式手勢識別
基于微型碳納米管紙復合電容傳感器的電容式三維手勢傳感器已被開發用于集成游戲設備和其他消費電子產品。與上一代電容式手勢傳感器相比,碳納米管紙基設備的速度提高了10倍,體積縮小了100倍,并且可以在高達20厘米的更大范圍內工作(圖5)。它們無需任何手持設備或其他設備即可識別3D手勢,并且比紅外傳感器更快、更準確。此外,它們對環境因素(如膚色和照明條件)不敏感。
圖5:這種基于碳納米管紙的手勢識別設備比前幾代電容式傳感器快10倍,小100倍。(圖片來源:??Somalytics??)
相機+超聲波觸覺
專為VR/AR耳機設計的新系統將基于紅外攝像頭的手勢識別與觸覺反饋相結合。該系統使用IR LED照亮用戶的手,LED的脈沖與相機幀速率同步。相機通過每個脈沖將當前位置信息發送到處理器。處理器中的手勢識別軟件對骨骼和關節以及手部運動進行建模。這使系統能夠準確地知道拇指或手指的位置,即使它不在視線范圍內。該系統可以通過編程識別各種手勢,包括抓取、滑動、捏合、推動等。該手勢識別系統有一個交互區域,范圍從10厘米到1米,典型視野為170°x170°。
除了識別手勢外,該系統還知道人的手在哪里,并且可以使用該信息來控制基于超聲波的觸覺反饋。超聲觸覺系統基于以特定時間差觸發的揚聲器矩陣,使聲波能夠聚焦在空間中的特定點,例如,人手的特定部分所在的位置(圖6)。可以根據應用程序的需要實時更改3D焦點。超聲波在焦點處的組合振動產生了人體皮膚可以感覺到的壓力點。
圖6:聚焦超聲波可以為基于紅外攝像頭的手勢識別系統添加觸覺反饋。(圖片來源:??ultraleap??)
總結
基于視頻的手勢識別仍然是最廣泛使用的手勢識別形式。它用于各種應用,包括醫療環境和汽車駕駛室。最近,手勢識別已應用于AV/VR系統、樓宇自動化系統和機器人技術。新的手勢識別技術正在推動手勢識別的日益增長的應用,包括電場感應、基于VCSEL的LIDAR系統、碳納米管電容設備以及結合超聲觸覺反饋的紅外相機。