AI輔助追蹤技術,能以回聲辨識臉部表情

0

隨著穿戴式裝置的演進,有許多團隊開始嘗試不僅進行臉孔辨識、更要能夠完成「表情辨識」的技術。康奈爾大學(Cornell University)研究團隊最近發表了全新的眼球追蹤技術 GazeTrak 和臉部表情讀取技術 EyeEcho,利用聲波而非攝影機來進行辨識,不僅尊重並保護了使用者的隱私,為相關技術應用開啟了全新的可能性。

目前市場上的眼球追蹤與臉部表情讀取技術,多數仍以攝影機為主。這類技術現階段已經可以有很優異的表現,但也存在潛在侵犯使用者隱私的問題。同還有能量耗費過高的問題,例如,知名的 Tobii Pro Glasses 3,儘管在眼球追蹤上精準度極高,但其電池持續時間卻僅有1.75小時。

第一種技術名為 GazeTrak,在每副眼鏡的鏡片框內配置一個小喇叭和四個麥克風(總共兩個小喇叭和八個麥克風)。小喇叭發出聲波,這些聲波會從眼球反射回來,然後被麥克風接收。而由於人類的眼球並非完美的圓形,每一次的回聲到達每個麥克風所需的時間會有所不同,取決於眼球的朝向。因此,這些毫秒級的差異再利用無線訊號傳到主機以 AI 進行分析,便可以追蹤使用者視線的方向。

第二種技術名為 EyeEcho,與 GazeTrak 相同利用回聲分析,差別在於麥克風和小喇叭的位置是在眼鏡兩個鏡腳鉸鏈旁邊(總共兩個揚聲器和兩個麥克風)。在距離較遠的情況下,可以用聲波偵測臉部皮膚的微妙變化,進一步分析為表情。借助這項技術,使用者未來可能有機會藉由虛擬的頭像開啟視頻通話,即使在嘈雜的環境中,也不會遭到干擾。

眼球追蹤和臉部表情讀取的技術在未來有著廣泛的應用前景,比如應用於 VR 虛擬空間中,提供更擬真的、與視覺角度變化相關的反應,甚至於賦予虛擬頭像即使的反應變化增加互動。GazeTrak 和 EyeEcho 還可能有助於診斷或監測會影響臉部表情的神經退行性疾病,如阿爾茨海默氏症和帕金森氏症,讓患者在家中就能隨時追蹤疾病的進展。

參考資料:AI-powered ‘sonar’ on smartglasses tracks gaze and facial expressions  | Cornell Chronicle

加點製造為產品開發專業知識交流社群,專業問答提供開發者互助學習,也可以快速的搜尋在地的優秀設計與製造廠商。優秀產品資訊歡迎投稿

與 60,000+ 讀者一起訂閱最新文章

最後修改日期: 3 5 月, 2024