近日,北京健康寶更新,“他人健康碼代查詢”可通過人臉識別、姓名和身份證信息進行認證授權(quán),家庭成員、安保人員等可通過此功能為老人、兒童提供幫助。從疫情防控健康碼查驗、交通安檢等公共應(yīng)用到金融支付、出入門禁等,人臉識別應(yīng)用已經(jīng)深入到人們生活的方方面面。從技術(shù)角度來看,當前人臉識別發(fā)展狀況如何?不同應(yīng)用場景下對人臉識別技術(shù)要求有何不同?如何解決日益凸顯的個人信息保護問題?針對業(yè)界關(guān)注的這些問題,《人民郵電》報記者分別采訪了中國信通院云計算與大數(shù)據(jù)研究所人工智能部副主任石霖和北京郵電大學(xué)“鴻雁人才”特聘教授鄧偉洪。
多元應(yīng)用場景多維度評判人臉識別效果
記者:20世紀60年代有研究人員開始研究人臉識別,進入初級應(yīng)用階段是在90年代后期,從發(fā)展歷程來看,人臉識別重點的研究領(lǐng)域、研究方法是什么?
鄧偉洪:人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術(shù)。它涵蓋采集包含人臉的圖像或視頻流,檢測和跟蹤人臉,精確定位到面部特征點,并進行特征提取和比對識別的一系列相關(guān)技術(shù)。
近年來,除了身份識別,性別、年齡、種族、情緒等人臉屬性,甚至某些遺傳病、抑郁癥、性格傾向等隱含特征,也可以被識別。20世紀70年代以來,該研究經(jīng)歷了五官幾何特征、像素變換特征、局部濾波特征和深度卷積神經(jīng)網(wǎng)絡(luò)四類主流技術(shù)路線。目前,主流的深度卷積神經(jīng)網(wǎng)絡(luò)推動了人臉識別的廣泛應(yīng)用,在很多場景的識別準確率已經(jīng)超過了人眼。
石霖:人臉識別技術(shù)經(jīng)歷了傳統(tǒng)機器學(xué)習(xí)和深度學(xué)習(xí)的技術(shù)發(fā)展階段。傳統(tǒng)方法依賴于人工設(shè)計的特征與機器學(xué)習(xí)技術(shù)的組合。自2014年引入深度學(xué)習(xí)方法后,人臉識別技術(shù)發(fā)展迅猛,識別效果開始超過傳統(tǒng)機器學(xué)習(xí),并呈現(xiàn)出訓(xùn)練數(shù)據(jù)規(guī)模越來越大、識別精度越來越高的趨勢,目前在人臉識別領(lǐng)域,深度學(xué)習(xí)已經(jīng)取代了傳統(tǒng)機器學(xué)習(xí)。當前,基于深度神經(jīng)網(wǎng)絡(luò)的人臉識別在權(quán)威數(shù)據(jù)集LFW(Labeled Faces in the Wild)上的識別準確率達到了99.5%以上,遠超出了人眼的97.52%,也隨之帶來了人臉識別商業(yè)應(yīng)用的爆發(fā)式增長。
記者:評判人臉識別效果的主要標準是什么?
石霖:描述人臉識別性能的指標主要包括準確率、錯誤接受率、錯誤拒絕率。盡管近年來人臉識別技術(shù)的準確性已大大提高,但隨著人臉識別應(yīng)用的逐漸深入,僅從性能維度進行評價并不能滿足特定場景下的實際需求。
我們認為,要全面客觀的評價人臉識別的應(yīng)用效果,需要看人臉識別系統(tǒng)本身是否具備能夠被用戶信任的技術(shù)能力。隨著人臉識別的大規(guī)模應(yīng)用,頻繁出現(xiàn)系統(tǒng)被黑灰產(chǎn)攻破、用戶個人信息被泄露、人臉技術(shù)濫用、對部分人群的識別結(jié)果存在偏見等負面新聞,這些問題也逐漸成為用戶對人臉識別系統(tǒng)是否信任的關(guān)鍵。因此,為有效回應(yīng)用戶關(guān)切,我們認為需要圍繞安全可靠、透明性、數(shù)據(jù)保護、明確責(zé)任、公平性五個可信特征,結(jié)合其使用場景來評價人臉識別系統(tǒng)是否具備相應(yīng)的可信能力。
鄧偉洪:傳統(tǒng)的標準主要是準確率。對于1∶N的識別應(yīng)用,準確率就是從數(shù)據(jù)庫中精確搜索出目標人物的正確概率。針對高鐵、機場等1∶1的驗證應(yīng)用,準確率是指在很低的錯誤接受率下的本人驗證通過率。在準確率已經(jīng)滿足使用需求的今天,人們開始追求更加全面的識別效果,包括在口罩遮擋、側(cè)臉、年齡變化等極端條件下的穩(wěn)定性、對抗樣本攻擊和活體攻擊的安全性,以及在多人種人臉識別下的公平性等。
記者:對相似性比較高的情況(比如跨年齡、跨姿態(tài))怎樣保證識別的準確性?應(yīng)用的主要算法、研究方法是什么?
鄧偉洪:目前主流的方法是深度卷積神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)結(jié)構(gòu)能夠提取像素、邊緣、五官、屬性等多層次的人臉特征,對年齡、姿態(tài)甚至整容等外觀變化有很強的適應(yīng)性。模型參數(shù)的學(xué)習(xí)主要依靠海量的人臉數(shù)據(jù)驅(qū)動完成,通過學(xué)習(xí)訓(xùn)練數(shù)據(jù)中同一人的多張年齡、姿態(tài)等變化的圖片,并增強同一人的這些圖片特征的一致性。經(jīng)過數(shù)百萬甚至數(shù)億圖像的訓(xùn)練后,網(wǎng)絡(luò)可以獲得對年齡、姿態(tài)等穩(wěn)定的識別準確率。
石霖:使用更大、更具有代表性的數(shù)據(jù)集,更好地遵守圖像質(zhì)量標準以及其他措施。
記者:日常考勤、銀行辦理業(yè)務(wù)、健康寶等都需要“刷臉”,在不同應(yīng)用場景下,對人臉識別的技術(shù)要求有何不同?
石霖:不同業(yè)務(wù)場景下對于人臉識別的技術(shù)要求存在很大的差異,主要體現(xiàn)在易用性和安全性兩個方面。在樓宇門禁、考勤打卡等通常有人值守的低風(fēng)險場景下,需要在提升通行效率的同時,實現(xiàn)人員身份的核驗,一般不會受到黑灰產(chǎn)的惡意攻擊,因此易用性相對來說是更為重要的考量因素。
而在線上業(yè)務(wù)辦理、刷臉支付、大額轉(zhuǎn)賬等涉及用戶人身財產(chǎn)安全且通常為無人值守的高風(fēng)險場景下,需要確保人臉識別不因受到黑灰產(chǎn)攻擊而失效,因此需要最大限度地提升人臉識別本身的安全性。除此之外,在金融、政務(wù)等行業(yè)的部分場景中,人臉識別只是用戶身份認證的一個因子,通常還包括姓名、身份證號、卡號以及手機驗證碼等其他因子,以確保人臉識別被攻破的情況下,身份認證業(yè)務(wù)不被繞過。
鄧偉洪:除了所有應(yīng)用都有的準確率要求,特定應(yīng)用場景下還需要考慮兩個方面:易用性和安全性。例如,門禁考勤等應(yīng)用為了保證大人流下的通過效率,會適當調(diào)低人臉驗證的閾值,保證絕大多數(shù)人可以快速通過,避免反復(fù)拍照驗證。金融業(yè)務(wù)需要特別高的安全性,產(chǎn)品中就會加入多類型的傳感器來進行額外的安全驗證。例如,支付寶和蘋果手機的刷臉支付都引入了三維傳感器來防御偽造人臉的攻擊。易用性和安全性在應(yīng)用中是矛盾的,需要根據(jù)場景來進行調(diào)節(jié)。
從可用走向可信多元共治形成合力
記者:在安全性方面,人臉識別準確性面臨哪些威脅?目前比較有效的解決思路是什么?
鄧偉洪:隨著人臉識別的廣泛應(yīng)用,各類安全性威脅是伴生出現(xiàn)的。打印人臉照片、顯示屏播放人臉、三維打印面具甚至硅膠面具等越來越逼真的活體攻擊手段,對人臉識別的安全性帶來極大挑戰(zhàn)。同時,常用的深度卷積神經(jīng)網(wǎng)絡(luò)本身還存在內(nèi)在的漏洞,攻擊者可以通過優(yōu)化方法生成對抗噪聲來控制人臉的識別結(jié)果,由于疊加在圖像上的對抗噪聲幅度很小,從外觀上人們還難以發(fā)現(xiàn)異常。
正如俗話說的“未知攻,焉知防”,目前的防御方法都是針對不斷演進的攻擊手段設(shè)計的。例如,采集各類活體攻擊視頻,生成對抗攻擊的樣本作為訓(xùn)練樣本,專門學(xué)習(xí)區(qū)分正常和異常樣本的分類器來進行防御。但這些方法都不能從根本上解決問題,攻擊和防御方法呈現(xiàn)迭代優(yōu)化的態(tài)勢。
石霖:從技術(shù)上看,在一些特定的實驗條件下人臉識別確實已經(jīng)達到了99%以上的準確率,但在實際應(yīng)用場景中,表情、年齡變化、遮擋、光照強度等因素,都會影響人臉識別的準確率。對于人臉識別準確率,可以考慮從三個方面進行提升:一是在確保訓(xùn)練數(shù)據(jù)的可靠、可追溯的前提下,拓展訓(xùn)練數(shù)據(jù)集,做到全面、準確;二是優(yōu)化人臉識別技術(shù)流程,確保前端采集到的人臉圖像滿足后續(xù)識別的質(zhì)量要求;三是結(jié)合實際應(yīng)用中的反饋,做好算法模型的升級迭代。
從應(yīng)用上看,人臉識別作為一種身份認證技術(shù),同密碼、指紋等傳統(tǒng)身份認證技術(shù)一樣,都存在一定被攻破的概率,現(xiàn)階段尚不存在百分之百安全的技術(shù),黑灰產(chǎn)常用的呈現(xiàn)攻擊、注入攻擊,以及更為前沿的對抗樣本攻擊,均有可能造成人臉識別失效。
中國信通院云大所依托“可信人臉應(yīng)用守護計劃”已開展了兩輪針對人臉識別系統(tǒng)安全性的評測,著重檢驗了人臉識別系統(tǒng)抵御電子圖像攻擊、合成視頻攻擊等主流黑灰產(chǎn)攻擊手段的能力。在評測中我們發(fā)現(xiàn),當前移動端人臉識別系統(tǒng)普遍采用了移動端和服務(wù)端聯(lián)動的方式進行活體檢測,具體呈現(xiàn)形式包括“動作”“動作﹢唇語”等,能夠有效區(qū)分真人與各種呈現(xiàn)類攻擊。另外,部分人臉識別系統(tǒng)能夠通過設(shè)備安全檢驗、鏈路安全校驗、動態(tài)調(diào)整相機參數(shù)等方式有效識別非攝像頭實時錄制的注入視頻,從而進行攔截。
記者:人臉識別技術(shù)發(fā)展成熟的標準是什么?未來的發(fā)展趨勢是什么?
石霖:人臉識別作為一項近年來快速發(fā)展的生物識別技術(shù),盡管在金融、政務(wù)、安防、交通、教育、醫(yī)療等行業(yè)得到了廣泛應(yīng)用,但也暴露出在實際場景下的準確性降低以及安全和合規(guī)等一些需要解決的問題。長遠來看,人臉識別技術(shù)和應(yīng)用發(fā)展的不斷成熟,需要政府主管部門、科研機構(gòu)、法律機構(gòu)、技術(shù)提供方、技術(shù)使用方以及用戶方共建一個良性的生態(tài)環(huán)境,中國信通院云大所發(fā)起的“護臉計劃”,就是聯(lián)合社會各界組建的一個開放平臺,也歡迎各方積極參與,共同提升全行業(yè)的安全合規(guī)能力,促進產(chǎn)業(yè)的健康發(fā)展。
目前,在開展護臉工作的過程中,我們也看到人臉識別技術(shù)產(chǎn)業(yè)的發(fā)展呈現(xiàn)出了以下幾個趨勢。一是多種認證技術(shù)融合。人臉識別雖然能帶來良好的用戶體驗,但并不是百分百安全的技術(shù),以金融行業(yè)為例,越來越多的機構(gòu)開始采用“動作活體﹢炫彩活體”“人臉識別﹢聲紋識別”等身份認證方式,提升系統(tǒng)整體的安全性。二是從業(yè)廠商主動“合規(guī)”。隨著《數(shù)據(jù)安全法》《個人信息保護法》等相關(guān)法律法規(guī)的出臺,越來越多的人臉識別從業(yè)者加入“護臉計劃”,尋求合規(guī)的產(chǎn)品設(shè)計、研發(fā)方案,這些從業(yè)人員多數(shù)來自新零售、金融行業(yè),在實際從業(yè)過程中直接接觸大量的人臉信息,主動“合規(guī)”的意愿也越來越強。三是探索人臉識別替代性技術(shù)。我們也發(fā)現(xiàn),一些人臉識別的從業(yè)者迫于合規(guī)的壓力,在部分場景放棄了使用人臉識別,轉(zhuǎn)向了研發(fā)和使用人體識別、掌紋識別等新的識別技術(shù),這些技術(shù)在一定程度上規(guī)避了法律上的合規(guī)風(fēng)險,但其實際的應(yīng)用效果和安全性都有待考驗,也都是“護臉計劃”需要跟蹤和探索的新方向。
鄧偉洪:人臉識別技術(shù)發(fā)展成熟的標準應(yīng)該是“可信”,“可信”的內(nèi)涵十分豐富,至少包括高于人眼的識別準確率和穩(wěn)定性、對各類群體具有公平一致的識別效果、應(yīng)對各類惡意攻擊的防御能力,以及對識別結(jié)果的可解釋性等。未來的技術(shù)發(fā)展趨勢是從目前的“可用”走向“可信”,從唯“準確率”的跑分走向多元發(fā)展的識別技術(shù)。
小貼士
人臉識別技術(shù)發(fā)展關(guān)鍵點
初識人臉識別
人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術(shù)。它涵蓋采集包含人臉的圖像或視頻流,檢測和跟蹤人臉,精確定位到面部特征點,并進行特征提取和比對識別的一系列相關(guān)技術(shù)。
技術(shù)發(fā)展階段
自2014年引入深度學(xué)習(xí)方法后,識別效果開始超過傳統(tǒng)機器學(xué)習(xí),并呈現(xiàn)出訓(xùn)練數(shù)據(jù)規(guī)模越來越大、識別精度越來越高的趨勢,目前在人臉識別領(lǐng)域,深度學(xué)習(xí)已經(jīng)取代了傳統(tǒng)機器學(xué)習(xí)。
如何保證高相似度情況下的識別準確性?
目前主流的方法是深度卷積神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)結(jié)構(gòu)能夠提取像素、邊緣、五官、屬性等多層次的人臉特征,對年齡、姿態(tài)甚至整容等外觀變化有很強的適應(yīng)性。
“未知攻,焉知防”
為應(yīng)對各類安全性威脅,目前的防御方法都是針對不斷演進的攻擊手段設(shè)計的。例如,采集各類活體攻擊視頻,生成對抗攻擊的樣本作為訓(xùn)練樣本,專門學(xué)習(xí)區(qū)分正常和異常樣本的分類器來進行防御。
加入“護臉計劃”
人臉識別技術(shù)和應(yīng)用發(fā)展的不斷成熟,需要政府主管部門、科研機構(gòu)、法律機構(gòu)、技術(shù)提供方、技術(shù)使用方以及用戶方共建一個良性的生態(tài)環(huán)境。
隨著《數(shù)據(jù)安全法》《個人信息保護法》等相關(guān)法律法規(guī)的出臺,越來越多的人臉識別從業(yè)者加入推動產(chǎn)業(yè)健康發(fā)展的“護臉計劃”,尋求合規(guī)的產(chǎn)品設(shè)計、研發(fā)方案。(記者 吳雙)
(責(zé)任編輯:趙臻宇)