【南方都市報】AI輔具能讓我們更有尊嚴地老去嗎?“中國版霍金”這樣說
- 文章來源:
無障礙智庫
- 發(fā)布時間:2020.11.04

10月22日,由中國計算機學會(CCF)主辦的2020年中國計算機大會在北京開幕。
當天一大早,CCF杰出會員、中國科學院心理研究所副研究員王甦菁就開著他的代步車,風風火火地趕到了現(xiàn)場。今年,他組織了一場主題為“人工智能+輔具”的專題技術(shù)論壇。輔具,指的是可以幫助老年人、傷病人、殘障人士補償身體功能障礙的器具,比如拐杖、輪椅等。這是中國計算機大會舉辦十三年來,罕見的以無障礙技術(shù)為主題的技術(shù)論壇。論壇的來源與王甦菁的日常息息相關(guān):被媒體稱為“中國版霍金”的他,出生時就不幸腦癱,衣食住行都離不開輔具,最了解殘障人士對輔具的需求與期望。2012年實施的《無障礙環(huán)境建設(shè)條例》曾提出,國家鼓勵、支持采用無障礙通用設(shè)計的技術(shù)和產(chǎn)品,推進殘疾人專用的無障礙技術(shù)和產(chǎn)品的開發(fā)、應用和推廣。
更重要的是,中國的人口老齡化程度正在不斷加深,可能在2022年左右正式進入老齡社會。老去的過程勢必伴隨身體功能的退化甚至喪失,未來,對輔具有需求的老年人也會越來越多。有感于社會的變化,王甦菁特意邀請了多位人工智能與輔具領(lǐng)域的專家,在論壇上展開探討。
清華大學計算機系副研究員喻純和浙江大學教授、中國殘疾人信息和無障礙技術(shù)研究中心副主任卜佳俊,分別從軟硬件的角度切入,介紹了他們研發(fā)的助盲技術(shù)。有數(shù)據(jù)顯示,中國的視障人群數(shù)量超過1700萬。網(wǎng)絡購物、追劇、看新聞等普通人習以為常的事,對盲人而言卻困難重重。以驗證碼輸入為例,許多讀屏軟件只能識別網(wǎng)頁上的文本,無法識別驗證碼圖片上的內(nèi)容,這使得盲人在賬號登錄環(huán)節(jié)就被卡住。
清華大學計算機系副研究員喻純介紹了一種智能交互代理系統(tǒng),能幫助盲人更好地使用手機應用。喻純解釋說,讀屏軟件對第三方應用信息的讀取,依賴于應用開發(fā)者的配合——為應用內(nèi)的各個模塊添加相應的標簽和文本標注。但是當前的第三方應用參差不齊,應用內(nèi)的前后景控件和層級不分,也缺乏標注。此外,現(xiàn)在的應用內(nèi)都會有大量圖片,讀屏軟件很難讀取到圖片內(nèi)的信息。“談到智能交互,我們有幾個目標。第一個是信息獲取不能有障礙,應用界面上所有的控件層級、交互語義信息都能識別。第二個是交互方便,表達自然,支持語音、手勢等新的輸入方式?!庇骷冋f,智能交互代理系統(tǒng)已基本實現(xiàn)了這些目標,而且盲人用戶只要安裝相應的App、貼上輔助“屏保膜”就可以,不用對原有的手機和應用進行過多改造。在現(xiàn)實生活中,很多盲人需要雙手操作手機:一只手拿手機,一只手摸屏幕。但盲人外出時往往還需要一只手來拿盲杖或牽引導盲犬,這樣的操作顯然很不方便。喻純與團隊還開發(fā)了一種基于電容屏圖像分析的“耳朵識別”智能算法,讓盲人可以用耳朵在手機上執(zhí)行按壓、觸摸瀏覽等操作。盲人想自如的生活,還少不了外力的幫助。浙江大學教授、中國殘疾人信息和無障礙技術(shù)研究中心副主任卜佳俊介紹,目前的助盲技術(shù)系統(tǒng)主要有三類,第一類是傳統(tǒng)導盲技術(shù)系統(tǒng),比如盲杖;第二類是侵入式的視覺輔助技術(shù),比如通過腦機接口為盲人加裝“仿生眼”;第三類是非侵入式視覺輔助系統(tǒng)技術(shù),比如超聲波導盲眼鏡或頭箍。
在卜佳俊看來,第一類技術(shù)系統(tǒng)使用場景有限、無法充分滿足盲人需求,第二類技術(shù)系統(tǒng)所使用的技術(shù)尚未完全成熟,具有較高的風險和成本。相較而言,第三類是更加方便、現(xiàn)實、安全的選擇。因此,從2019年開始,他帶領(lǐng)團隊投入了智能助盲眼鏡的研發(fā)。經(jīng)過一年多的研發(fā),智能助盲眼鏡已基本成型,集成障礙物檢測、交通標志檢測、人臉識別、文本識別、語音交互等一系列針對盲人生活“痛點”的功能。以交通標志檢測為例,智能助盲眼鏡能夠識別與盲人出行關(guān)系最為密切的20種交通標志,包括斑馬線、無障礙坡道、交通信號燈,等等。卜佳俊介紹,為了解決交通標志尺度變化大、背景復雜導致的檢測識別準確率低、速度慢等問題,團隊研發(fā)了一種基于深度學習的新算法。值得注意的是,智能助盲眼鏡還加入了熟人識別、表情識別等人臉識別功能。如果迎面而來的是親友,眼鏡就會像佩戴者發(fā)出提醒,并且提示對方的表情。卜佳俊說,從實驗來看,熟人識別和表情識別的精度分別能達到99.7%和85%。研發(fā)完成后,團隊招募了15名盲人志愿者進行試用。卜佳俊說,志愿者者的總體反饋還不錯?!坝脩籼岢龅姆答佉庖娕c建議,也為產(chǎn)品的迭代和后續(xù)研發(fā)提供了很好的參考方向?!彼f,產(chǎn)品研發(fā)完成后不斷擴大用戶體驗規(guī)模,在功能優(yōu)化的同時,還可以提供更多的能力去服務各類殘疾人。除了幫助殘障人士解決生活困難的智能輔具,也有一種類型是幫助健全人更順暢地與殘障人士交流。中國科學技術(shù)大學信息學院教授周文罡介紹了視頻手語識別的研究。他們希望讓機器學會看手語,當聾啞人士對著攝像頭比手語時,機器可以同步地將手語識別出來,并轉(zhuǎn)為口語化的表達。為了達到這個目標,周文罡首先要讓機器學看手語詞,但這并不容易。在中國,常用手語詞大概有5600個,這些詞可以組合出非常復雜的句子。此外,手語跟方言有相似性,不同地區(qū)、不同個體的手語習慣不一樣;手語視頻往往存在兩手之間互相遮擋、背景干擾等問題,這些都對機器識別造成了挑戰(zhàn)。就此,周文罡提出,可以利用手的先驗模型,生成手部的3D骨架數(shù)據(jù),再通過推理模型識別手語詞?!氨热缯f,盡管人眼看到的是個二維的手型,但是你可以推測出對應三維的手長什么樣子?!痹趫F隊的測試中,手語識別效果已經(jīng)有了不錯的改善。北京保益互動科技發(fā)展有限公司創(chuàng)始人曹軍則以盲人的身份,針對無障礙技術(shù)設(shè)計提出了一些建議。曹軍回憶,有一次,他在某個機場試用無障礙電梯,卻發(fā)現(xiàn)電梯的盲文在很低的位置,他需要蹲下來才能摸到。從他的親身體驗看,像這樣為殘障人士設(shè)計、但實際上并不好用的產(chǎn)品還有很多。曹軍說,這些產(chǎn)品的設(shè)計初衷都是好的,但開發(fā)者對用戶需求的想象和判斷,不一定符合殘障人士的真實需要,用戶用起來不一定方便。在現(xiàn)實中,開發(fā)者往往在產(chǎn)品成型后才邀請殘障人士參與測試,“這個時候就晚了 ”?!澳銈円霎a(chǎn)品的,一定要跟我們交朋友,先了解了我們的需求,再去設(shè)計產(chǎn)品,這樣的產(chǎn)品一定會被社會所認可,一定能夠真正改變殘障人士的生活方式。”
“人工智能加輔具的研究,給我們的無障礙建設(shè)帶來了更好的機遇。”在圓桌環(huán)節(jié),中國殘聯(lián)副主席呂世明說道。他表示,產(chǎn)學研各方關(guān)注殘障人士的需求和愿望是非常好的事,“就怕大家不關(guān)注、不研究”。但正如曹軍說的一樣,研究者有必要將用戶體驗環(huán)節(jié)前置,在研發(fā)初始階段就踐行“無障礙設(shè)計”理念,找準用戶需求,避免走彎路。“以前有一個說法是,發(fā)達國家在關(guān)注20%的(弱勢)人群,發(fā)展中國家在關(guān)注80%的人群。為什么我們現(xiàn)在說國家強大了,其實我能感覺到,國家的關(guān)注點正在從80%的人群向20%的人群轉(zhuǎn)移,越來越關(guān)心殘疾人、老年人等一些特殊人群?!敝袊鴼埣踩诵畔⒑蜔o障礙技術(shù)研究中心主任助理王煒說,“人工智能、大數(shù)據(jù)等前沿技術(shù),可能會在特殊人群的幫助上發(fā)揮更大的作用。”曹軍也表達了類似的觀點。他舉例說,隨著時代的變化,盲人也借助輔具用上了智能手機、電腦。他相信,技術(shù)的發(fā)展會進一步改善殘障人士的生活水平?!盎蛟S5年以后,我們就能借助科技的力量看到這個社會了。”