
圖形圖像處理技術(shù)有著悠久的歷史,現(xiàn)代視頻圖像處理技術(shù)是在傳統(tǒng)的數(shù)字圖像處理學(xué)科基礎(chǔ)上發(fā)展起來(lái)的,也被稱為“智能視頻分析技術(shù)”,它綜合了多學(xué)科的研究成果,包括:圖像處理、視頻跟蹤、數(shù)據(jù)壓縮傳輸、圖像模式識(shí)別及計(jì)算機(jī)視覺(jué)等分支。現(xiàn)代視頻圖像處理技術(shù)的發(fā)展,依賴于現(xiàn)代數(shù)字信號(hào)處理、計(jì)算機(jī)技術(shù)和移動(dòng)互聯(lián)網(wǎng)技術(shù)的發(fā)展,已呈現(xiàn)出如下特點(diǎn):高速、高分辨率、立體化、綜合多媒體、智能化、標(biāo)準(zhǔn)化以及移動(dòng)終端互聯(lián)網(wǎng)的應(yīng)用。
所謂高速是指信號(hào)采集和處理的速度,如今從模擬攝像頭到信號(hào)數(shù)字化轉(zhuǎn)換,整個(gè)速度得以大幅提升,另外一些低功耗的嵌入式應(yīng)用也是一個(gè)重要特征。分辨率提升亦日趨明顯,如過(guò)去在電子警察中所應(yīng)用的768×576的分辨率已鮮有應(yīng)用了,人們對(duì)高分辨率的追求是沒(méi)有止盡的,720p、1080p趨于普及,并開(kāi)始向超高清(UHD)7,680×4,320(3,300萬(wàn))發(fā)展。立體化亦是未來(lái)的趨勢(shì),視頻從靜態(tài)到動(dòng)態(tài),從單路到多路,人們不斷追求著現(xiàn)場(chǎng)感、擬真感,期望模擬人眼的縱深感覺(jué),達(dá)到身臨其境的更高境界。除此以外,圖像應(yīng)用還應(yīng)跟其他技術(shù)綜合起來(lái),包括音頻、深度圖像、紅外多波段等,實(shí)現(xiàn)綜合多媒體應(yīng)用。
智能化的圖像處理、視頻分析則能實(shí)現(xiàn)更多的應(yīng)用,例如通過(guò)模擬人的視覺(jué),用機(jī)器視覺(jué)代替人的視覺(jué)做很多事情。在此基礎(chǔ)上,標(biāo)準(zhǔn)化也需要跟上發(fā)展需求,圖像、視頻音頻產(chǎn)業(yè)的不斷細(xì)分,催生了國(guó)際化的軟硬件大分工,使得一個(gè)公司可能很難包攬整套產(chǎn)品,即便是微軟或者是英特爾這樣國(guó)際化大公司,可能也只是專注其中一個(gè)局部,而這種國(guó)際化的分工也使得標(biāo)準(zhǔn)化成為大勢(shì)所趨。
幾十年來(lái),視頻圖像處理的應(yīng)用已從傳統(tǒng)的基于PC的應(yīng)用,向以智能手機(jī)為代表的移動(dòng)終端發(fā)展蔓延。以下六個(gè)典型例子里,我們可以了解到現(xiàn)代視頻處理是如何在移動(dòng)終端上使用的。
街拍中文識(shí)別助手

如今,越來(lái)越多的外國(guó)人選擇到中國(guó)旅游、定居。外國(guó)人遇到任何漢語(yǔ)標(biāo)志物,都可以使用本軟件進(jìn)行即時(shí)拍攝、即時(shí)識(shí)別、翻譯,增加他們?cè)谥袊?guó)出行的便捷性。對(duì)于身處異國(guó)的旅行者來(lái)說(shuō),現(xiàn)在世界任何一個(gè)角落都可以利用這樣的手段來(lái)甄別環(huán)境,提升環(huán)境認(rèn)知能力。
文字信息是每個(gè)城市非常重要的特征,如果能讓外來(lái)者認(rèn)識(shí)這些文字信息,那么他們就會(huì)對(duì)所處環(huán)境有所認(rèn)識(shí)。盲人也會(huì)遇到類似問(wèn)題。我們希望通過(guò)類似的手段來(lái)幫助他們偵測(cè)環(huán)境信息,如果能把這些文字識(shí)別出來(lái)變成外語(yǔ)或者變成聲音,盲人就可以接受到這些信息。
這一案例基于文字識(shí)別技術(shù),即OCR。文字識(shí)別早就不是新鮮話題,但我們的設(shè)計(jì)思路則體現(xiàn)出新的創(chuàng)意。傳統(tǒng)的文字識(shí)別通常指的是在紙面上,在一個(gè)簡(jiǎn)單的二維環(huán)境中去識(shí)別書(shū)上、報(bào)紙上的文字。而我們創(chuàng)意的核心則是要去識(shí)別環(huán)境中的文字,一個(gè)二維的紙面上的文字和三維自然環(huán)境的文字有著非常大的差別。對(duì)于執(zhí)行識(shí)別任務(wù)的計(jì)算機(jī)和智能手機(jī)來(lái)說(shuō),不光要識(shí)別這些文字,還要在環(huán)境中找到這些文字,把它們精確地分割、提取出來(lái),這是非常困難的任務(wù),也是課題的挑戰(zhàn)所在。
這一案例應(yīng)用到的技術(shù)包括:基于Windows Phone 7.5,對(duì)自然環(huán)境下文字信息檢測(cè)、定位、識(shí)別翻譯的系統(tǒng);對(duì)文字信息進(jìn)行自動(dòng)檢測(cè)、定位和識(shí)別的核心模塊。通過(guò)采用基于邊緣提取的尋找連通域的方法對(duì)漢字區(qū)域進(jìn)行定位,然后用Gabor特征提取、匹配的方法,進(jìn)行逐個(gè)漢字識(shí)別,最后將識(shí)別結(jié)果以15種語(yǔ)言在線翻譯、朗讀、發(fā)送郵件。通俗來(lái)講,就是用手機(jī)拍一張照片,通過(guò)檢測(cè)定位技術(shù)把它識(shí)別出來(lái),并變成不同的語(yǔ)言,讓用戶聽(tīng)到他想聽(tīng)的聲音。
掌上交警
掌上交警軟件讓交警擺脫了工作條件的限制,為保證信息安全和隱私性,該軟件對(duì)使用者進(jìn)行民用、警用的劃分,無(wú)論使用者身處何種緊急情況下,都能隨時(shí)進(jìn)行隨身化的車(chē)牌號(hào)碼識(shí)別,高效迅捷地開(kāi)展工作,對(duì)于突發(fā)性事件的處理、應(yīng)急性事件的部署有極為重要的意義 。

交警巡邏的時(shí)候,除了指揮交通,往往還有一些別的任務(wù),如抓黑車(chē)、套牌車(chē),抓有犯罪嫌疑的車(chē)。本案例是在交警的手機(jī)上裝一套自動(dòng)車(chē)牌識(shí)別系統(tǒng),當(dāng)交警面對(duì)有疑問(wèn)的車(chē)時(shí),無(wú)需抄車(chē)牌,只要拿起手機(jī)來(lái)按一個(gè)鍵,就能夠識(shí)別車(chē)牌并根據(jù)車(chē)牌號(hào)碼索引車(chē)牌數(shù)據(jù)庫(kù),查詢對(duì)應(yīng)車(chē)主信息,并且把查詢到的信息以短信的方式發(fā)送出去,提高了效率,實(shí)現(xiàn)了綜合信息化的電子政務(wù)。
在民用的應(yīng)用中,當(dāng)車(chē)主碰了車(chē),只要按下一個(gè)鍵,就能把碰撞現(xiàn)場(chǎng)車(chē)牌所有的信息全都存下來(lái)。與街拍中文識(shí)別助手一樣,前者是在環(huán)境去找文字,本方案是在環(huán)境中尋找特殊的文字。由于車(chē)主信息的隱私性,普通民眾只能夠進(jìn)行車(chē)牌識(shí)別,沒(méi)有權(quán)限索引車(chē)牌數(shù)據(jù)庫(kù),保證了隱私并實(shí)現(xiàn)了快捷安全的服務(wù)。
這一系統(tǒng)在Windows Phone 7.5平臺(tái)上開(kāi)發(fā),涉及的主要技術(shù)包括:
車(chē)牌定位:圖像中車(chē)牌區(qū)域正確定位,是實(shí)現(xiàn)車(chē)牌號(hào)碼正確識(shí)別的前提。用戶對(duì)車(chē)輛進(jìn)行拍照后,識(shí)別系統(tǒng)自動(dòng)對(duì)圖像中的車(chē)牌區(qū)域進(jìn)行定位。
字符分割:對(duì)圖像中的車(chē)牌區(qū)域進(jìn)行正確定位后,利用車(chē)牌的先驗(yàn)知識(shí),對(duì)車(chē)牌進(jìn)行垂直投影,從而對(duì)車(chē)牌的七個(gè)字符實(shí)現(xiàn)有效分割。
字符識(shí)別:將分割后包含車(chē)牌字符的七個(gè)小圖像進(jìn)行預(yù)處理,對(duì)預(yù)處理后的小圖像提取彈性網(wǎng)格的方向像素特征,然后進(jìn)行分類識(shí)別。
維文手寫(xiě)識(shí)別軟件

維文即維吾爾文,之所以要做這樣一個(gè)軟件,是因?yàn)榻?jīng)過(guò)調(diào)研發(fā)現(xiàn)目前維族同胞信息化程度還比較低。為了讓少數(shù)民族能夠共享信息時(shí)代的成果,我們就選擇了在移動(dòng)終端上實(shí)現(xiàn)識(shí)別維文這一比較艱難的課題。維文目前已有1,000多萬(wàn)的使用者,當(dāng)?shù)厥謾C(jī)普及率也很高,但是直到最近幾年才解決了維文鍵盤(pán)輸入問(wèn)題,所以目前很多時(shí)候要輸維文還需要用手寫(xiě)輸入,該軟件就是讓手機(jī)識(shí)別手寫(xiě)的維文系統(tǒng)。這一軟件也是在Windows Phone7.5平臺(tái)上開(kāi)發(fā)的,實(shí)驗(yàn)室與合作單位用兩年時(shí)間建立了數(shù)據(jù)庫(kù),而此后的模式識(shí)別問(wèn)題是共通的。
在這一案例中,只要在手寫(xiě)板上手寫(xiě)輸入維文,就可對(duì)其進(jìn)行識(shí)別,顯示38個(gè)候選文字,然后按照與所寫(xiě)維文的相近程度排序。最終跟漢字輸入一樣,讓維族用戶不用按鍵盤(pán)通過(guò)手寫(xiě)就可以編短信。其最大價(jià)值的就是在手機(jī)上替換鍵盤(pán),或者說(shuō)提供一種額外的方式讓維族群眾可選擇使用鍵盤(pán)或者是使用手寫(xiě)。
這款軟件有著很高的應(yīng)用價(jià)值。首先手寫(xiě)識(shí)別可配合小型的移動(dòng)通信設(shè)備,改善鍵盤(pán)輸入在這些設(shè)備上實(shí)現(xiàn)困難的局面;隨著電子白板在教育、辦公、會(huì)議等領(lǐng)域的廣泛應(yīng)用,手寫(xiě)維文輸入可以應(yīng)用于維文教學(xué);通過(guò)對(duì)書(shū)寫(xiě)過(guò)程中的字跡、壓力等動(dòng)態(tài)信息的獲取,實(shí)現(xiàn)對(duì)書(shū)寫(xiě)者的身份鑒別。手機(jī)上網(wǎng)功能隨著3G的到來(lái)將會(huì)越來(lái)越普遍,手寫(xiě)識(shí)別可幫助維吾爾族群眾輕松、快速瀏覽網(wǎng)上資訊、進(jìn)行網(wǎng)絡(luò)聊天。
野外水位監(jiān)測(cè)系統(tǒng)
水位監(jiān)測(cè)作為水文觀測(cè)的重要一環(huán),對(duì)保護(hù)人們的生命和財(cái)產(chǎn)安全,具有極大的應(yīng)用價(jià)值。新疆有充沛的天山雪水和湖泊,天山雪水的灌溉也是采用擴(kuò)干渠和水庫(kù)的形式,由于新疆地廣人稀,如果要知道天山某一條干渠的水位,傳統(tǒng)現(xiàn)場(chǎng)采集的方法首先需要開(kāi)車(chē)到幾百公里之外,極不方便,而我們所設(shè)計(jì)的系統(tǒng)則能使用智能終端替代工作人員親臨現(xiàn)場(chǎng)。


該系統(tǒng)的設(shè)計(jì)思想就是找到一種方法來(lái)克服傳統(tǒng)水位監(jiān)測(cè)設(shè)備不足的問(wèn)題。智能手機(jī)成為理想的替代設(shè)備,因?yàn)樗还庥袌D像處理功能,還可以自然通訊。該系統(tǒng)基于Windows Phone 7.5平臺(tái),具有水位識(shí)別和歷史水位查詢功能。涉及的技術(shù)包括:采集水位圖像;水位標(biāo)尺定位;傾斜校正;水位識(shí)別。
上圖體現(xiàn)了實(shí)驗(yàn)中的一些數(shù)據(jù),現(xiàn)場(chǎng)水位信息在實(shí)驗(yàn)室通過(guò)智能終端識(shí)別展示出來(lái)。該系統(tǒng)有廣闊的應(yīng)用前景,應(yīng)用到國(guó)家的水利建設(shè)中,可結(jié)合手機(jī)進(jìn)行水位監(jiān)測(cè);應(yīng)用到各個(gè)水利監(jiān)測(cè)站點(diǎn),對(duì)于提高水利系統(tǒng)信息化水平、加強(qiáng)監(jiān)測(cè)預(yù)警能力將有重大的意義;應(yīng)用于水利科研機(jī)構(gòu),其便攜性可以減輕工作人員負(fù)擔(dān);同時(shí)歷史水位查詢功能可以幫助科研人員更好地掌握水位信息,提高工作效率;應(yīng)用到水產(chǎn)養(yǎng)殖等生產(chǎn)建設(shè)中,在滿足獲取養(yǎng)殖區(qū)水位信息的同時(shí),還起到監(jiān)控作用,一舉兩得。
增強(qiáng)視界之家[page]
在傳統(tǒng)的家居裝修中,設(shè)計(jì)師通常會(huì)先展示設(shè)計(jì)方案圖片,然后業(yè)主根據(jù)這些設(shè)計(jì)方案圖,去建材城尋找和購(gòu)買(mǎi)其中的家具。但這樣既費(fèi)時(shí)又費(fèi)力,最糟糕的是當(dāng)我們買(mǎi)齊所有家具建材裝修完畢后才發(fā)現(xiàn),與自己的想象大相徑庭。而通過(guò)增強(qiáng)視界之家這樣一個(gè)系統(tǒng),就能夠利用計(jì)算機(jī)輔助的手段,讓我們?cè)谫I(mǎi)家具時(shí)就可以將家具的虛擬3D模型疊加到房間中進(jìn)行仔細(xì)觀察和體驗(yàn)。只要知道房屋整體結(jié)構(gòu),建筑模型和家具模型就可以虛擬匹配起來(lái)。利用這套軟件,業(yè)主足不出戶就可以通過(guò)網(wǎng)絡(luò)去選擇不同的家具,嘗試擺放,體驗(yàn)未來(lái)虛擬家居是什么樣子。
這個(gè)技術(shù)稱為增強(qiáng)現(xiàn)實(shí),是在虛擬現(xiàn)實(shí)技術(shù)基礎(chǔ)上發(fā)展起來(lái)的一種新興計(jì)算機(jī)應(yīng)用和人機(jī)交互技術(shù),它比虛擬現(xiàn)實(shí)有更強(qiáng)大的臨場(chǎng)感,主要是在已有的真實(shí)世界的基礎(chǔ)上,為用戶提供一種復(fù)合的視覺(jué)效果,當(dāng)用戶在真實(shí)場(chǎng)景中移動(dòng)時(shí),虛擬物體也隨之做出相應(yīng)變化,使虛擬物體與真實(shí)環(huán)境實(shí)現(xiàn)完美的結(jié)合。為了使得應(yīng)用更加方便,這一軟件同樣開(kāi)發(fā)在手機(jī)上,用戶可以通過(guò)手機(jī)拍攝室內(nèi)場(chǎng)景,捕捉標(biāo)志板、更換/添加家具、調(diào)整家具、選定家具、生成家具清單。
在移動(dòng)設(shè)備上實(shí)現(xiàn)室內(nèi)裝修設(shè)計(jì)模擬,是本軟件應(yīng)用的最大看點(diǎn)之一,而其所帶來(lái)的社會(huì)價(jià)值也將不言而喻,移動(dòng)增強(qiáng)現(xiàn)實(shí)在校園、博物館導(dǎo)游、購(gòu)物指南、工程設(shè)計(jì)等方面均有廣泛的應(yīng)用前景。



愛(ài)拍購(gòu)物車(chē)
這是一款生活?yuàn)蕵?lè)類軟件,能夠?qū)崿F(xiàn)比價(jià)購(gòu)物、地圖搜索、二維碼生成、高效掃碼等服務(wù)。通過(guò)手機(jī)識(shí)別環(huán)境中二維或者一維條碼的方式來(lái)識(shí)別產(chǎn)品的各種信息,打造出一種新型的購(gòu)物或者逛街方式。消費(fèi)者在逛商場(chǎng)時(shí),不再需要刻意去記住哪個(gè)東西好,哪個(gè)東西便宜,通過(guò)這套系統(tǒng)就能在智能手機(jī)上了解這個(gè)產(chǎn)品的信息,然后通過(guò)電子商務(wù)系統(tǒng)和GPS系統(tǒng),與周邊商場(chǎng)同樣的商品進(jìn)行信息自動(dòng)比較,讓消費(fèi)者更快找到同類的、更便宜的產(chǎn)品,直奔主題而去。
這個(gè)軟件最重要的模塊就是通過(guò)條碼掃描偵測(cè)出產(chǎn)品的信息,配合其他的信息手段來(lái)判斷在周邊環(huán)境中同類產(chǎn)品的狀況,這是電子商務(wù)系統(tǒng)的一個(gè)雛形。對(duì)消費(fèi)者來(lái)說(shuō),可以獲得全新的購(gòu)物體驗(yàn)和便捷的生活方式,對(duì)商家來(lái)說(shuō),手機(jī)成為了全新的宣傳平臺(tái),能夠?qū)崟r(shí)向消費(fèi)者提供商品信息。