圖像識別技術(shù)論文(2)
圖像識別技術(shù)論文篇二
淺析人工智能中的圖像識別技術(shù)
摘要:圖像識別技術(shù)是信息時代的一門重要的技術(shù),其產(chǎn)生目的是為了讓計算機(jī)代替人類去處理大量的物理信息。隨著計算機(jī)技術(shù)的發(fā)展,人類對圖像識別技術(shù)的認(rèn)識越來越深刻。圖像識別技術(shù)的過程分為信息的獲取、預(yù)處理、特征抽取和選擇、分類器設(shè)計和分類決策。文章簡單分析了圖像識別技術(shù)的引入、其技術(shù)原理以及模式識別等,之后介紹了神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)和非線性降維的圖像識別技術(shù)及圖像識別技術(shù)的應(yīng)用。從中可以總結(jié)出圖像處理技術(shù)的應(yīng)用廣泛,人類的生活將無法離開圖像識別技術(shù),研究圖像識別技術(shù)具有重大意義。
關(guān)鍵詞:圖像識別;原理;過程;分析;神經(jīng)網(wǎng)絡(luò);非線性
中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)14-0147-02
1 圖像識別技術(shù)的引入
圖像識別是人工智能的一個重要領(lǐng)域。圖像識別的發(fā)展經(jīng)歷了三個階段:文字識別、數(shù)字圖像處理與識別、物體識別。圖像識別,顧名思義,就是對圖像做出各種處理、分析,最終識別我們所要研究的目標(biāo)。今天所指的圖像識別并不僅僅是用人類的肉眼,而是借助計算機(jī)技術(shù)進(jìn)行識別。雖然人類的識別能力很強(qiáng)大,但是對于高速發(fā)展的社會,人類自身識別能力已經(jīng)滿足不了我們的需求,于是就產(chǎn)生了基于計算機(jī)的圖像識別技術(shù)。這就像人類研究生物細(xì)胞,完全靠肉眼觀察細(xì)胞是不現(xiàn)實(shí)的,這樣自然就產(chǎn)生了顯微鏡等用于精確觀測的儀器。通常一個領(lǐng)域有固有技術(shù)無法解決的需求時,就會產(chǎn)生相應(yīng)的新技術(shù)。圖像識別技術(shù)也是如此,此技術(shù)的產(chǎn)生就是為了讓計算機(jī)代替人類去處理大量的物理信息,解決人類無法識別或者識別率特別低的信息。
1.1 圖像識別技術(shù)原理
其實(shí),圖像識別技術(shù)背后的原理并不是很難,只是其要處理的信息比較繁瑣。計算機(jī)的任何處理技術(shù)都不是憑空產(chǎn)生的,它都是學(xué)者們從生活實(shí)踐中得到啟發(fā)而利用程序?qū)⑵淠M實(shí)現(xiàn)的。計算機(jī)的圖像識別技術(shù)和人類的圖像識別在原理上并沒有本質(zhì)的區(qū)別,只是機(jī)器缺少人類在感覺與視覺差上的影響罷了。人類的圖像識別也不單單是憑借整個圖像存儲在腦海中的記憶來識別的,我們識別圖像都是依靠圖像所具有的本身特征而先將這些圖像分了類,然后通過各個類別所具有的特征將圖像識別出來的,只是很多時候我們沒有意識到這一點(diǎn)。當(dāng)看到一張圖片時,我們的大腦會迅速感應(yīng)到是否見過此圖片或與其相似的圖片。其實(shí)在“看到”與“感應(yīng)到”的中間經(jīng)歷了一個迅速識別過程,這個識別的過程和搜索有些類似。在這個過程中,我們的大腦會根據(jù)存儲記憶中已經(jīng)分好的類別進(jìn)行識別,查看是否有與該圖像具有相同或類似特征的存儲記憶,從而識別出是否見過該圖像。機(jī)器的圖像識別技術(shù)也是如此,通過分類并提取重要特征而排除多余的信息來識別圖像。機(jī)器所提取出的這些特征有時會非常明顯,有時又是很普通,這在很大的程度上影響了機(jī)器識別的速率??傊?,在計算機(jī)的視覺識別中,圖像的內(nèi)容通常是用圖像特征進(jìn)行描述。
1.2 模式識別
模式識別是人工智能和信息科學(xué)的重要組成部分。模式識別是指對表示事物或現(xiàn)象的不同形式的信息做分析和處理從而得到一個對事物或現(xiàn)象做出描述、辨認(rèn)和分類等的過程。
計算機(jī)的圖像識別技術(shù)就是模擬人類的圖像識別過程。在圖像識別的過程中進(jìn)行模式識別是必不可少的。模式識別原本是人類的一項基本智能。但隨著計算機(jī)的發(fā)展和人工智能的興起,人類本身的模式識別已經(jīng)滿足不了生活的需要,于是人類就希望用計算機(jī)來代替或擴(kuò)展人類的部分腦力勞動。這樣計算機(jī)的模式識別就產(chǎn)生了。簡單地說,模式識別就是對數(shù)據(jù)進(jìn)行分類,它是一門與數(shù)學(xué)緊密結(jié)合的科學(xué),其中所用的思想大部分是概率與統(tǒng)計。模式識別主要分為三種:統(tǒng)計模式識別、句法模式識別、模糊模式識別。
2 圖像識別技術(shù)的過程
既然計算機(jī)的圖像識別技術(shù)與人類的圖像識別原理相同,那它們的過程也是大同小異的。圖像識別技術(shù)的過程分以下幾步:信息的獲取、預(yù)處理、特征抽取和選擇、分類器設(shè)計和分類決策。
信息的獲取是指通過傳感器,將光或聲音等信息轉(zhuǎn)化為電信息。也就是獲取研究對象的基本信息并通過某種方法將其轉(zhuǎn)變?yōu)闄C(jī)器能夠認(rèn)識的信息。
預(yù)處理主要是指圖像處理中的去噪、平滑、變換等的操作,從而加強(qiáng)圖像的重要特征。
特征抽取和選擇是指在模式識別中,需要進(jìn)行特征的抽取和選擇。簡單的理解就是我們所研究的圖像是各式各樣的,如果要利用某種方法將它們區(qū)分開,就要通過這些圖像所具有的本身特征來識別,而獲取這些特征的過程就是特征抽取。在特征抽取中所得到的特征也許對此次識別并不都是有用的,這個時候就要提取有用的特征,這就是特征的選擇。特征抽取和選擇在圖像識別過程中是非常關(guān)鍵的技術(shù)之一,所以對這一步的理解是圖像識別的重點(diǎn)。
分類器設(shè)計是指通過訓(xùn)練而得到一種識別規(guī)則,通過此識別規(guī)則可以得到一種特征分類,使圖像識別技術(shù)能夠得到高識別率。分類決策是指在特征空間中對被識別對象進(jìn)行分類,從而更好地識別所研究的對象具體屬于哪一類。
3 圖像識別技術(shù)的分析
隨著計算機(jī)技術(shù)的迅速發(fā)展和科技的不斷進(jìn)步,圖像識別技術(shù)已經(jīng)在眾多領(lǐng)域中得到了應(yīng)用。2015年2月15日新浪科技發(fā)布一條新聞:“微軟最近公布了一篇關(guān)于圖像識別的研究論文,在一項圖像識別的基準(zhǔn)測試中,電腦系統(tǒng)識別能力已經(jīng)超越了人類。人類在歸類數(shù)據(jù)庫Image Net中的圖像識別錯誤率為5.1%,而微軟研究小組的這個深度學(xué)習(xí)系統(tǒng)可以達(dá)到4.94%的錯誤率。”從這則新聞中我們可以看出圖像識別技術(shù)在圖像識別方面已經(jīng)有要超越人類的圖像識別能力的趨勢。這也說明未來圖像識別技術(shù)有更大的研究意義與潛力。而且,計算機(jī)在很多方面確實(shí)具有人類所無法超越的優(yōu)勢,也正是因?yàn)檫@樣,圖像識別技術(shù)才能為人類社會帶來更多的應(yīng)用。
3.1神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)
神經(jīng)網(wǎng)絡(luò)圖像識別技術(shù)是一種比較新型的圖像識別技術(shù),是在傳統(tǒng)的圖像識別方法和基礎(chǔ)上融合神經(jīng)網(wǎng)絡(luò)算法的一種圖像識別方法。這里的神經(jīng)網(wǎng)絡(luò)是指人工神經(jīng)網(wǎng)絡(luò),也就是說這種神經(jīng)網(wǎng)絡(luò)并不是動物本身所具有的真正的神經(jīng)網(wǎng)絡(luò),而是人類模仿動物神經(jīng)網(wǎng)絡(luò)后人工生成的。在神經(jīng)網(wǎng)絡(luò)圖像識別技術(shù)中,遺傳算法與BP網(wǎng)絡(luò)相融合的神經(jīng)網(wǎng)絡(luò)圖像識別模型是非常經(jīng)典的,在很多領(lǐng)域都有它的應(yīng)用。在圖像識別系統(tǒng)中利用神經(jīng)網(wǎng)絡(luò)系統(tǒng),一般會先提取圖像的特征,再利用圖像所具有的特征映射到神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像識別分類。以汽車拍照自動識別技術(shù)為例,當(dāng)汽車通過的時候,汽車自身具有的檢測設(shè)備會有所感應(yīng)。此時檢測設(shè)備就會啟用圖像采集裝置來獲取汽車正反面的圖像。獲取了圖像后必須將圖像上傳到計算機(jī)進(jìn)行保存以便識別。最后車牌定位模塊就會提取車牌信息,對車牌上的字符進(jìn)行識別并顯示最終的結(jié)果。在對車牌上的字符進(jìn)行識別的過程中就用到了基于模板匹配算法和基于人工神經(jīng)網(wǎng)絡(luò)算法。 3.2非線性降維的圖像識別技術(shù)
計算機(jī)的圖像識別技術(shù)是一個異常高維的識別技術(shù)。不管圖像本身的分辨率如何,其產(chǎn)生的數(shù)據(jù)經(jīng)常是多維性的,這給計算機(jī)的識別帶來了非常大的困難。想讓計算機(jī)具有高效地識別能力,最直接有效的方法就是降維。降維分為線性降維和非線性降維。例如主成分分析(PCA)和線性奇異分析(LDA)等就是常見的線性降維方法,它們的特點(diǎn)是簡單、易于理解。但是通過線性降維處理的是整體的數(shù)據(jù)集合,所求的是整個數(shù)據(jù)集合的最優(yōu)低維投影。經(jīng)過驗(yàn)證,這種線性的降維策略計算復(fù)雜度高而且占用相對較多的時間和空間,因此就產(chǎn)生了基于非線性降維的圖像識別技術(shù),它是一種極其有效的非線性特征提取方法。此技術(shù)可以發(fā)現(xiàn)圖像的非線性結(jié)構(gòu)而且可以在不破壞其本征結(jié)構(gòu)的基礎(chǔ)上對其進(jìn)行降維,使計算機(jī)的圖像識別在盡量低的維度上進(jìn)行,這樣就提高了識別速率。例如人臉圖像識別系統(tǒng)所需的維數(shù)通常很高,其復(fù)雜度之高對計算機(jī)來說無疑是巨大的“災(zāi)難”。由于在高維度空間中人臉圖像的不均勻分布,使得人類可以通過非線性降維技術(shù)來得到分布緊湊的人臉圖像,從而提高人臉識別技術(shù)的高效性。
3.3 圖像識別技術(shù)的應(yīng)用及前景
計算機(jī)的圖像識別技術(shù)在公共安全、生物、工業(yè)、農(nóng)業(yè)、交通、醫(yī)療等很多領(lǐng)域都有應(yīng)用。例如交通方面的車牌識別系統(tǒng);公共安全方面的人臉識別技術(shù)、指紋識別技術(shù);農(nóng)業(yè)方面的種子識別技術(shù)、食品品質(zhì)檢測技術(shù);醫(yī)學(xué)方面的心電圖識別技術(shù)等。隨著計算機(jī)技術(shù)的不斷發(fā)展,圖像識別技術(shù)也在不斷地優(yōu)化,其算法也在不斷地改進(jìn)。圖像是人類獲取和交換信息的主要來源,因此與圖像相關(guān)的圖像識別技術(shù)必定也是未來的研究重點(diǎn)。以后計算機(jī)的圖像識別技術(shù)很有可能在更多的領(lǐng)域嶄露頭角,它的應(yīng)用前景也是不可限量的,人類的生活也將更加離不開圖像識別技術(shù)。
4 總結(jié)
圖像識別技術(shù)雖然是剛興起的技術(shù),但其應(yīng)用已是相當(dāng)廣泛。并且,圖像識別技術(shù)也在不斷地成長,隨著科技的不斷進(jìn)步,人類對圖像識別技術(shù)的認(rèn)識也會更加深刻。未來圖像識別技術(shù)將會更加強(qiáng)大,更加智能地出現(xiàn)在我們的生活中,為人類社會的更多領(lǐng)域帶來重大的應(yīng)用。在21世紀(jì)這個信息化的時代,我們無法想象離開了圖像識別技術(shù)以后我們的生活會變成什么樣。圖像識別技術(shù)是人類現(xiàn)在以及未來生活必不可少的一項技術(shù)。
參考文獻(xiàn):
[1] [2] 陳華. 淺談神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)及方法[J]. 濟(jì)寧師范??茖W(xué)校學(xué)報, 2006, 27(6):20-22.
[3] 萬國紅. 基于神經(jīng)網(wǎng)絡(luò)的圖像識別與分類技術(shù)及應(yīng)用研究[D]. 華中科技大學(xué), 2002.
[4] 譚璐, 易東云, 吳翊,等. 基于非線性降維方法的圖像識別[C]. 中國計算機(jī)學(xué)會全國web信息系統(tǒng)及其應(yīng)用學(xué)術(shù)會議. 2004.
[5] 劉翠響, 張艷, 于明,等. 基于非線性降維的人臉圖像數(shù)據(jù)分析[C]// 2006中國控制與決策學(xué)術(shù)年會. 2006.
[6]孫杰, 張以謨, 劉鐵根. Web圖像識別技術(shù)及實(shí)現(xiàn)[J]. 計算機(jī)工程與設(shè)計, 2006, 27(4):587-589.
看了“圖像識別技術(shù)論文”的人還看: