- 基于內(nèi)容的模糊圖像檢索技術(shù)研究 推薦度:
- 相關(guān)推薦
基于內(nèi)容的圖像檢索研究
摘要:基于內(nèi)容的圖像檢索是圖像檢索中較高層次的檢索,文中對(duì)CBIR的各種特征提取方法進(jìn)行了分析比較,最后指出了當(dāng)前的研究熱點(diǎn)和今后的發(fā)展方向。
關(guān)鍵詞:CBIR;特征提取;顏色;紋理;形狀
Research of Content-Based Image Retrieval
LI Cong, ZHANG Ming-xin, QIAO Xiao-ni, ZHANG A-hong
(College of Mathematics and Information Science,Northwest Normal University,Lanzhou 730070,China)
Abstract:Content-Based Image Retrieval is the high level of the retrieval.This paper introduce and compare various methods for feature extraction and similarity measurement.In the end,the hot research and future research trends are presented.
Key words: content-based image retrieval,feature extraction,colour features,texture features,shape features
1 前言
據(jù),人類接受的外部信息,70%以上來(lái)自視覺(jué),圖像作為一種內(nèi)容豐富,表現(xiàn)直觀的多媒體信息被大量廣泛的使用,如何有效的、檢索圖像信息成為迫切需要解決的問(wèn)題。傳統(tǒng)的基于文本的檢索無(wú)法滿足海量下多媒體信息庫(kù)的檢索要求。為了克服基于文本方法的局限性,出現(xiàn)了基于內(nèi)容的圖像檢索。
2 特征檢索技術(shù)
在基于內(nèi)容的圖像檢索中,特征提取是很關(guān)鍵的步驟,所提取的特征直接影響后續(xù)的圖像相似性匹配過(guò)程、檢索有效性等。
2.1 顏色特征檢索
顏色特征檢索是當(dāng)前絕大多數(shù)基于內(nèi)容的圖像和視頻檢索的多媒體數(shù)據(jù)庫(kù)中使用的特征之一;陬伾卣鳈z索主要采用的方法有:顏色直方圖、顏色相關(guān)圖、顏色矩等。
2.1.1 顏色直方圖
顏色直方圖法[1]的具體做法是,在確定顏色空間的基礎(chǔ)上,計(jì)算每種顏色的像素個(gè)數(shù),并構(gòu)造直方圖,最后把直方圖作為圖像的顏色特征進(jìn)行圖像檢索。特征的相似性度量是通過(guò)對(duì)直方圖之間的距離的設(shè)定,當(dāng)它們的距離小于給定的閾值時(shí),即認(rèn)為符合檢索結(jié)果。其改進(jìn)方法有Stricker和dimai于1996年提出的基于顏色空間的固定劃分方法,既先將圖像分割為適當(dāng)?shù)姆謮K,然后用分塊的顏色直方圖和分塊的顏色矩為每個(gè)分塊提取響應(yīng)的局部顏色特征,從而提高圖像檢索的準(zhǔn)確性。文獻(xiàn)[2] 采納Gaussian向量量化技術(shù)提出顏色直方圖,文獻(xiàn)[3] 采用距離角度直方圖方法,統(tǒng)計(jì)每一種顏色在特定距離和角度內(nèi)的顏色直方圖,文獻(xiàn)[4]提出了一種基于位平面直方圖的檢索方法,文獻(xiàn)[5]研究了不同顏色視覺(jué)感知強(qiáng)度間的差異,通過(guò)構(gòu)建顏色主觀信息量函數(shù),實(shí)現(xiàn)對(duì)這種差異的量化描述。在此基礎(chǔ)上構(gòu)建了符合視覺(jué)感知特性的顏色直方圖。
2.1.2 顏色相關(guān)圖
顏色相關(guān)圖[6]color correlogram)是圖像顏色分布的另一種表達(dá)方式。這種特征不但刻畫(huà)了某一種顏色的像素?cái)?shù)量占整個(gè)圖像的比例,還反映了不同顏色對(duì)之間的空間相關(guān)性。顏色相關(guān)圖的圖像檢索效果很好,但是它的缺點(diǎn)就是計(jì)算量很大。
2.1.3 顏色矩
顏色矩[7] (color moments)由Stricker 和Orengo所提出。這種方法的基礎(chǔ)在于圖像中任何的顏色分布均可以用它的矩來(lái)表示。此外,由于顏色分布信息主要集中在低階矩中,因此僅采用顏色的一階矩(mean)、二階矩(variance)和三階矩(skewness)就足以表達(dá)圖像的顏色分布。與顏色直方圖相比,該方法的好處在于無(wú)需對(duì)特征進(jìn)行向量化。
2.2 紋理特征檢索
一般將圖像在局部區(qū)域內(nèi)呈現(xiàn)不規(guī)則性,而在整體上表現(xiàn)出某種規(guī)律性的特性稱為紋理。紋理特征通常被看作圖像的某種局部特征,它不僅反映圖像的灰度統(tǒng)計(jì)信息,而且反映圖像的空間分布信息和結(jié)構(gòu)信息。
基于內(nèi)容的圖像檢索中常用的紋理特征提取算法,主要有灰度共生矩陣、Tamura紋理特征、小波變換等。
2.3 形狀特征檢索
形狀是圖像的可視內(nèi)容的一個(gè)重要特征。對(duì)于形狀匹配來(lái)說(shuō),Hough變換是最經(jīng)典的方法。常用的形狀匹配方法還有歐氏距離、馬氏距離,幾何參數(shù)法,小波重要系數(shù)法。在眾多形狀匹配算法中,Barrow等人提出的Chamfer比較法吸引了不少研究者的興趣,該方法能夠以線性的時(shí)間復(fù)雜度比較兩個(gè)圖像的形狀塊集合。在形狀描述方面,主要包括邊界特征法、傅立葉形狀描述符法(Fourier shape descriptors)、幾何參數(shù)法、形狀不變矩法、有限元方法(Finite Element Method,FEM)、小波描述子法等。
2.4 圖像內(nèi)容的空間關(guān)系
上述的顏色、紋理和形狀等多種特征反映的都是圖像的整體特征,而無(wú)法體現(xiàn)圖像中所包含的對(duì)象或物體。事實(shí)上,圖像中對(duì)象所在的位置和對(duì)象之間的空間關(guān)系同樣是圖像檢索中非常重要的特征。
在基于空間關(guān)系的圖像檢索方面國(guó)內(nèi)外學(xué)者做了大量的研究,如文獻(xiàn)[8]提出的基于空間關(guān)系的圖像檢索,該方法對(duì)一幅圖像從幾個(gè)方向的投影作為這幅圖像的顏色特征分布,并對(duì)圖像做小波分解來(lái)減少檢索時(shí)運(yùn)算的數(shù)據(jù)量,然后對(duì)分解后圖像的低頻子帶做Radon變換得到顏色空間分布的特征向量,并根據(jù)這個(gè)特征進(jìn)行檢索。文獻(xiàn)[9]中提出一種改進(jìn)的
基于模糊量化的顏色量化方法并在此基礎(chǔ)上提出了一種基于顏色-空間特征的檢索方法。文獻(xiàn)[10]中提出一種通過(guò)提取顏色特征、灰度特征,獲取圖像物體的形狀和空間特征,綜合檢索圖像的方法,檢索結(jié)果不受圖像大小、旋轉(zhuǎn)和輕微的光照變化的影響,相對(duì)于傳統(tǒng)的顏色直方圖法,這種方法能明顯改善檢索效果。
3 目前的研究的熱點(diǎn)領(lǐng)域
3.1 Mpeg-7在基于內(nèi)容的圖像檢索中的應(yīng)用
MPEG-7標(biāo)準(zhǔn)在一個(gè)穩(wěn)定的底層架構(gòu)上為用戶提供了較大的靈活性。這一標(biāo)準(zhǔn)的發(fā)布,對(duì)圖像低層特征的提取和描述將更具規(guī)范性,結(jié)合MPEG-7標(biāo)準(zhǔn)的圖像檢索可在特征及其提取、查詢接口、檢索引擎、索引等方面進(jìn)一步深入研究。MPEG-7多媒體內(nèi)容描述標(biāo)準(zhǔn)的制定將極大的促進(jìn)CBIR的廣泛應(yīng)用。目前基于MPEG-7的圖像檢索的研究主要集中在模型的研究。如文獻(xiàn)[11]文獻(xiàn)[12]的基于MPEG-7標(biāo)準(zhǔn)的圖像檢索系統(tǒng)的抽象模型。
3.2 圖像數(shù)據(jù)庫(kù)技術(shù)
由于基于內(nèi)容的圖像檢索需要將圖像的顏色、文理和形狀等作為索引,用戶通過(guò)選擇具有代表性的一幅或多幅例子圖像來(lái)構(gòu)造圖像,因此關(guān)系數(shù)據(jù)庫(kù)在基于內(nèi)容的圖像檢索中面臨著諸多問(wèn)題,基于內(nèi)容的圖像數(shù)據(jù)庫(kù)的研究變的由為重要。面向?qū)ο髷?shù)據(jù)庫(kù)所支持的多媒體的各種結(jié)構(gòu)和類型數(shù)據(jù)能較好的解決目前所面臨的問(wèn)題。文獻(xiàn)[13]中提出基于內(nèi)容圖像數(shù)據(jù)庫(kù)的結(jié)構(gòu)并構(gòu)造了一個(gè)按內(nèi)容檢索的面向?qū)ο髷?shù)據(jù)模型。
3.3 基于內(nèi)容的圖像檢索的性能評(píng)價(jià)的度量方法的研究
對(duì)于性能評(píng)價(jià)的度量方法,目前采用最多的方法還是傳統(tǒng)的信息檢索領(lǐng)域中普遍采用的查準(zhǔn)率和查全率,但查全率和查準(zhǔn)率的局限性在于沒(méi)有考慮檢索結(jié)果中相似圖像所處的位置。研究者們還用以下幾種度量方法來(lái)評(píng)價(jià)圖像檢索的性能:1)3點(diǎn)平均植:查全率為0.2,0.5,0.8處查準(zhǔn)率的平均植[14]。2)11點(diǎn)平均植:在11個(gè)查準(zhǔn)率點(diǎn)處查準(zhǔn)率的平均植。3)當(dāng)準(zhǔn)確率下降到0.5時(shí)的查全率[14] (4)Berman和Shapiro通過(guò)判斷相關(guān)圖像出現(xiàn)在返回的前50幅和前500幅圖像中的比例來(lái)評(píng)判檢索性能[15]。5)Hwang et al 所使用的錯(cuò)誤率的方法,即檢測(cè)出的不相關(guān)的圖像和圖像總數(shù)的比值來(lái)判斷檢索性能[15]。
4 結(jié)束語(yǔ)
自20世紀(jì)90年代以來(lái),隨著互聯(lián)網(wǎng)的高速發(fā)展、數(shù)字圖像的廣泛應(yīng)用,使得如何有效組織、和檢索大規(guī)模的圖像數(shù)據(jù)成為亟待解決的問(wèn)題,因此,CBIR技術(shù)成為一個(gè)研究熱點(diǎn),目前,世界各國(guó)的相關(guān)研究人員沿著基于內(nèi)容的圖像檢索研究方向也已成功的開(kāi)發(fā)出許多帶有商業(yè)性質(zhì)或者研究性質(zhì)的CBIR系統(tǒng),但是,在這個(gè)領(lǐng)域目前還有很多值得深入研究的課題。正如John Eakins博士所言:基于內(nèi)容檢索的圖像分析與檢索技術(shù)的研究不會(huì)是曇花一現(xiàn),它不像某些過(guò)分熱情洋溢的學(xué)者所期望的那么有效,它也不像某些批評(píng)者所想的那么糟糕,它會(huì)繼續(xù)得到
發(fā)展和改進(jìn)。
參考文獻(xiàn):
[1] MichaelSwain,DanaBallard.Colorindexing[J].International Journal of Computer Vision,1991.
[2] Jeong S,Won C S,Gray R M.Image retrieval using color histograms generated by Gauss mixture vector quantization[J].Computer Vision and Image Understanding,2004,9(1-3):44-46.
[3] Ediz Saykol,Ugur Gudukbay,Ozgur Ulusoy.A histogram-based approach for object-based query-by-shape-and-color in image and video databases[J].Image and Vision Computing,2005(23),1170-1180.
[4] 王向陽(yáng),胡峰麗.基于位平面顏色直方圖的圖象檢索新方法[J].小型微型系統(tǒng),2007(4).
[5] 胡珊,郭雷,沈云濤.基于視覺(jué)感知特性的顏色直方圖[J].,2006(12).
[6] Mao A K Jain.Textureclassification and segmentation using multiresolution simultaneous autoregressive models[J].Pattern Recognition,1992,25(2):173-188.
[7] Markus Stricker,Markus Orengo.Similarity of color images[C]//Proc SPIE Storage and Retrieval for Image and Video Databases,1995.
[8] 牛蕾,倪林,苗原.基于顏色空間分布特征的圖像檢索[J].算機(jī)工程與應(yīng)用,2005(4).
[9] 方俊, 郭雷, 汪子強(qiáng).一種改進(jìn)的基于顏色-空間特征的圖像檢索方法[J].計(jì)算機(jī)工程與應(yīng)用,2005(25).
[10] 錢瑛,須文波.基于顏色空間特征的圖像檢索[J].江南大學(xué)學(xué)報(bào):自然科學(xué)版,2007,6(2).
[11] 李嵐,馮剛.MPEG-7與基于內(nèi)容的圖像檢索算機(jī)工程與應(yīng)用[J].算機(jī)工程與應(yīng)用,2002(17).
[12] 陳慧.基于內(nèi)容的圖像檢索與MPEG-7[J].福建電腦,2007(12).
[13] 孟倩.基于內(nèi)容查詢的圖像數(shù)據(jù)庫(kù)模型[J].計(jì)算機(jī)應(yīng)用與軟件,2007(1).
[14] 韋娜.基于內(nèi)容的圖像檢索系統(tǒng)性能評(píng)價(jià)[J].中國(guó)圖象圖形學(xué)報(bào),2004,9(11).
[15] Henning Mǖller.Pattern Recognition Letters[J].2001,22(5):593-601.
【基于內(nèi)容的圖像檢索研究】相關(guān)文章:
基于內(nèi)容的模糊圖像檢索技術(shù)研究03-18
基于顏色特征的藏毯圖像檢索研究與實(shí)現(xiàn)03-21
基于個(gè)性化的檔案檢索方式研究12-02
基于分形維數(shù)的圖像分類研究03-07
基于嵌入式思想的小波圖像壓縮研究03-20
基于圖像的OMR技術(shù)的實(shí)現(xiàn)03-07
基于BP算法紅外遙感圖像去條帶方法研究03-07