本文提出了一個(gè)圖像去模糊方向的綜述,來(lái)自澳大利亞國(guó)立大學(xué)、中山大學(xué)、美國(guó)加州大學(xué) Merced 分校、日本樂(lè)天研究所的研究者回顧了基于深度學(xué)習(xí)的圖像去模糊技術(shù)研究進(jìn)展,回顧了圖像去模糊的研究歷史,總結(jié)了當(dāng)前的研究進(jìn)展,并進(jìn)行了展望。該綜述近期被計(jì)算機(jī)視覺(jué)旗艦期刊 International Journal of Computer Vision 接收。
圖像去模糊是計(jì)算機(jī)底層視覺(jué)中的一個(gè)經(jīng)典問(wèn)題,它的目標(biāo)是將輸入的模糊圖像中恢復(fù)成清晰的圖像。近些年,基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)在該任務(wù)上取得了重大進(jìn)展。本文對(duì)最近發(fā)表的基于深度學(xué)習(xí)的圖像去模糊方法進(jìn)行了全面的回顧,主要看點(diǎn)如下:
1.闡述圖像去模糊的研究背景,包括如何定義去模糊、模糊產(chǎn)生的原因、去模糊的方法、質(zhì)量評(píng)估的指標(biāo)、常見(jiàn)的數(shù)據(jù)集。
2.討論了近些年基于深度學(xué)習(xí)在圖像去模糊領(lǐng)域中取得的進(jìn)展,對(duì)當(dāng)前的深度去模糊方法進(jìn)行全面回顧。
3.分析了當(dāng)前圖像去模糊存在的挑戰(zhàn)以及未來(lái)的研究課題。
背景知識(shí)
圖像模糊是由拍攝圖像過(guò)程中的各種因素引起,包括相機(jī)抖動(dòng)、目標(biāo)運(yùn)動(dòng)以及離焦等。根據(jù)模糊圖片的不同,一般將模糊圖片分為如下幾類(lèi):運(yùn)動(dòng)模糊,離焦模糊,高斯模糊,以及混合模糊。
(1)運(yùn)動(dòng)模糊:在光照充足的條件下,當(dāng)曝光時(shí)間足夠短時(shí),相機(jī)可以捕捉到清晰的圖像。但是,當(dāng)曝光時(shí)間相對(duì)于物體或者相機(jī)運(yùn)動(dòng)過(guò)長(zhǎng)的時(shí)候,圖像會(huì)產(chǎn)生模糊,該模糊圖片一般被稱(chēng)為運(yùn)動(dòng)模糊。
(2)離焦模糊:除了運(yùn)動(dòng)模糊之外,圖像清晰度還受到目標(biāo)位置以及相機(jī)焦距的影響。在相機(jī)的成像區(qū)域中,不同目標(biāo)的景深是不同的,當(dāng)相機(jī)的對(duì)焦系統(tǒng)無(wú)法對(duì)焦到某些目標(biāo)時(shí),相機(jī)就會(huì)拍攝到離焦模糊的圖片。
(3)高斯模糊:高斯模糊是通過(guò)高斯卷積得到的一種模糊圖像。
(4)混合模糊:當(dāng)一個(gè)圖片同時(shí)被多種因素影響時(shí),造成的模糊就是混合模糊,比如相機(jī)拍攝在離焦?fàn)顟B(tài)下的高速運(yùn)動(dòng)物體時(shí),得到的模糊就是一種混合模糊。
為了評(píng)估去模糊的效果,通常采用一些圖片評(píng)估算法,這些算法包括基于主觀和基于客觀的評(píng)測(cè)。主觀方法是不需要清晰圖像作參考的,一個(gè)具有代表性的指標(biāo)是 MOS,評(píng)測(cè)者用 1-5 的等級(jí)對(duì)圖像質(zhì)量進(jìn)行評(píng)分,之后對(duì)分?jǐn)?shù)進(jìn)行平均。對(duì)于圖像去模糊的問(wèn)題,大多數(shù)現(xiàn)有方法都是根據(jù)基于客觀的指標(biāo)進(jìn)行評(píng)測(cè),該方法可以進(jìn)一步分為兩類(lèi):有參考和無(wú)參考的指標(biāo)。有參考的指標(biāo)通過(guò)將恢復(fù)的圖像與清晰圖進(jìn)行比較來(lái)評(píng)估圖像質(zhì)量,包括 PSNR,SSIM, WSNR, MS-SSIM、IFC、NQM、UIQI、VIT、LPIPS 等等,其中 PSNR 跟 SSIM 是最常用的指標(biāo)。
與有參考的指標(biāo)不同,無(wú)參考指標(biāo)僅使用去模糊的圖像就可以衡量其質(zhì)量。常見(jiàn)的指標(biāo)包括 BIQI、BLINDS、BRISQUE、CORNIA、NIQE、SSEQ 等。此外,也有人通過(guò)測(cè)量去模糊算法對(duì)不同視覺(jué)任務(wù)(例如目標(biāo)檢測(cè)和識(shí)別)準(zhǔn)確性的影響,來(lái)評(píng)估圖像去模糊算法的性能。
非盲圖像去模糊
圖像去模糊的任務(wù)是根據(jù)給定的模糊圖像,恢復(fù)潛在的清晰圖像。當(dāng)已知圖片模糊核的情況下,則該問(wèn)題也可以被稱(chēng)為非盲圖像去模糊。盡管已知了模糊核,但是由于傳感器噪聲和高頻信息的丟失,該任務(wù)仍然具有挑戰(zhàn)性。
一些基于非深度學(xué)習(xí)的方法通常使用自然圖像先驗(yàn),例如全局或者局部圖像先驗(yàn),在空間域 或頻域中重建清晰的圖像。為了恢復(fù)出更好的圖片,近些年,一些基于空間反卷積和深度神經(jīng)網(wǎng)絡(luò)的方法相繼被提出。本文在下面表格中總結(jié)了現(xiàn)有的基于深度學(xué)習(xí)的非盲方法,這些方法可以大致分為兩組:第一組是基于反卷積去噪,而第二組是基于先驗(yàn)去噪聲:
盲圖像去模糊
當(dāng)模糊圖的模糊核未知時(shí),圖像去模糊任務(wù)被稱(chēng)為盲圖像去模糊。早期的盲圖像去模糊方法側(cè)重于去除均勻的模糊核。然而,真實(shí)世界的模糊圖像,其不同區(qū)域通常是由不同的模糊核生成,因此其模糊核是非均勻的。為了解決盲圖像的去模糊任務(wù),多種基于深度學(xué)習(xí)的圖像去模糊算法被提出。本文在下面表格中總結(jié)了現(xiàn)有的基于深度學(xué)習(xí)的盲圖像去模糊方法,這些方法通常采用各種不同的網(wǎng)絡(luò)框架,包括多尺度網(wǎng)絡(luò)、對(duì)抗神經(jīng)網(wǎng)絡(luò)、級(jí)聯(lián)網(wǎng)絡(luò)、再模糊網(wǎng)絡(luò)等等。
損失函數(shù)
為了更好的訓(xùn)練深度去模糊網(wǎng)絡(luò),各種各樣的損失函數(shù)被提出。早期的方法大部分是基于像素級(jí)內(nèi)容的損失函數(shù),用于測(cè)量網(wǎng)絡(luò)訓(xùn)練過(guò)程中的去模糊圖片跟清晰圖片的重建誤差??紤]到像素級(jí)內(nèi)容的損失不能準(zhǔn)確衡量去模糊圖像的質(zhì)量,各種其他的損失函數(shù)被提出,包括基于對(duì)抗的損失函數(shù)、基于感知的損失函數(shù)、基于相對(duì)模糊的損失函數(shù)、基于光流的損失函數(shù)等等。
模型性能對(duì)比
本本總結(jié)了具有代表性的圖像去模糊跟視頻去模糊算法在主流數(shù)據(jù)集上的 PSNR/SSIM 指標(biāo)。
此外,本文總結(jié)了不同損失函數(shù)對(duì)去模糊方法的影響,模型在 non-reference 的評(píng)價(jià)指標(biāo)上的表現(xiàn),以及模型的速度。
特定場(chǎng)景的圖像去模糊
當(dāng)前,絕大部分基于深度學(xué)習(xí)的圖像去模糊算法是不區(qū)分場(chǎng)景的,也就是他們是對(duì)常見(jiàn)的自然與人為設(shè)計(jì)的場(chǎng)景進(jìn)行去模糊。但是,在現(xiàn)實(shí)生活中,經(jīng)常會(huì)遇到一些特定場(chǎng)景的圖像去模糊。比如人臉去模糊、文本去模糊、雙目去模糊。本文總結(jié)了這些不同場(chǎng)景的特點(diǎn),以及各自的深度去模糊算法。
機(jī)遇與挑戰(zhàn)
盡管圖像去模糊算法在主流數(shù)據(jù)集上取得了重大進(jìn)展,但把真實(shí)世界的模糊圖恢復(fù)成清晰的圖像仍然具有挑戰(zhàn)性。本文最后總結(jié)了圖像去模糊算法現(xiàn)在面臨的挑戰(zhàn)并討論了未來(lái)可能的研究機(jī)會(huì),包括真實(shí)數(shù)據(jù)采集、損失函數(shù)、評(píng)價(jià)指標(biāo)、模型規(guī)模、無(wú)監(jiān)督學(xué)習(xí)等等。
審核編輯:郭婷
-
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5500瀏覽量
121111
原文標(biāo)題:頂刊IJCV 2022!基于深度學(xué)習(xí)的圖像去模糊綜述來(lái)了!
文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論