


下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
解密:“無(wú)中生有”的計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)(ComputerVision,CV)是一門(mén)研究如何使機(jī)器“會(huì)看”的科學(xué)。1963年來(lái)自MIT的LarryRoberts發(fā)表了該領(lǐng)域第一篇博士論文《MachinePerceptionofThree-DimensionalSolids》,標(biāo)志著CV作為一門(mén)新興人工智能方向研究的開(kāi)始。在發(fā)展了50多年后的今天,我們就來(lái)聊聊最近讓計(jì)算機(jī)視覺(jué)擁有“無(wú)中生有”能力的幾個(gè)有趣嘗試:超分辨率重建;
圖像著色;
看圖說(shuō)話;
人像復(fù)原;
圖像自動(dòng)生成。可以看出,這五個(gè)嘗試層層遞進(jìn),難度和趣味程度也逐步提升。由于篇幅有限,本文在此只談視覺(jué)問(wèn)題,不提太過(guò)具體的技術(shù)細(xì)節(jié),若大家對(duì)某部分感興趣,以后再來(lái)單獨(dú)寫(xiě)文章討論。超分辨率重建(ImageSuper-Resolution)
去年夏天,一款名為“waifu2x”的島國(guó)應(yīng)用在動(dòng)畫(huà)和計(jì)算機(jī)圖形學(xué)中著實(shí)火了一把。waifu2x借助深度“卷積神經(jīng)網(wǎng)絡(luò)”(ConvolutionalNeuralNetwork,CNN)技術(shù),可以將圖像的分辨率提升2倍,同時(shí)還能對(duì)圖像進(jìn)行降噪。簡(jiǎn)單來(lái)說(shuō),就是讓計(jì)算機(jī)“無(wú)中生有”地填充一些原圖中并沒(méi)有的像素,從而讓漫畫(huà)看起來(lái)更清晰真切。大家不妨看看圖1、圖2,真想童年時(shí)候看的就是如此高清的龍珠?。D1《龍珠》超分辨率重建效果。右側(cè)為原畫(huà),左側(cè)為waifu2x對(duì)同幀動(dòng)畫(huà)超分辨率重建結(jié)果圖2waifu2x超分辨率重建對(duì)比,上方為低分辨率且有噪聲的動(dòng)畫(huà)圖像,左下為直接放大的結(jié)果,右下為waifu2x去噪和超分辨率結(jié)果不過(guò)需要指出的是,圖像超分辨率的研究始于2009年左右,只是得力于“深度學(xué)習(xí)”的發(fā)展,waifu2x才可以做出更好的效果。在具體訓(xùn)練CNN時(shí),輸入圖像為原分辨率,而對(duì)應(yīng)的超分辨率圖像則作為目標(biāo),以此構(gòu)成訓(xùn)練的“圖像對(duì)”(ImagePair),經(jīng)過(guò)模型訓(xùn)練便可得到超分辨率重建模型。waifu2x的深度網(wǎng)絡(luò)原型基于香港中文大學(xué)湯曉歐教授團(tuán)隊(duì)的成果(如圖3所示)。有趣的是,這一研究指出可以用傳統(tǒng)方法給予深度模型以定性的解釋。在圖3中,低分辨率圖像通過(guò)CNN的卷積(Convolution)和池化(Pooling)操作后可以得到抽象后的特征圖(FeatureMap)。基于低分辨率特征圖,同樣可以利用卷積和池化實(shí)現(xiàn)從低分辨率到高分辨率特征圖的非線性映射(Non-LinearMapping)。最后的步驟則是利用高分辨率特征圖重建高分辨率圖像。實(shí)際上,這三個(gè)步驟與傳統(tǒng)超分辨率重建方法的三個(gè)過(guò)程是一致的。圖3超分辨率重建算法流程。從左至右依次為:低分辨率圖像(輸入)、經(jīng)過(guò)若干卷積和池化操作得到的低分辨率特征圖、低分辨率特征圖經(jīng)過(guò)非線性映射得到的高分辨率特征圖、高分辨率重建圖像(輸出)圖像著色(ImageColorization)
顧名思義,圖像著色是將原本“沒(méi)有”顏色的黑白圖像進(jìn)行彩色填充。圖像著色同樣借助卷積神經(jīng)網(wǎng)絡(luò),輸入為黑白和對(duì)應(yīng)彩色圖像的“圖像對(duì)”,但僅僅通過(guò)對(duì)比黑白像素和RGB像素來(lái)確定填充的顏色,效果欠佳。因?yàn)轭伾畛涞慕Y(jié)果要符合我們的認(rèn)知習(xí)慣,比如,把一條“汪星人”的毛涂成鮮綠色就會(huì)讓人覺(jué)得很怪異。于是近期,早稻田大學(xué)發(fā)表在2016年計(jì)算機(jī)圖形學(xué)國(guó)際頂級(jí)會(huì)議SIGGRAPH上的一項(xiàng)工作就在原來(lái)深度模型的基礎(chǔ)上,加入了“分類網(wǎng)絡(luò)”來(lái)預(yù)先確定圖像中物體的類別,以此為“依據(jù)”再做以顏色填充。圖
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 冰柜使用合同范本
- 云南2025年云南省民族宗教事務(wù)委員會(huì)委屬事業(yè)單位招聘7人筆試歷年參考題庫(kù)附帶答案詳解
- 科技發(fā)展中的倫理與安全意識(shí)普及
- 科技公司如何應(yīng)對(duì)網(wǎng)絡(luò)攻擊的實(shí)戰(zhàn)經(jīng)驗(yàn)
- MJC13-生命科學(xué)試劑-MCE
- GPV574-生命科學(xué)試劑-MCE
- 2002-G12-生命科學(xué)試劑-MCE
- 1-Phenylethylamine-hydrochloride-生命科學(xué)試劑-MCE
- 中山廣東中山市東鳳鎮(zhèn)第二中學(xué)招聘臨聘教師筆試歷年參考題庫(kù)附帶答案詳解
- 租借婚紗合同范本
- 旅行社運(yùn)營(yíng)實(shí)務(wù)電子課件 1.2 了解旅行社核心業(yè)務(wù)部門(mén)
- 部編版五年級(jí)語(yǔ)文下冊(cè)課文四字詞總結(jié)
- 綜合交通運(yùn)輸體系認(rèn)知
- GM/T 0115-2021信息系統(tǒng)密碼應(yīng)用測(cè)評(píng)要求
- YY 0670-2008無(wú)創(chuàng)自動(dòng)測(cè)量血壓計(jì)
- JJF 1458-2014磁軛式磁粉探傷機(jī)校準(zhǔn)規(guī)范
- GB/T 39935-2021塑料制品薄膜和片材抗粘連性的測(cè)定
- GB/T 324-2008焊縫符號(hào)表示法
- 機(jī)器人技術(shù) 第一章 緒論
- 馬工程教材 《公共財(cái)政概論》PPT-第八章 稅收
- GB/T 22544-2008蛋雞復(fù)合預(yù)混合飼料
評(píng)論
0/150
提交評(píng)論