neural style論文解讀

發(fā)布時間：2016年11月22日作者：文章轉(zhuǎn)自網(wǎng)絡(luò)，版權(quán)歸原作者所有，反饋可立刻刪除

概述

在藝術(shù)領(lǐng)域，藝術(shù)家可以通過風格和內(nèi)容的相互交融來創(chuàng)作不同的畫作，現(xiàn)階段，在深度神經(jīng)網(wǎng)絡(luò)的幫助下，計算機可以輕易的識別畫作中的物體或者內(nèi)容。但是，風格是一個比較抽樣的概念，計算機其實無法像人類那樣識別一個畫作或者藝術(shù)家的風格。這篇文章主要介紹深度神經(jīng)網(wǎng)絡(luò)將畫作中的風格和內(nèi)容本身進行分離，并將風格做遷移，應(yīng)用到另一個圖片內(nèi)容之中，最終達到一個風格遷移的工作。其實這很像Photoshop中的濾鏡，然而濾鏡畢竟是人為設(shè)定好的一系列動作處理集合，只能針對特定風格的圖片，對于不同特征的圖片，需要選擇不同的濾鏡，因此是比較機械和人工的。

卷積神經(jīng)網(wǎng)絡(luò)在圖像識別領(lǐng)域應(yīng)用廣泛，并且實踐證明有很好的效果。它通過一個多層的網(wǎng)絡(luò)結(jié)構(gòu)來對圖像進行特征表達，如果我們把輸入圖像稱之為網(wǎng)絡(luò)的底層，則隨著網(wǎng)絡(luò)層次的加深，高層的網(wǎng)絡(luò)關(guān)注圖片的高級特征，例如圖像的內(nèi)容或者物體的排列，而底層的信息則重點關(guān)注圖像像素級別的特征。為了將圖像的風格和內(nèi)容分離并進行遷移，我們需要做兩部分工作：

圖像內(nèi)容的重建
風格的重建

同時在合成是要同時考慮內(nèi)容重建造成的loss和風格重建造成的loss。

內(nèi)容重建

內(nèi)容重建和風格重建都使用了VGG網(wǎng)絡(luò)，VGG-16的網(wǎng)絡(luò)結(jié)構(gòu)圖參見下圖，詳情圖來自于這里.

圖1 VGG網(wǎng)絡(luò)結(jié)構(gòu)圖

對于內(nèi)容重建來說，只使用了前5層的網(wǎng)絡(luò)‘conv1 1’ (a), ‘conv2 1’ (b), ‘conv3 1’ (c), ‘conv4 1’ (d) and ‘conv5 1’ (e)，即圖2中的a、b、c、d、e。VGG 網(wǎng)絡(luò)主要用來做內(nèi)容識別，在實踐中作者發(fā)現(xiàn)，使用前三層a、b、c已經(jīng)能夠達到比較好的內(nèi)容重建工作，d、e兩層保留了一些比較高層的特征，丟失了一些細節(jié)。

分類導航

neural style論文解讀

概述

內(nèi)容重建

網(wǎng)友評論

更多精彩分享