版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、一、生成對(duì)抗網(wǎng)絡(luò)(GAN我們提出了一個(gè)通過(guò)對(duì)抗過(guò)程估計(jì)生成模型的新框架,在新框架中我們同 時(shí)訓(xùn)練兩個(gè)模型:一個(gè)用來(lái)捕獲數(shù)據(jù)分布的生成模型 G和一個(gè)用來(lái)估計(jì)樣本 來(lái)自訓(xùn)練數(shù)據(jù)而不是G的概率的判別模型D, G的訓(xùn)練過(guò)程是最大化D產(chǎn)生錯(cuò)誤 的概率。這個(gè)框架相當(dāng)于一個(gè)極小化極大的雙方博弈。在任意函數(shù)G和D的空間中存在唯一的解,其中G恢復(fù)訓(xùn)練數(shù)據(jù)分布,并且D處處都等于1/2。在G 和D由多層感知器定義的情況下,整個(gè)系統(tǒng)可以用反向傳播進(jìn)行訓(xùn)練。在訓(xùn)練 或生成樣本期間不需要任何馬爾科夫鏈或展開(kāi)的近似推理網(wǎng)絡(luò)。實(shí)驗(yàn)通過(guò)對(duì)生成的樣品進(jìn)行定性和定量評(píng)估來(lái)展示這個(gè)框架的潛力。目標(biāo)函數(shù)GAN勺目標(biāo)函數(shù):minnwcV
2、(D,G) =嘰凡皿+舊九即阻1 - D(G:),從判別器D的角度,他希望自己可以盡可能的區(qū)分真是樣本和虛假樣本,因此 希望D (x)盡可能的大,D (G (x)盡可能的小,即V (D,G)盡可能的大。 從生成器的角度看,他希望自己盡可能的騙過(guò) D,也就是希望D (G (x)盡可 能的大,即V (D,G)盡可能的小。兩個(gè)模型相對(duì)抗,最后達(dá)到全局最優(yōu)。(b)(c)(d)圖中,黑色曲線是真實(shí)樣本的概率分布函數(shù),綠色曲線是虛假樣本的概率分布 函數(shù),藍(lán)色曲線是判別器D的輸出,它的值越大表示這個(gè)樣本越有可能是真實(shí) 樣本。最下方的數(shù)噪聲z,它映射到了 Xo我們可以看到,一開(kāi)始,雖然 G(z)和x是在同一個(gè)
3、特征空間里的,但它的的差 異很大,這時(shí),雖然鑒別真實(shí)樣本和虛假樣本的模型D性能也不強(qiáng),但它很容易就能把兩者區(qū)分開(kāi)來(lái),而隨著訓(xùn)練的推進(jìn),虛假樣本的分布住建與真實(shí)樣本 重合,D雖然也在不斷更新,但也已經(jīng)力不從心了。最后黑線和綠線幾乎重合,模型達(dá)到了最優(yōu)狀態(tài),這時(shí)D的輸出對(duì)弈任意樣本都是0.5.最優(yōu)化問(wèn)題表達(dá)定義最優(yōu)化問(wèn)題的方法由兩部分組成,首先我們需要定義判別器D以判別樣本是不是從Pdata(x)分布中取出來(lái)的,因此有:4心口) 1。虱。(工)其中E指代取期望。這一項(xiàng)是根據(jù)正類(lèi)(即辨別出x屬于真實(shí)數(shù)據(jù)data )的對(duì)數(shù)損失函數(shù)而構(gòu)建的。最大化這一項(xiàng)相當(dāng)于令判別器D在x服從于data的概率密度時(shí)能準(zhǔn)
4、確地預(yù)測(cè) D(x)=1 ,即:0(工)1 when pd睢式力另外一項(xiàng)是企圖欺騙判別器的生成器 Go該項(xiàng)根據(jù)負(fù)類(lèi)的對(duì)數(shù)損失函數(shù)而 構(gòu)建,即:Jg log(l-D(G(z)我們定義目標(biāo)函數(shù)為:=舊工一*logQQ) +嘰Lg(l - D(G(z).G tJ對(duì)于D而言要盡量使公式最大化(識(shí)別能力強(qiáng)),而對(duì)于 G又想使之最小(生成的數(shù)據(jù)接近實(shí)際數(shù)據(jù))。整個(gè)訓(xùn)練是一個(gè)迭代過(guò)程。其實(shí)極小極大化博弈可以分開(kāi)理解,即在給定 G的情況下先最大化 V(D,G)而取D,然后固定D, 并最小化V(D,G)而得到Go其中,給定G,最大化V(D,G)評(píng)估了 Pg和 Pdata之間的差異或距離。最后,我們可以將最優(yōu)化問(wèn)題
5、表達(dá)為:G. 理向心/。方)理論推導(dǎo)3.1知識(shí)預(yù)備一KL散度要進(jìn)行接下來(lái)的理論推導(dǎo).掰盾先需要一點(diǎn)預(yù)備知識(shí),KL散段(KL divergence ),這是統(tǒng)計(jì)中的一個(gè)覆念.是r星兩種吸率分布的相 似程度,其建小表示網(wǎng)種柢率分布越接近.對(duì)于總敵的概率分布,定義如下:以期|0一工口叫留對(duì)于連期概率分布,定義如下Dkl(P Q) = /)(幻修翳i*找們想耍將一個(gè)例機(jī)部通道T生成網(wǎng)絡(luò)(汨到一個(gè)和真的數(shù)據(jù)分布Pdaia(r)差不多的生成分布 人(明。)旦中的參數(shù)0 255? 絡(luò)的婁我決定的,我們號(hào)空找到e化伴pG(xe)和/%“)盡可獨(dú)按通Maximun Likelihood Estimation我們
6、從其實(shí)數(shù)據(jù)分布Pdata(x)里面取樣m個(gè)點(diǎn),儲(chǔ),/,,小 根據(jù)給翔0我(I何以計(jì)算如下的囁率及(洌.哪么生 成斌m個(gè)用竭08的似然(likelihood)就是:L一3*例 i-I我侑加翌仔的韋情就是找列&至H大化這個(gè)似然估計(jì)O - anctuax IT R;(, c arxinaxlog II %(,洌 i-i te=argmax 52 log (r1;fl)=arg max &%七(;州j arg max / /(x) log PG(x; O)dx - / %式力 log 幾在上面的推導(dǎo)中,我屏里特大化似然由敢L.若對(duì)似佼逑做取對(duì)嵌,肥么鴕桑II就能恁化為里E ,并且這TH程并不會(huì)改變最優(yōu)
7、 化的結(jié)聿.因此我們可I脂極大似然估計(jì)化為求令kgR;(j:6)期里最大化的。.向朗空Ek)年(1;6)可以展開(kāi)為在工上的快分形 式 f Efrj(x) log Pa(x;0)dx.又因?yàn)樵揗優(yōu)化過(guò)程是行對(duì)9的.所以我們添加一項(xiàng)不含e的積分并不fiflW訛翅,田可添加log、(*)/1添加 該積分后.我何以合并這兩個(gè)失分并存*類(lèi)似KI前物詡式.該過(guò)的下: ag max /入匕噂 A匕3(*)-NgmEKL(Pj(“川心(&)這年在前面添7L個(gè)負(fù)號(hào) 將log干面的分?jǐn)呈恳幌?就變成了KL散層: 而外(工冶)如何算出來(lái)呢?%(1) - /小川)加上時(shí)*二里面的I去示示酶妓,也就會(huì):Jo G(”工
8、以 X1 G(z) = x這特我們?nèi)諏?shí)根本沒(méi)辦法求出這個(gè)pcx)出土,這就是生成糖現(xiàn)建本想法.3.2 Global Optimality of p(f =下面,豆(焉要證明:該片優(yōu)化何軸唯一隹G并且該唯一解滿(mǎn)足Pa Pdala.Basic Idea of GAN生 5G:G是一個(gè)生成器.給走先蛉分在片優(yōu)生存到生城分布心(工),這里短迤通也畛似然估計(jì)耳到*崛富D:D是一個(gè)科做,充南是P(M 與凡必(工)之間的差不.這呈閑來(lái)取代極大蝗詁估計(jì)政玻喝在板MR大博弈的第一步中,給定生成器G ,最大化V(D, G)而得出最優(yōu)判削器Do其中,或人化V(D. G)評(píng)怙了 Pc和 外皿之郝I爰異或跑奇.因?yàn)樵谠?/p>
9、論文中價(jià)值函數(shù)可寫(xiě)為在x上的枳分,即將數(shù)學(xué)期里層開(kāi)為枳分形式:P(x)logD(x)dz | J p(z) log(l l)(G(z)dz=Jj&M l D(# 4 加(工)k電(1 例工)d2美于上兩枳分式的證明在GAN原論文中,T7T四?KB布很圣方法都不同,即生18 G不。隔足可送條件 Scott Rome認(rèn)為這一點(diǎn),因?yàn)閯?中G就是不 可逆的.而很步證明宅已都期8 了法 點(diǎn),fWfWI哪州饃地使用了枳分換元公式,而織分怏元又恰好至于G的可逆第K Scott認(rèn)為證明只汨 基于以下等式的施立性:. log(l- RG(z) = E所卻log(l -。(工)該吟式來(lái)源于測(cè)度論中的Radon
10、Nikodym定理有I明國(guó)程卷用了枳分隨訟式,但進(jìn)行空泄玩就必須計(jì)貶G(T).而G的迪麗沒(méi)有艇為存在,井目在呻絳網(wǎng)絡(luò)的實(shí)疑中,它也并不在 在.可闔這個(gè)方法在磯器學(xué)習(xí)和統(tǒng)計(jì)竽文獻(xiàn)中太常見(jiàn)了,因urn們3座了它.在數(shù)據(jù)給定,G給定的前提下. 臉(工)與PcM 都可以看作是常數(shù),我們可以分別用a,b耒表示他們,這樣我,麻可以得到如下 的式子:f(D) 01由。+ 6log(l - D)= ax(l-D)= bxDProposition 1. For G fixedt the optimal discriminator D isHT該彳優(yōu)的D在女心中并不是可計(jì)更的.但在數(shù)學(xué)上十分里航 我們并不應(yīng)S3先
11、驗(yàn)的 心小工),所以我,口在VI穌中永遠(yuǎn)不會(huì)用到它. 另一方面,它的存在今我們可以證明給值為G是存在的.并且在川康中找們只點(diǎn)姿逼近D.星優(yōu)生忒H當(dāng)然GAN過(guò)程的目標(biāo)是令PG - 嘖1這對(duì)彳優(yōu)的D觸味后什么呢?我ff何以格這Tit代入DG.的表達(dá)式中:及意味若判刖器已0克全。了,它完全分辨不出Pdata和PO的區(qū)&J .暝斯樣本安自和PG的錢(qián)率為;基于這一觀點(diǎn).GAN作者證明了 G就是極蛾大博棄的解.該定理如下:Theorem 1. The global minimum of the virtual training criterion C(G) is achieved if and only
12、if pg = Pdaia- Ai that point. C(G) achieves the value - log 4.即當(dāng)目?jī)H當(dāng)Pc- Pdata,訓(xùn)緣昧準(zhǔn)C(G) - max V(G9D)的可以達(dá)到最優(yōu).以上定理fl網(wǎng)大極A.求令V(G, ZT)船J的生成餐G (N中ZT代而配加9判則修).之所以當(dāng)Pc三 為皿 可以令 價(jià)值就鼓最小化,是因?yàn)檫@時(shí)財(cái)個(gè)分布的JS R5LS JSDtPdaMWPaix)等于跖 這一過(guò)程的詳細(xì)解超原論文中的這理是當(dāng)且僅當(dāng)聲明,所以倒穴要從兩個(gè)方向遭隊(duì) 首先我們先從反向逼近開(kāi)證明C(G)的取值,然后再利用在 及向荻用的新知識(shí)從正向證明.設(shè)生=Pdata (反向
13、指預(yù)先知癡E優(yōu)條他并做推9 ),我們可I力爻向推出:V(G.D) (punMOOJug;)必?)=-。2 / z3 A -/2 / x(,)dr = -2咻2 = - 44談值JE全層最小值的怪造.因?yàn)樗挥性赑g = P* 的時(shí)候才出見(jiàn) 倒現(xiàn)在需要從正向證明這一Hfi常常為量小但也就是同時(shí)滿(mǎn) 是當(dāng)J和僅當(dāng)J的條件.現(xiàn)在放棄Pc = Pj aoeis,對(duì)任意一個(gè)G.建們可以將上T求出的H優(yōu)#H8J35 D9代入到 C(G) = maxV(G,D)中:的/i(?。ㄖ幑ぃ贺?)內(nèi)理工.)山因?yàn)橐阎狪og4為全同會(huì)吸選值,麻”我們希望構(gòu)道某個(gè)僚以使方程式中出現(xiàn)Iog2.因此我f可以在抵個(gè)枳分中加上硒去k)g2 ,開(kāi) 不上概也以示.這是一個(gè)十分常見(jiàn)并且不會(huì)改變等式的故學(xué)證明技【5 .因?yàn)楸举|(zhì)上髭們只JE在方例口上了 0.c-止2由1,) aM (京:匕,)3i+ MX(內(nèi)”黑曲j)也采用該技巧主要是希望麟構(gòu)建成含Ioq2 ffl JS的度的形式,上式化劣后可以得至蟻下方達(dá)式:C(G) - -log2 %”)+ Pd“a(H)dz+鬲端融十卬3 (log 2十叫p ) da國(guó)力1率電度的定義,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 同居生子分手協(xié)議書(shū)電子版
- 天津市小型建設(shè)工程合同的適用范圍
- 《地鐵設(shè)施設(shè)備系統(tǒng)》課件
- 2025年宜春貨運(yùn)從業(yè)資格證模擬考試題目
- 2025年隴南道路貨物運(yùn)輸從業(yè)資格證考試
- 2025年瀘州貨物從業(yè)資格證考試題
- 動(dòng)物屠宰產(chǎn)業(yè)升級(jí)
- 智能家居投資管理辦法
- 挖掘機(jī)地鐵建設(shè)施工合同
- 汽車(chē)行業(yè)市場(chǎng)調(diào)研全解析
- 專(zhuān)題19 重點(diǎn)用法感嘆句50道
- 2024-2025學(xué)年統(tǒng)編版五年級(jí)語(yǔ)文上冊(cè)第七單元達(dá)標(biāo)檢測(cè)卷(原卷+答案)
- 人教版七年級(jí)語(yǔ)文上冊(cè)《課內(nèi)文言文基礎(chǔ)知識(shí) 》專(zhuān)項(xiàng)測(cè)試卷及答案
- 2024年光伏住宅能源解決方案協(xié)議
- 【初中數(shù)學(xué)】基本平面圖形單元測(cè)試 2024-2025學(xué)年北師大版數(shù)學(xué)七年級(jí)上冊(cè)
- 江蘇省蘇州市2023-2024學(xué)年高二上學(xué)期1月期末物理試卷(含答案及解析)
- 2025屆陜西省四校聯(lián)考物理高三上期末聯(lián)考試題含解析
- 外墻裝修合同模板
- 中國(guó)發(fā)作性睡病診斷與治療指南(2022版)
- 律師事務(wù)所律師事務(wù)所管理手冊(cè)
- 2024年保安員證考試題庫(kù)及答案(共260題)
評(píng)論
0/150
提交評(píng)論