概率算法新-精品教育課件

上傳人：g*** IP屬地：貴州上傳時(shí)間：2022-07-19 格式：PPT 頁(yè)數(shù)：147 大?。?.38MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩142頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1算法設(shè)計(jì)與分析黃劉生中國(guó)科學(xué)技術(shù)大學(xué)計(jì)算機(jī)系國(guó)家高性能計(jì)算中心（合肥）2019.8.192第一部分概率算法3Ch.1 緒論1. 故事：想象自己是神化故事的主人公，你有一張不易懂的地圖，上面描述了一處寶藏的藏寶地點(diǎn)。經(jīng)分析你能確定最有可能的兩個(gè)地點(diǎn)是藏寶地點(diǎn)，但二者相距甚遠(yuǎn)。假設(shè)你如果已到達(dá)其中一處，就立即知道該處是否為藏寶地點(diǎn)。你到達(dá)兩處之一地點(diǎn)及從其中一處到另一處的距離是5天的行程。進(jìn)一步假設(shè)有一條惡龍，每晚光顧寶藏并從中拿走一部分財(cái)寶。假設(shè)你取寶藏的方案有兩種：1.1 引言4 方案1. 花4天的時(shí)間計(jì)算出準(zhǔn)確的藏寶地點(diǎn)，然后出發(fā)尋寶，一旦出發(fā)不能重新計(jì)算方案2. 有一個(gè)小精靈告訴你地

2、圖的秘密，但你必須付給他報(bào)酬，相當(dāng)于龍3晚上拿走的財(cái)寶 Prob 1.1.1 若忽略可能的冒險(xiǎn)和出發(fā)尋寶的代價(jià)，你是否接受小精靈的幫助？顯然，應(yīng)該接受小精靈的幫助，因?yàn)槟阒恍杞o出3晚上被盜竊的財(cái)寶量，否則你將失去4晚被盜財(cái)寶量。但是，若冒險(xiǎn)，你可能做得更好！1.1 引言5 設(shè)x是你決定之前當(dāng)日的寶藏價(jià)值，設(shè)y是惡龍每晚盜走的寶藏價(jià)值，并設(shè)x9y 方案1：4天計(jì)算確定地址，行程5天，你得到的寶藏價(jià)值為：x-9y 方案2：3y付給精靈，行程5天失去5y，你得到的寶藏價(jià)值為：x-8y 方案3：投硬幣決定先到一處，失敗后到另一處(冒險(xiǎn)方案) 一次成功所得：x-5y，機(jī)會(huì)1/2 二次成功所得：x-1

3、0y，機(jī)會(huì)1/21.1 引言期望贏利：x-7.5y62. 意義該故事告訴我們：當(dāng)一個(gè)算法面臨某種選擇時(shí)，有時(shí)隨機(jī)選擇比耗時(shí)做最優(yōu)選擇更好，尤其是當(dāng)最優(yōu)選擇所花的時(shí)間大于隨機(jī)選擇的平均時(shí)間的時(shí)侯顯然，概率算法只能是期望的時(shí)間更有效，但它有可能遭受到最壞的可能性。73. 期望時(shí)間和平均時(shí)間的區(qū)別確定算法的平均執(zhí)行時(shí)間輸入規(guī)模一定的所有輸入實(shí)例是等概率出現(xiàn)時(shí)，算法的平均執(zhí)行時(shí)間。概率算法的期望執(zhí)行時(shí)間反復(fù)解同一個(gè)輸入實(shí)例所花的平均執(zhí)行時(shí)間。因此，對(duì)概率算法可以討論如下兩種期望時(shí)間平均的期望時(shí)間：所有輸入實(shí)例上平均的期望執(zhí)行時(shí)間最壞的期望時(shí)間：最壞的輸入實(shí)例上的期望執(zhí)行時(shí)間84. 例子快速排

4、序中的隨機(jī)劃分要求學(xué)生寫一算法，由老師給出輸入實(shí)例，按運(yùn)行時(shí)間打分，大部分學(xué)生均不敢用簡(jiǎn)單的劃分，運(yùn)行時(shí)間在1500-2600ms，三個(gè)學(xué)生用概率的方法劃分，運(yùn)行時(shí)間平均為300ms。8皇后問題系統(tǒng)的方法放置皇后(回溯法)較合適，找出所有92個(gè)解 O(2n)，若只找92個(gè)其中的任何一個(gè)解可在線性時(shí)間內(nèi)完成O(n)。隨機(jī)法：隨機(jī)地放置若干皇后能夠改進(jìn)回溯法，特別是當(dāng)n較大時(shí)判斷大整數(shù)是否為素?cái)?shù)確定算法無(wú)法在可行的時(shí)間內(nèi)判斷一個(gè)數(shù)百位十進(jìn)制數(shù)是否素?cái)?shù)，否則密碼就不安全。概率算法將有所作為：若能接受一個(gè)任意小的錯(cuò)誤的概率95. 概率算法的特點(diǎn) (1) 不可再現(xiàn)性在同一個(gè)輸入實(shí)例上，每次執(zhí)行結(jié)果

5、不盡相同，例如N-皇后問題概率算法運(yùn)行不同次將會(huì)找到不同的正確解找一給定合數(shù)的非平凡因子每次運(yùn)行的結(jié)果不盡相同，但確定算法每次運(yùn)行結(jié)果必定相同 (2) 分析困難要求有概率論，統(tǒng)計(jì)學(xué)和數(shù)論的知識(shí)106. 約定隨機(jī)函數(shù)uniform：隨機(jī)，均勻，獨(dú)立設(shè)a，b為實(shí)數(shù)，ab, uniform(a, b) 返回x，a x b 設(shè)i，j為整數(shù)，ij, uniform(i.j)=k, i k j 設(shè)X是非空有限集， uniform(X) X 11例1：設(shè)p是一個(gè)素?cái)?shù)，a是一個(gè)整數(shù)滿足1a0 do if (j is odd) s sa mod p;a a2 mod p;j j div 2;return s

6、;Draw (a, p) / 在X中隨機(jī)取一元素j uniform(1.p-1);return ModularExponent(a, j, p); / 在X中隨機(jī)取一元素13偽隨機(jī)數(shù)發(fā)生器在實(shí)用中不可能有真正的隨機(jī)數(shù)發(fā)生器，多數(shù)情況下是用偽隨機(jī)數(shù)發(fā)生器代替。大多數(shù)偽隨機(jī)數(shù)發(fā)生器是基于一對(duì)函數(shù)：S: X X, 這里X足夠大，它是種子的值域R: X Y, Y是偽隨機(jī)數(shù)函數(shù)的值域使用S獲得種子序列：x0=g, xi=S(xi-1), i0然后使用R獲得偽隨機(jī)序列：yi=R(xi), i 0該序列必然是周期性的，但只要S和R選的合適，該周期長(zhǎng)度會(huì)非常長(zhǎng)。TC中可用rand()和srand(time),

7、用GNU C更好14基本特征隨機(jī)決策在同一實(shí)例上執(zhí)行兩次其結(jié)果可能不同在同一實(shí)例上執(zhí)行兩次的時(shí)間亦可能不太相同分類Numerical, Monte Carlo, Las Vegas, Sherwood.很多人將所有概率算法(尤其是數(shù)字的概率算法)稱為Monte Carlo算法1.2 概率算法的分類15數(shù)字算法隨機(jī)性被最早用于求數(shù)字問題的近似解例如，求一個(gè)系統(tǒng)中隊(duì)列的平均長(zhǎng)度的問題，確定算法很難得到答案概率算法獲得的答案一般是近似的，但通常算法執(zhí)行的時(shí)間越長(zhǎng)，精度就越高，誤差就越小使用的理由現(xiàn)實(shí)世界中的問題在原理上可能就不存在精確解例如，實(shí)驗(yàn)數(shù)據(jù)本身就是近似的，一個(gè)無(wú)理數(shù)在計(jì)算機(jī)中只能近似地表

8、示精確解存在但無(wú)法在可行的時(shí)間內(nèi)求得有時(shí)答案是以置信區(qū)間的形式給出的1.2 概率算法的分類16Monte Carlo算法 (MC算法)蒙特卡洛算法1945年由J. Von Neumann進(jìn)行核武模擬提出的。它是以概率和統(tǒng)計(jì)的理論與方法為基礎(chǔ)的一種數(shù)值計(jì)算方法，它是雙重近似：一是用概率模型模擬近似的數(shù)值計(jì)算，二是用偽隨機(jī)數(shù)模擬真正的隨機(jī)變量的樣本。這里我們指的MC算法是：若問題只有1個(gè)正確的解，而無(wú)近似解的可能時(shí)使用MC算法例如，判定問題只有真或假兩種可能性，沒有近似解因式分解，我們不能說(shuō)某數(shù)幾乎是一個(gè)因子特點(diǎn)：MC算法總是給出一個(gè)答案，但該答案未必正確，成功(即答案是正確的)的概率正比于算法

9、執(zhí)行的時(shí)間缺點(diǎn)：一般不能有效地確定算法的答案是否正確1.2 概率算法的分類17Las Vegas算法 (LV算法)LV算法絕不返回錯(cuò)誤的答案。特點(diǎn)：獲得的答案必定正確，但有時(shí)它仍根本就找不到答案。和MC算法一樣，成功的概率亦隨算法執(zhí)行時(shí)間增加而增加。無(wú)論輸入何種實(shí)例，只要算法在該實(shí)例上運(yùn)行足夠的次數(shù)，則算法失敗的概率就任意小。 Sherwood算法Sherwood算法總是給出正確的答案。當(dāng)某些確定算法解決一個(gè)特殊問題平均的時(shí)間比最壞時(shí)間快得多時(shí)，我們可以使用Sherwood算法來(lái)減少，甚至是消除好的和壞的實(shí)例之間的差別。1.2 概率算法的分類18這類算法主要用于找到一個(gè)數(shù)字問題的近似解2.1

10、值計(jì)算實(shí)驗(yàn)：將n根飛鏢隨機(jī)投向一正方形的靶子，計(jì)算落入此正方形的內(nèi)切圓中的飛鏢數(shù)目k。假定飛鏢擊中方形靶子任一點(diǎn)的概率相等(用計(jì)算機(jī)模擬比任一飛鏢高手更能保證此假設(shè)成立)設(shè)圓的半徑為r，面積s1= r2；方靶面積s2=4r2由等概率假設(shè)可知落入圓中的飛鏢和正方形內(nèi)的飛鏢平均比為：由此知： Ch.2 數(shù)字概率算法19求近似值的算法為簡(jiǎn)單起見，只以上圖的右上1/4象限為樣本Darts (n) k 0;for i 1 to n do x uniform(0, 1);y uniform(0, 1); / 隨機(jī)產(chǎn)生點(diǎn)(x,y)if (x2 + y2 1) then k+; /圓內(nèi)return 4k/

11、n;實(shí)驗(yàn)結(jié)果： =3.141592654n = 1000萬(wàn): 3.140740, 3.142568 (2位精確)n = 1億: 3.141691, 3.141363 (3位精確)n = 10億: 3.141527, 3.141507 (4位精確)2.1 值計(jì)算20求近似值的算法Ex.1 若將y uniform(0, 1) 改為 y x, 則上述的算法估計(jì)的值是什么？2.1 值計(jì)算21Monte Carlo積分(但不是指我們定義的MC算法)1、概率算法1設(shè)f: 0, 1 0, 1是一個(gè)連續(xù)函數(shù)，則由曲線y=f(x), x軸, y軸和直線x=1圍成的面積由下述積分給出：向單位面積的正方形內(nèi)投鏢n次

12、，落入陰影部分的鏢的數(shù)目為k，則顯然，只要n足夠大2.2 數(shù)字積分 (計(jì)算定積分的值)22概率算法1HitorMiss (f, n) k 0;for i 1 to n do x uniform(0, 1);y uniform(0, 1);if y f(x) then k+;return k/n;Note: 是S/4的面積， =S, 2.2 數(shù)字積分 (計(jì)算定積分的值)23概率算法1Ex2. 在機(jī)器上用估計(jì)值，給出不同的n值及精度。Ex3. 設(shè)a, b, c和d是實(shí)數(shù)，且a b, c d, f:a, b c, d是一個(gè)連續(xù)函數(shù)，寫一概率算法計(jì)算積分：注意，函數(shù)的參數(shù)是a, b, c, d, n

13、和f, 其中f用函數(shù)指針實(shí)現(xiàn)，請(qǐng)選一連續(xù)函數(shù)做實(shí)驗(yàn)，并給出實(shí)驗(yàn)結(jié)果。2.2 數(shù)字積分 (計(jì)算定積分的值)24概率算法1*Ex4. 設(shè),是(0,1)之間的常數(shù)，證明：若I是的正確值，h是由HitorMiss算法返回的值，則當(dāng)n I(1-I)/2時(shí)有：Prob|h-I| 1 上述的意義告訴我們：Prob|h-I| , 即：當(dāng)n I(1-I)/ 2時(shí)，算法的計(jì)算結(jié)果的絕對(duì)誤差超過(guò)的概率不超過(guò)，因此我們根據(jù)給定和可以確定算法迭代的次數(shù)解此問題時(shí)可用切比雪夫不等式，將I看作是數(shù)學(xué)期望。2.2 數(shù)字積分 (計(jì)算定積分的值)25概率算法2更有效的概率算法是：在積分區(qū)間上隨機(jī)均勻地產(chǎn)生點(diǎn)，求出這些點(diǎn)上的函數(shù)

14、值的算術(shù)平均值，再乘以區(qū)間的寬度：Crude (f, n, a, b) sum 0;for i 1 to n do x uniform(a, b);sum sum + f(x);return (b-a)sum/n;2.2 數(shù)字積分 (計(jì)算定積分的值)26概率算法2用HitorMiss和Crude運(yùn)行三次的結(jié)果為：假定和存在，由算法求得的估算值的方差反比于點(diǎn)數(shù)n。當(dāng)n足夠大時(shí)，估計(jì)的分布近似為正態(tài)分布。對(duì)于給定的迭代次數(shù)n，Crude算法的方差不會(huì)大于HitorMiss的方差。但不能說(shuō)，Crude算法總是優(yōu)于HitorMiss。因?yàn)楹笳咴诮o定的時(shí)間內(nèi)能迭代的次數(shù)更多。例如，計(jì)算值時(shí)，Crud

15、e需計(jì)算平方根，而用投鏢算法darts時(shí)無(wú)需計(jì)算平方根。2.2 數(shù)字積分 (計(jì)算定積分的值)27確定的算法梯形算法將區(qū)間分為n-1個(gè)子區(qū)間，每個(gè)子區(qū)間內(nèi)的長(zhǎng)度為，Trapezoid (f, n, a, b) / 假設(shè) n 2delta (b-a)/(n-1);sum (f(a) + f(b)/2;for x a+delta step delta to b delta dosum sum + f(x)return sum delta;2.2 數(shù)字積分 (計(jì)算定積分的值)28確定的算法當(dāng)n=100, =3.140399 當(dāng)n=1,000, =3.141555 當(dāng)n=10,000, =3.1415

16、86 當(dāng)n=100,000, =3.141593一般地，在同樣的精度下，梯形算法的迭代次數(shù)少于MC積分，但是有時(shí)確定型積分算法求不出解：例如， f(x)=sin2(100)! x)，。但是用梯形算法時(shí)，當(dāng)2 n101時(shí)，返回值是0。若用MC積分則不會(huì)發(fā)生該類問題，或雖然發(fā)生，但概率小得多。2.2 數(shù)字積分 (計(jì)算定積分的值)29多重積分在確定算法中，為了達(dá)到一定的精度，采樣點(diǎn)的數(shù)目隨著積分維數(shù)成指數(shù)增長(zhǎng)，例如，一維積分若有100個(gè)點(diǎn)可達(dá)到一定的精度，則二維積分可能要計(jì)算1002個(gè)點(diǎn)才能達(dá)到同樣的精度，三維積分則需計(jì)算1003個(gè)點(diǎn)。(系統(tǒng)的方法) 但概率算法對(duì)維數(shù)的敏感度不大，僅是每次迭代

17、中計(jì)算的量稍增一點(diǎn)，實(shí)際上，MC積分特別適合用于計(jì)算4或更高維數(shù)的定積分。若要提高精度，則可用混合技術(shù)：部分采用系統(tǒng)的方法，部分采用概率的方法2.2 數(shù)字積分 (計(jì)算定積分的值)30 上一節(jié)可以認(rèn)為，數(shù)字概率算法被用來(lái)近似一個(gè)實(shí)數(shù)，本節(jié)可用它們來(lái)估計(jì)一個(gè)整數(shù)值。例如，設(shè)X為有限集，若要求X的勢(shì)|X|，則當(dāng)X較大時(shí)，枚舉顯然不現(xiàn)實(shí)。問題：隨機(jī)選出25人，你是否愿意賭其中至少有兩個(gè)人生日相同嗎？直覺告訴我們，一般人都不愿意賭其成立，但實(shí)際上成立的概率大于50%。2.3 概率計(jì)數(shù)31 一般地，從n個(gè)對(duì)象中選出k個(gè)互不相同的對(duì)象，若考慮選擇的次序，則不同的選擇有種；若允許重復(fù)選取同一對(duì)象，則不

18、同的選法共有種。因此，從n個(gè)對(duì)象(允許同一對(duì)象重復(fù)取多次)中隨機(jī)均勻地選擇出的k個(gè)對(duì)象互不相同的概率是：，注意a，b和b，a是不同的取法。由此可知，上述問題中，25個(gè)人生日互不相同的概率是：這里假設(shè)：不考慮潤(rùn)年，一年中人的生日是均勻分布的。2.3 概率計(jì)數(shù)32由Stirling公式知：可得假定 Tj;3.2 隨機(jī)的預(yù)處理52例2：離散對(duì)數(shù)計(jì)算離散對(duì)數(shù)計(jì)算困難使其可用于密碼算法，數(shù)字簽名等定義：設(shè) a=gx mod p，記 logg,pa=x，稱x為a的(以g為底模除p)對(duì)數(shù)。從p，g，a計(jì)算x稱為離散對(duì)數(shù)問題。簡(jiǎn)單算法計(jì)算gx對(duì)所有的x，最多計(jì)算0 x p-1 或 1xp，因?yàn)閷?shí)際

19、上離散對(duì)數(shù)是循環(huán)群；驗(yàn)證a=gx mod p 是否成立。dlog(g, a, p) / 當(dāng)這樣的對(duì)數(shù)不存在時(shí)，算法返回p x 0; y 1; do x+; y y*g; / 計(jì)算y=gx while ( a y mod p) and (x p); return x53問題：最壞O(p)循環(huán)次數(shù)難以預(yù)料，當(dāng)滿足一定條件時(shí)平均循環(huán)p/2次當(dāng)p=24位十進(jìn)制數(shù)，循環(huán)1024次，千萬(wàn)億次/秒 (1016次/秒) 大約算1年(108秒/年)若p是數(shù)百位十進(jìn)制？隨機(jī)選擇都可能無(wú)法在可行的時(shí)間內(nèi)求解。假設(shè)有一個(gè)平均時(shí)間性能很好，但最壞情況差的確定算法求logg,pa，怎樣用Sherwood算法求解該問題？

20、設(shè)p=19, g=2當(dāng)a=14, 6時(shí)，log2,1914 = 7, log2,196=14，即用dlog求14和6的離散對(duì)數(shù)時(shí)，分別要循環(huán)7和14次，執(zhí)行時(shí)間與a的取值相關(guān)。用sherwood算法應(yīng)該使得與a無(wú)關(guān)，用隨機(jī)預(yù)處理的方法計(jì)算logg,pa例2：離散對(duì)數(shù)計(jì)算54定理(見p877, 31.6) dlogRH(g, a, p) / 求logg,pa, a = gx mod p，求x / Sherwood算法 r uniform(0.p-2); b ModularExponent(g, r, p); /求冪模b=gr mod p c ba mod p; /(gr modp)(gxmod

21、p)modp=gr+xmodp=c y logg,pc; / 使用確定性算法求logp,gc, y=r+x return (y-r) mod (p-1); / 求xEx. 分析dlogRH的工作原理，指出該算法相應(yīng)的u和v3.2 隨機(jī)的預(yù)處理55隨機(jī)預(yù)處理提供了一種加密計(jì)算的可能性假定你想計(jì)算某個(gè)實(shí)例x，通過(guò)f(x)計(jì)算，但你缺乏計(jì)算能力或是缺乏有效算法，而別人有相應(yīng)的計(jì)算能力，愿意為你計(jì)算(可能會(huì)收費(fèi))，若你愿意別人幫你計(jì)算，但你不愿意泄露你的輸入實(shí)例x，你將如何做？可將隨機(jī)預(yù)處理使用到f的計(jì)算上：使用函數(shù)u將x加密為某一隨機(jī)實(shí)例y 將y提交給f計(jì)算出f(y)的值使用函數(shù)v轉(zhuǎn)換為f(x

22、) 上述過(guò)程，他人除了知道你的實(shí)例大小外，不知道x的任何信息，因?yàn)閡(x,r)的概率分布(只要r是隨機(jī)均勻選擇的)是獨(dú)立于x的。3.2 隨機(jī)的預(yù)處理56 設(shè)兩個(gè)數(shù)組val1.n和ptr1.n及head構(gòu)成一個(gè)有序的靜態(tài)鏈表：valhead valptrhead valptrptrhead valptrn-1head例：3.3 搜索有序表 i 1 2 3 4 5 6 7vali 2 3 13 1 5 21 8ptri 2 5 6 1 7 0 3rank 2 3 6 1 4 7 5head=4 有序表：1，2，3，5，8，13，21 57折半查找：若val1.n本身有序，可用折半查找找某個(gè)給定的

23、key，時(shí)間為O(lgn)。順序查找：但此表為鏈?zhǔn)浇Y(jié)構(gòu)，故最壞時(shí)間是(n)。盡管如此，我們能夠找到一個(gè)確定性算法，平均時(shí)間為。相應(yīng)的Sherwood算法的期望時(shí)間是，它雖然并不比確定性算法快，但他消除了最壞實(shí)例。假定表中元素互不相同，且所求的關(guān)鍵字在表中存在，則給定x，我們是求下標(biāo)i，使vali=x, 這里1i n。任何實(shí)例可以由兩個(gè)參數(shù)刻畫：前n個(gè)整數(shù)的排列 x的rank3.3 搜索有序表58設(shè)Sn是所有n!個(gè)排列的集合，設(shè)A是一個(gè)確定性算法 tA(n, k, )表示算法A的執(zhí)行時(shí)間，此時(shí)間與被查找元素的秩k，以及val的排列相關(guān)。若A是一個(gè)概率算法，則tA(n, k, )表示算法

24、的期望值。無(wú)論算法是確定的還是概率的，wA(n)和mA(n)分別表示最壞時(shí)間和平均時(shí)間，因此有： 3.3 搜索有序表59時(shí)間為O(n)的確定算法算法設(shè)xvali且x在表中，則從位置i開始查找x的算法為Search(x, i) /仍可改進(jìn)while x vali do i ptri;return i;在表val1.n中查找x的算法為：A(x) return Search(x, head);3.3 搜索有序表60性能分析設(shè)rank(x)=k, 則：算法A在n個(gè)元素的表中查找x所需的訪問數(shù)組元素的次數(shù)，顯然與無(wú)關(guān) 算法A最壞時(shí)的訪問次數(shù) 算法A平均的訪問次數(shù) 3.3 搜索有序表61時(shí)間為O(n)的

25、概率算法算法 D(x) i uniform(1.n);y vali;case x y: return Search(x, ptri); / case2 otherwise: return i; / case3， x = y3.3 搜索有序表62性能分析(D訪問數(shù)組次數(shù)) 一般情況設(shè)rank(x)=k, rank(vali)=j 若 k j, 則，屬于case2，從jth最小元之后搜索若 k = j, 則，屬于case3 最壞情況3.3 搜索有序表63 平均情況3.3 搜索有序表64平均時(shí)間為的確定算法算法B(x) /設(shè)x在val1.n中i head;max vali; / max初值是

26、表val中最小值for j 1 to do / 在val的前個(gè)數(shù)中找不大于x y val j ; / 的最大整數(shù)y相應(yīng)的下標(biāo)i if max y x then i j; max y; /endif / endforreturn Search(x, i); / 從y開始繼續(xù)搜索3.3 搜索有序表65性能分析 for循環(huán)的目的：找不超過(guò)x的最大整數(shù)y，使搜索從y開始，若將val1.n中的n個(gè)整數(shù)看作是均勻隨機(jī)分布的，則在val1.L中求y值就相當(dāng)于在n個(gè)整數(shù)中，隨機(jī)地取L個(gè)整數(shù)，求這L個(gè)整數(shù)中不大于x的最大整數(shù)y。可用一個(gè)與L和n相關(guān)的隨機(jī)變量來(lái)分析，更簡(jiǎn)單的分析如下：設(shè)n個(gè)整數(shù)的排列滿足：a

27、1 a2 0，更好的情況是：Ch.4 Las Vegas 算法70Obstinate(x) repeatLV(x, y, success);until success;return y; 設(shè)t(x)是算法obstinate找到一個(gè)正確解的期望時(shí)間，則若要最小化t(x)，則需在p(x), s(x)和e(x)之間進(jìn)行某種折衷，例如，若要減少失敗的時(shí)間，則可降低成功的概率p(x)。Ch.4 Las Vegas 算法71傳統(tǒng)的回溯法4.1 8后問題72置當(dāng)前行為第1行，當(dāng)前列為第1列，即ij1;while i 8 do / 當(dāng)前行號(hào) 8檢查當(dāng)前行：從當(dāng)前列j起向后逐列試探，尋找安全列號(hào)；if 找到安

28、全列號(hào) then 放置皇后，將列號(hào)記入棧，并將下一行置為當(dāng)前行(i+); j1; /當(dāng)前列置為1 else 退?；厮莸缴弦恍?，即i-；移去該行已放置的皇后，以該皇后所在列的下一列作為當(dāng) 前列；4.1 8后問題73734.1 8后問題2.Las Vegas方法向量try1.8中存放結(jié)果tryi表示第i個(gè)皇后放在（i，tryi)位置上try1.k稱為k-promising是指：若k個(gè)皇后的位置(0k 8): (1,try1), (2,try2), , (k,tryk)互相不攻擊，則稱try1.k是k-promising的.形式化：對(duì) ，若有 (式1)若式1成立，則：無(wú)行沖突：無(wú)須考慮，因?yàn)榈趇

29、個(gè)皇后放在第i行，故同一行不會(huì)有兩皇后74744.1 8后問題無(wú)列沖突：若對(duì)任意不同的兩行i、j，因?yàn)槠淞袛?shù)之差不為0，故任意兩皇后不可能在同一列上。135對(duì)角線無(wú)沖突：和沖突時(shí)有：即故任兩皇后不會(huì)在135對(duì)角線上沖突。45對(duì)角線無(wú)沖突：和沖突時(shí)有：即tryi-tryj=i-j故任兩皇后不會(huì)在45對(duì)角線上沖突。綜上所述，式1成立時(shí)try1.k是k-promising。顯然，若k 1，則向量try1.k是k-promising的，對(duì)8后問題，解是8-promising的。算法7575 QueensLv (success) /貪心的LV算法，所有皇后都是隨機(jī)放置/若Success=tr

30、ue，則try1.8包含8后問題的一個(gè)解。 col,diag45,diag135；/列及兩對(duì)角線集合初值為空 k 0；/行號(hào) repeat /try1.k是k-promising，考慮放第k+1個(gè)皇后 nb 0；/計(jì)數(shù)器，nb值為（k+1)th皇后的open位置總數(shù) for i 1 to 8 do /i是列號(hào) if (i col) and (i-k-1 diag45) and (i+k+1 diag135) then /列i對(duì)（k+1）th皇后可用，但不一定馬上將其放在第i列 nb nb+1； if uniform(1.nb)=1 then /或許放在第i列 j i；/注意第一次uniform

31、一定返回1，即j一定有值1 /endif /endfor，在nb個(gè)安全的位置上隨機(jī)選擇1個(gè)位置j放置之76764.1 8后問題if(nb 0) then /nb=0時(shí)無(wú)安全位置，第k+1個(gè)皇后尚未放好/在所有nb個(gè)安全位置上，(k+1)th皇后選擇位置j的概率為1/nb kk+1；/try1.k+1是(k+1)-promising tryk j；/放置(k+1)th個(gè)皇后 col col j ； diag45 diag45 j-k ； diag135 diag135 j+k ； /endif until （nb=0）or（k=8）；/當(dāng)前皇后找不到合適的位置或try是 / 8-promisin

32、g時(shí)結(jié)束。 success （nb0）；77774.1 8后問題分析設(shè)p是成功的概率（一次成功） s：成功時(shí)搜索的結(jié)點(diǎn)的平均數(shù)(1個(gè)皇后放好算是搜索樹上的1個(gè)結(jié)點(diǎn)) e：失敗時(shí)搜索的結(jié)點(diǎn)的平均數(shù)。顯然s=9（空向量try算在內(nèi)）, p和e理論上難于計(jì)算，但實(shí)驗(yàn)用計(jì)算機(jī)可以計(jì)算出：p=0.1293e=6.971在重復(fù)上述算法，直至成功時(shí)(相當(dāng)于obstinate的時(shí)間），所搜索的平均結(jié)點(diǎn)數(shù)：大大優(yōu)于回溯法，回溯法約為114個(gè)結(jié)點(diǎn)才能求出一個(gè)解。Ex.證明：當(dāng)放置（k+1)th皇后時(shí)，若有多個(gè)位置是開放的,則算法QueensLV選中其中任一位置的概率相等。78784.1 8后問題問題及改進(jìn)消極：L

33、V算法過(guò)于消極，一旦失敗，從頭再來(lái)樂觀：回溯法過(guò)于樂觀，一旦放置某個(gè)皇后失敗，就進(jìn)行系統(tǒng)回退一步的策略，而這一步往往不一定有效。折中：會(huì)更好嗎？一般情況下為此。先用LV方法隨機(jī)地放置前若干個(gè)結(jié)點(diǎn)，例如k個(gè)。然后使用回溯法放置后若干個(gè)結(jié)點(diǎn)，但不考慮重放前k個(gè)結(jié)點(diǎn)。若前面的隨機(jī)選擇位置不好，可能使得后面的位置不成功，如若前兩個(gè)皇后的位置是1、3。隨機(jī)放置的皇后越多，則后續(xù)回溯階段的平均時(shí)間就越少，失敗的概率也就越大。79794.1 8后問題改進(jìn)算法折中算法只需將QueensLV的最后兩行改為：until nb = 0 or k = stepVegas；if （nb0)then /已隨機(jī)放好st

34、opVegas個(gè)皇后 backtrace (k, col, diag45, diag135,success);else success false；stepVegas控制隨機(jī)放置皇后的個(gè)數(shù)，如何選擇？改進(jìn)算法的試驗(yàn)結(jié)果：8080純回溯時(shí)間：40msstepVegas=2 or 3：10ms（平均）純貪心LV：23ms（平均）結(jié)論：一半略少的皇后隨機(jī)放置較好。StepVegaspset011141141139.6339.6320.87522.5339.6728.2030.493113.4815.1029.0140.261810.318.7935.1050.16249.337.2946.9260

35、.13579.056.9853.5070.129396.9755.9380.129396.9753.9381814.1 8后問題-問題1：為什么僅隨機(jī)放一個(gè)皇后，其效果就會(huì)大大優(yōu)于純回溯方法？82824.1 8后問題-問題2：預(yù)先隨機(jī)選幾個(gè)皇后放置為好？由于解缺乏規(guī)律性（至少在皇后數(shù)不等于4k+2，k為某整數(shù)時(shí)），故求出stepVegas的最優(yōu)值較難，但是找到一個(gè)較好（不一定是最優(yōu)）的stepVegas還是可以的。12皇后：StepVegaspset時(shí)間01262262125ms50.503933.8847.2380.3937ms120.04651310.2222.11基本與純回溯相同8383

36、4.1 8后問題在Apple II機(jī)器上，20個(gè)皇后：確定性的回溯算法：找到第一個(gè)解的時(shí)間大于2個(gè)小時(shí)。概率算法，隨機(jī)地放置前10個(gè)皇后：5分半鐘找到36個(gè)不同的解。后者找一個(gè)接比前者大約快1000倍！-Obstinate算法在何時(shí)無(wú)限循環(huán)？當(dāng)問題不存在解時(shí)。對(duì)于n皇后，要求n=4，即問題至少有一個(gè)解存在時(shí)，Obstinate算法才有可能結(jié)束。Ex. 寫一算法，求n=1220時(shí)最優(yōu)的StepVegas值。84844.2 模p平方根定義1：設(shè)p是一個(gè)奇素?cái)?shù)，若整數(shù)x1,p-1且存在一個(gè)整數(shù)y，使則稱x為模p的二次剩余（quadratic residue），若y 1,p-1，則y稱為x模p的平方根

37、。例：63是55模103的平方根，55是模103的二次剩余。定義2：若整數(shù) ，且z不是模p的二次剩余，則z是模p的非二次剩余。85854.2 模p平方根定理1：任何一個(gè)模p的二次剩余至少有兩個(gè)不同的平方根pf：設(shè)x是模p的二次剩余，y是x模p的平方根。因?yàn)楣手灰Cp-yy且1p-yp-1就可證明p-y是不同于y的x模p的另一個(gè)平方根。p是奇數(shù)， p-yy，否則p是偶數(shù)。另一方面， 1yp-1，p-y p (p-1)=1 /yp-1 p-yp-1 /y186864.2 模p平方根定理2：任一模p的二次剩余至多有兩個(gè)不同的平方根pf：設(shè) a和b是x模p的平方根。即成立。若k=0，則a=b若k0，

38、則ab不妨設(shè)ab. 又，由Th31.7知即即，也就是說(shuō)任意兩個(gè)不同的平方根，均只有b和(p-b)兩種不同形式。87874.2 模p平方根定理3：1到p-1之間的整數(shù)恰有一半是模p的二次剩余.pf：由定理1和定理2知，任一模p的二次剩余恰有兩個(gè)不同的平方根，即：任取二次剩余，只有y和p-y這兩個(gè)不同的平方根在1,p-1中恰有(p-1)/2對(duì)不同的平方根，每對(duì)平方根對(duì)應(yīng)的模p的余數(shù)必定在1,p-1中，即此區(qū)間上恰有(p-1)/2個(gè)模p的二次剩余。定理4：對(duì) ，p是任一奇素?cái)?shù)，有且x是模p的二次剩余當(dāng)且僅當(dāng)pf：略（可用費(fèi)馬定理）88884.2 模p平方根如何判定x是否為模p的二次剩余？

39、只要利用定理4和計(jì)算方冪模即可。已知p是奇素?cái)?shù)，x是模p的二次剩余，如何計(jì)算x模p的兩個(gè)平方根？當(dāng) 時(shí)，兩平方根易求，分別是當(dāng) 時(shí)，沒有有效的確定性算法，只能借助于Las Vegas算法。89894.2 模p平方根Las Vegas算法用表示x的兩個(gè)平方根中較小的一個(gè)。Def：模p乘法（類似于復(fù)數(shù)乘法） a，b，c，d0,p-190904.2 模p平方根例：設(shè)由定理4可知，7是模53的二次剩余，求7模53的平方根。當(dāng)省略模53符號(hào)時(shí)，計(jì)算過(guò)程如下：91914.2 模p平方根注：上例中，，由定理4知，是模53的非二次剩余。同樣可知亦是模53的非二次剩余。92924.2 模p平方

40、根若計(jì)算知當(dāng) 時(shí)，已知和中有一個(gè)是模p的二次剩余，而另一個(gè)不是二次剩余，會(huì)怎樣呢？例如，假定兩等式相加得：兩式相減得： 93934.2 模p平方根例：通過(guò)計(jì)算可知為了獲得7的一個(gè)平方根，需要找唯一的一個(gè)整數(shù)y使得，。這可使用一個(gè)Euclid算法解決算法設(shè)x是模p的二次剩余，p是素?cái)?shù)且94944.2 模p平方根rootLV(x, p, y, success)/計(jì)算ya uniform(1.p-1);/我們并不知道a應(yīng)取多少if then /可能性很小 success true； y a；else 計(jì)算c，d使得 if d=0 then success false；/無(wú)法求出 else

41、/c=0 success true；計(jì)算y使算法成功的概率0.5,接近0.5。故平均調(diào)用兩次即可求得x的平方根95954.3 整數(shù)的因數(shù)分解設(shè)n是一個(gè)大于1的整數(shù)，因數(shù)分解問題是找到n的一個(gè)唯一分解：這里是正整數(shù)，且均為素?cái)?shù)。若n是合數(shù)，則至少有1個(gè)非平凡的因數(shù)(不是1和n本身).設(shè)n是一個(gè)合數(shù)，n的因數(shù)分解問題，即找n的非平凡因數(shù)，它由兩部分構(gòu)成：prime(n) 判定n是否為素?cái)?shù)，可由Monte Carlo算法確定。split(n)當(dāng)n為合數(shù)時(shí)，找n的一個(gè)非平凡的因數(shù)。96964.3 整數(shù)的因數(shù)分解樸素的split算法split(n) /n是素?cái)?shù),返回1，否則返回找到的n的最

42、小非平凡因數(shù)for i2 to do if (n mod i)=0 then return i; /i2 return 1; /返回平凡因數(shù)97974.3 整數(shù)的因數(shù)分解性能分析：最壞情況。當(dāng)n是一個(gè)中等規(guī)模的整數(shù)（如大約50位十進(jìn)制整數(shù)）時(shí)，最壞情況的計(jì)算時(shí)間亦不可接受。n的位數(shù) ，當(dāng)m=50時(shí)，上述算法的時(shí)間約為無(wú)論是確定性的還是概率的，沒有算法能夠在多項(xiàng)式時(shí)間O(p(m)內(nèi)分解n。Dixon的概率算法分解n的時(shí)間為Note：無(wú)論k和b是何正常數(shù)，均有：98984.3 整數(shù)的因數(shù)分解合數(shù)的二次剩余（模素?cái)?shù)到模合數(shù)的推廣）設(shè)n是任一正整數(shù)，整數(shù)x1,n-1。若x和n互素，且存在一整數(shù)y1,

43、n-1 使xy2(modn)，則稱x為模n的二次剩余，稱y為x模n的平方根。一個(gè)模p的二次剩余，當(dāng)p為素?cái)?shù)時(shí)，恰有兩個(gè)不同的平方根，但p為合數(shù)，且至少有兩個(gè)奇素?cái)?shù)因子時(shí)，不再為真。例： ,注意29應(yīng)與35互素，才有可能是模35的二次剩余。定理：若n=pq，p、q是兩個(gè)互不相同的素?cái)?shù)，則每一個(gè)模n的二次剩余恰有4個(gè)平方根。99994.3 整數(shù)的因數(shù)分解上節(jié)的測(cè)試x是否是模p的二次剩余及找x的平方根的方法是一個(gè)有效的算法（指rootLV），當(dāng)n是一個(gè)合數(shù)，且n的因子分解給定時(shí)，同樣存在有效的算法。但n的因數(shù)分解未給定時(shí)，目前還沒有有效算法測(cè)試x是否為二次剩余及找x的平方根。Dixon因數(shù)分解算法

44、基本思想，找兩個(gè)與n互素的整數(shù)a和b，使但蘊(yùn)含著即假定，則n的某一非平凡因子x滿足： . n和a+b的最大公因子是n的一個(gè)非平凡因子。例如： 1001004.3 整數(shù)的因數(shù)分解Dixon (n, x, success)/找合數(shù)n的某一非平凡因子x if n是偶數(shù) then x2；success true； else for i 2 to do if 是整數(shù) then x ;success true;return; /n是合數(shù)且為奇數(shù)，現(xiàn)在知道它至少有2個(gè)不同的奇素?cái)?shù)因子 a，b 兩個(gè)使得的整數(shù)if then success false；elsex gcd (a+b,n); su

45、ccess true; 1011014.3 整數(shù)的因數(shù)分解如何確定a和b使，來(lái)對(duì)n因數(shù)分解。Def. k-平滑：若一個(gè)整數(shù)x的所有素因子均在前k個(gè)素?cái)?shù)之中，則x稱為k-平滑的。例如：是3-平滑的 35=57不是3-平滑的， 7是第四個(gè)素?cái)?shù)它是4-平滑的，也是5-平滑的當(dāng)k較小時(shí)，k-平滑的整數(shù)可用樸素的split算法進(jìn)行有效的因數(shù)分解。Dixon算法可以分為3步確定a和b。1021024.3 整數(shù)的因數(shù)分解Step1：在1n-1之間隨機(jī)選擇xi)若x碰巧不與n互素，則已找到n的一個(gè)非平凡因子(即為x)ii)否則設(shè) ，若y是k-平滑，則將x和y的因數(shù)分解保存在表里。此過(guò)程重復(fù)直至選擇了k+

46、1個(gè)互不相同的整數(shù)，并且這些整數(shù)的平方模n的因數(shù)已分解(當(dāng)k較小時(shí)，用split(n)分解）例1：設(shè)n=2537，k=7.前7個(gè)整數(shù)為：2，3，5，7，11，13，17若隨機(jī)選取x=1769，1240不是7-平滑的1031034.3 整數(shù)的因數(shù)分解下述8個(gè)x的平方模n是7-平滑的：1041044.3 整數(shù)的因數(shù)分解Step2：在k+1個(gè)等式之中找一個(gè)非空子集，使相應(yīng)的因數(shù)分解的積中前k個(gè)素?cái)?shù)的指數(shù)均為偶數(shù)(包含0)例2：在上例的8個(gè)等式中，有7個(gè)積符合要求：可以證明，在k+1個(gè)等式中，至少存在這樣一個(gè)解，如何找到一個(gè)解？構(gòu)造一個(gè)0-1矩陣A：(k+1) k矩陣的行對(duì)應(yīng)k+1個(gè)yi，列對(duì)應(yīng)前k個(gè)

47、素?cái)?shù)。1051054.3 整數(shù)的因數(shù)分解矩陣的行數(shù)大于列數(shù)。在模2意義下，矩陣的行之間不可能均是相互獨(dú)立的。例如在例2中，第一個(gè)解就是線性相關(guān)的：使用Gauss-Jordan消去法可找到線性相關(guān)的行。Step3：在step2中找到線性相關(guān)的行后：1）令a為相應(yīng)xi的乘積2）令b是yi的乘積開平方若，則只需求a+b和n的最大公因子即可獲得n的非平凡因子。1061064.3 整數(shù)的因數(shù)分解例3：對(duì)于例2中的第1個(gè)解有： a+b=3139和n=2537的最大公因子是43，它是n的一個(gè)非平凡因子，對(duì)于例2中的第2個(gè)解有：此解不能求因子。實(shí)際上的概率至少為1/21071074.3 整數(shù)的因數(shù)分解

48、5.時(shí)間分析如何選擇k.1)k越大，是k-平滑的可能性越大(x是隨機(jī)選取的)2)k越小，測(cè)試k-平滑及因數(shù)分解yi的時(shí)間越小，確定yi 是否線性相關(guān)的時(shí)間也越少，但不是k-平滑的概率也就較大。設(shè)通常取時(shí)較好，此時(shí)Dixon算法分裂n的期望時(shí)間為，成功的概率至少為1/2.108108Ch.5 Monte Carlo算法存在某些問題，無(wú)論是確定的還是概率的，均找不到有效的算法獲得正確的答案。Monte Carlo算法偶然會(huì)犯錯(cuò)，但它無(wú)論對(duì)何實(shí)例均能以高概率找到正確解。當(dāng)算法出錯(cuò)時(shí)，沒有警告信息?；靖拍頓ef1：設(shè)p是一個(gè)實(shí)數(shù)，且1/2p1，若一個(gè)MC算法以不小于p的概率返回一個(gè)正確的解，

49、則該MC算法稱為p-正確，算法的優(yōu)勢(shì)（advantage）是 p-1/2.Def2：若一個(gè)MC算法對(duì)同一實(shí)例決不給出兩個(gè)不同的正確解，則該算法稱是相容的（consistent）或一致的。109109 Ch.5 Monte Carlo算法某些MC算法的參數(shù)不僅包括被解的實(shí)例，還包括錯(cuò)誤概率的上界。因此，這樣算法的時(shí)間被表示為實(shí)例大小及相關(guān)可接受的錯(cuò)誤概率的函數(shù)。基本思想：為了增加一個(gè)一致的、p-正確算法成功的概率，只需多次調(diào)用同一算法，然后選擇出現(xiàn)次數(shù)最多的解。例：設(shè)MC(x)是一個(gè)一致、75%-correct的MC算法，考慮下述算法：MC3(x) tMC(x); uMC(x); vMC(x);

50、 if t=u or t=v then return t; else return v;110110Ch.5 Monte Carlo算法該算法是一致的和27/32-correct的(約84%)pf:相容性（一致性）易證。 t、u、v正確的概率為75%=3/4=p 錯(cuò)誤的概率為q=1/4.1)若t、u、v均正確， MC是一致的 t=u=v，則MC3返回的t正確，此概率為：(3/4)32)若t、u、v恰有兩個(gè)正確則MC3返回此概率為： 3)若t、u、v恰有一個(gè)正確，則只有v正確時(shí)，MC3返回正確答案，此概率為：111111Ch.5 Monte Carlo算法嚴(yán)格的說(shuō)，當(dāng)v正確，只有兩個(gè)錯(cuò)誤的解t

51、和u不相等時(shí)，才有可能成功，因此MC3成功的概率為：多運(yùn)行2次（共3次）使成功率Theorem：設(shè)2個(gè)正實(shí)數(shù)之和+0是多小，均可通過(guò)反復(fù)調(diào)用來(lái)擴(kuò)大其優(yōu)勢(shì)，使得最終的算法具有可接受的錯(cuò)誤概率，可達(dá)到任意?。ㄟx定的）。pf：設(shè) 是調(diào)用MC(x)的次數(shù)，當(dāng)重復(fù)調(diào)用MC(x)算法n次時(shí)，若正確解至少出現(xiàn)m次，則新算法返回頻度最高的解必為正確解；若正確解出現(xiàn)的次數(shù)不超過(guò)n/2時(shí)，不能保證新算法找到了正確解。因此，出錯(cuò)概率至多為：113113Ch.5 Monte Carlo算法由此可知，重復(fù)MC(x) n次成功的概率至少為1-。114114Ch.5 Monte Carlo算法例：假定有一個(gè)一致的5%贏

52、面的MC算法，若希望獲得一個(gè)錯(cuò)誤概率小于5%的算法，則相當(dāng)于將55%-correct的算法改造成95%-correct的算法。上述定理告訴我們：大約要調(diào)用MC算法600次才能達(dá)到相應(yīng)的精度（在同一實(shí)例上，）上述證明太過(guò)粗略，更精確的證明表示：如果重復(fù)調(diào)用一個(gè)一致的，(1/2+)-correct的MC算法2m-1次，則可得到一個(gè)(1-)-correct的最終算法，其中：115115Ch.5 Monte Carlo算法2.有偏算法重復(fù)一個(gè)算法幾百次來(lái)獲得較小的出錯(cuò)概率是沒有吸引力的，幸運(yùn)地，大多數(shù)MC算法實(shí)際上隨著重復(fù)次數(shù)的增加，正確概率增長(zhǎng)會(huì)更快。Def：(偏真算法)為簡(jiǎn)單起見，設(shè)MC(x)是

53、解某個(gè)判定問題，對(duì)任何x，若當(dāng)MC(x)返回true時(shí)解總是正確的，僅當(dāng)它返回false時(shí)才有可能產(chǎn)生錯(cuò)誤的解，則稱此算法為偏真的(true-biased)。顯然，在偏真的MC算法里，沒有必要返回頻數(shù)最高的解，因?yàn)橐淮蝨rue超過(guò)任何次數(shù)的false.對(duì)于偏真的MC算法，重復(fù)調(diào)用4次，就可將55%-正確的算法改進(jìn)到95%正確。6次重復(fù)就可得到99%正確的算法，且對(duì)p1/2的要求可以放寬到p0即可。116116Ch.5 Monte Carlo算法Def：(偏y0算法)更一般的情況不再限定是判定問題，一個(gè)MC是偏y0的(y0是某個(gè)特定解)，如果存在問題實(shí)例的子集X使得：若被解實(shí)例，則算法MC(x

54、)返回的解總是正確的(無(wú)論返回y0還是非y0)若，正確解是y0 ，但MC并非對(duì)所有這樣的實(shí)例x都返回正確解。雖然y0是必須知道的，但無(wú)需測(cè)試x是否是X的成員，下面解釋若算法返回y0時(shí)，它總是正確的。即算法返回y0時(shí)總是正確的，返回非y0時(shí)以p為概率正確。117117Ch.5 Monte Carlo算法設(shè)MC是一個(gè)一致的、p-correct和偏y0的蒙特卡洛算法，x是一個(gè)實(shí)例，y是MC(x)返回的解，可分為如下2種情形討論：case1：若，則算法MC總是返回正確解，因此y0確實(shí)是正確的。若，算法返回的正確解必定是y0這兩種情況均可得到結(jié)論： y0是一個(gè)正確解。case2：若，則y是正確

55、解。若，因?yàn)檎_解是y0 ，故y是錯(cuò)誤解，此出錯(cuò)概率不超過(guò)1-p。118118Ch.5 Monte Carlo算法有偏算法重復(fù)調(diào)用MC：優(yōu)先返回y0 若k次調(diào)用MC(x)所返回解依次是，則： (1) 若存在i使，則前面的討論已知，它是一個(gè)正確解(yi是正確解).(2) 若存在使，由于MC是一致的，故必有。因此正確解仍是y0 。(3) 若對(duì)所有的i均有，但，則y0仍有可能是正確解。實(shí)際上，若，則y0是正確解，此時(shí)y是錯(cuò)誤的，其錯(cuò)誤概率不超過(guò)(1-p)k。由上面的討論可知，重復(fù)調(diào)用一個(gè)一致的，p-正確的，偏y0的MC算法k次，可得到一個(gè)(1-(1-p)k)-正確的算法(對(duì)偏真算法

56、亦適合). 例：p=0.55，k=4，即可將算法正確率提高到95%1191195.1 主元素問題Def：設(shè)T1.n是n個(gè)元素的數(shù)組，若T中等于x的元素個(gè)數(shù)大于n/2(即 )，則稱x是數(shù)組T的主元素。 (Note：若存在，則只可能有1個(gè)主元素)判T是否有主元素maj(T) /測(cè)試隨機(jī)元素是否為T的主元素 iuniform(1.n); xT i ; k0; for j1 to n do if T j =x then kk+1; return (kn/2);1201205.1 主元素問題若算法返回true，則T含有主元素，所選擇的元素即為主元素，算法一定正確。若算法返回false，則T仍有可能含有

57、主元素，只是所選元素x不是T的主元素而已。若T確實(shí)包含一個(gè)主元素，則隨機(jī)選擇到一個(gè)非主元的概率小于1/2，這是因?yàn)橹髟卣糡的一半以上。算法是一個(gè)偏真的1/2正確的算法：若maj返回true，則T必有主元素，解一定正確。因?yàn)殡S機(jī)選中主元素的概率大于1/2，故該算法是1/2-correct.若maj返回false，則T可能沒有主元素。當(dāng)然，若T沒有主元素，則必返回false。1211215.1 主元素問題實(shí)際使用時(shí)，50%的錯(cuò)誤概率是不可容忍的。而對(duì)有偏算法，可以通過(guò)重復(fù)調(diào)用技術(shù)來(lái)使錯(cuò)誤概率降低到任何值。maj2(T) if maj (T) then return true; /1次成功 els

58、e /1次失敗后調(diào)用第2次 return maj(T); /調(diào)用2次 1221225.1 主元素問題分析： 1) 若T無(wú)主元素，則maj每次均返回false，maj2亦肯定返回false。此時(shí)算法返回值正確（成功）。 2) 若T有主元素，則：第一次調(diào)用maj返回真的概率是p1/2，此時(shí)maj2亦返回真。第一次調(diào)用maj返回fasle的概率為1-p，第2次調(diào)用maj仍以概率p返回true，maj2亦返回真，其概率為:(1-p)p.此時(shí)算法返回值正確（成功）。總結(jié)：當(dāng)T有主元時(shí)，maj返回真的概率是： p+(1-p)p =1-(1-p)23/4.即：maj2是一個(gè)偏真的3/4正確的MC算法。123

59、1235.1 主元素問題3.算法改進(jìn)錯(cuò)誤的概率能夠迅速減小，主要是因?yàn)橹貜?fù)調(diào)用maj的結(jié)果是相互獨(dú)立的，即：對(duì)同一實(shí)例T，某次maj返回fasle，并不會(huì)影響繼續(xù)調(diào)用返回true的概率。因此，當(dāng)T含有主元素時(shí)，k次重復(fù)調(diào)用maj均返回false的概率小于2-k。另一方面，在k次調(diào)用中，只要有一次maj返回真，即可判定T有主元素。1241245.1 主元素問題當(dāng)需要控制算法出錯(cuò)概率小于0時(shí)，相應(yīng)算法調(diào)用maj的次數(shù)為：majMC (T, ) k for i 1 to k do if maj (T) then return true; /成功 return false; /可能失敗該算法的時(shí)間為O

60、(nlg(1/)。注意，這里只是用此問題來(lái)說(shuō)明MC算法，實(shí)際上對(duì)于判定主元素問題存在O(n)的確定性算法。1251255.2 素?cái)?shù)測(cè)定(數(shù)的素性測(cè)定)判定一個(gè)給定的整數(shù)是否為素?cái)?shù)，到目前為止尚未找到有效的確定性算法或Las Vegas算法。簡(jiǎn)單的概率算法。prime(n) d uniform(2. );return 若返回false，則算法幸運(yùn)地找到了n的一個(gè)非平凡因子，n為合數(shù)。若返回true，則未必是素?cái)?shù)。實(shí)際上，若n是合數(shù)，prime 亦以高概率返回true。1261265.2 素?cái)?shù)測(cè)定(數(shù)的素性測(cè)定)例如：prime在251內(nèi)隨機(jī)選一整數(shù)d 成功：d=43，算法返回false(概率為2

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

概率算法新-精品教育課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

概率算法新-精品教育課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔