版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
(優(yōu)選)算法設計與分析課件目前一頁\總數九十八頁\編于十六點寫在講課前一、什么是算法算法就是計算的方法。數·學數:1,2,3,4,…學:偶數、質數、微積分…之數的學問算·法算:加、減、乘、除法:何時、何處用何計算之算的方法目前二頁\總數九十八頁\編于十六點寫在講課前(續(xù))舉個例子:排序問題描述:將一組數按從小到大的順序整理有序基本思想:小的數往前排,大的數往后排怎么排?算法冒泡排序選擇排序歸并排序快速排序堆排序Shell排序…每種算法都是一組特定的規(guī)則,規(guī)定了一種處理數據的運算方法目前三頁\總數九十八頁\編于十六點問題:既然每種方法都可以實現排序之目的,何必費心研究這么多排序算法?其一:就像玩智力游戲,人們樂衷于尋找不同的方法解決各種各樣的問題。其二:研究的需要,算法和算法間是有區(qū)別的,我們有必要去研究,去分析。性質不同:穩(wěn)定、不穩(wěn)定性能不同:速度、空間適用場合不同其三,應用的需求,問題有千百萬種,沒有萬能的算法適合所有的應用。需要我們找出算法的設計規(guī)律,并設計出解決問題的新算法怎么選擇:根據性能、結合需求、綜合選擇
如何了解每種算法的性能?算法的分析目前四頁\總數九十八頁\編于十六點二、算法分析了解算法的性能:算法速度:快還是慢?如何衡量?怎么比較?空間使用量(計算機算法*):大還是???如何衡量?怎么比較?其它方面的性質等。目前五頁\總數九十八頁\編于十六點實例分析:排序算法的理論分析:(略)編程序測試1.冒泡排序真的很慢嗎?
數據集元素個數:10、20、1000、10000…2.快速和歸并排序都是O(nlogn)的時間復雜度,到底誰更快一點呢?原因是什么?3.冒泡排序會不會比快速排序快?來自于實測的結論:可能。目前六頁\總數九十八頁\編于十六點三、為什么要學習算法1.編程序的需要
任何程序都需要算法。thecoreofcomputerscience
程序=數據結構+算法2.改造世界的需要
世界上還有很多很多的問題等待你解決,有無數的程序等待你去編。3.國家綜合實力的體現(大)從軟實力的角度,算法是國家科技生產力的核心。是國家綜合實力的體現。目前七頁\總數九十八頁\編于十六點四、頭疼的事:算法太多了,學不過來
是的,千萬的問題、萬千的算法。都學過來是不可能的。甚至專一門已經很了不起。學習算法設計與分析的策略、技術和方法,把握解決問題的規(guī)律,為設計更復雜、更有效的算法奠定基礎。需要同學們不斷學習,深入思考,創(chuàng)新設計。目前八頁\總數九十八頁\編于十六點五、算法的學習過程:痛苦并快樂著1.枯燥的過程繁&煩:學習一個算法如同做一道數學題,多了呢?ACMICPC的訓練過程:樂于其中2.智慧的積累方法的掌握、技術的升華3.理論的貢獻算法成就或在于理論的貢獻,而不僅僅是技術的提高。如何成就好算法:好思想+好技術目前九頁\總數九十八頁\編于十六點六、好算法從理論的角度說,好算法應該有較低的時間復雜度(高速)和空間復雜度(低耗),但好的算法還要依靠好的算法實現,需要理論與技術、技巧的結合才能最終實現好的算法。從應用的角度說,能有效地解決問題的算法都是好算法——不管黑貓白貓,抓住老鼠就是好貓;不管A算法、B算法,能解決問題就是好算法(實用了點)。目前十頁\總數九十八頁\編于十六點概述課程核心:
介紹算法設計與分析的基本理論、方法和技術,奠定算法設計的基礎。教學目的:在理論學習上,掌握算法分析與設計的基本理論和方法,培養(yǎng)設計新算法和分析算法復雜性的能力。在實踐教學上,掌握算法實現的技術、技巧,學習算法的正確性驗證、效率分析、優(yōu)化技術,以及算法在實際問題中的應用。培養(yǎng)獨立研究和創(chuàng)新能力。目前十一頁\總數九十八頁\編于十六點課程內容:基本概念:算法的定義、性質、
分析算法的基本方法等分治策略(Divideandconquer)貪心方法(Greedymethod)動態(tài)規(guī)劃(DynamicProgramming)圖算法(GraphAlgorithms)回溯與分枝限界……專題綜合實踐目前十二頁\總數九十八頁\編于十六點本課程需要的基礎數據結構程序設計語言(C/C++):結構化設計數學基礎
操作系統、編譯
目前十三頁\總數九十八頁\編于十六點授課形式:課堂教學:(√)課堂討論:專題、解題報告上機實踐:需要提交實驗報告目前十四頁\總數九十八頁\編于十六點考核方式:考試:(√)綜合成績=卷面成績*80%+平時成績*20%平時成績=作業(yè)+上機實驗+考勤目前十五頁\總數九十八頁\編于十六點主要參考書計算機算法基礎,
余祥宣等編著,
華中科技大學出版社Introductiontoalgorithms,ThomasH.Cormen,etc.,thirdedition,TheMITPress.AlgorithmDesign,MichaelT.Goodrich算法設計與分析,王曉東,清華大學出版社目前十六頁\總數九十八頁\編于十六點其它參考書TheArtofComputerProgramming,DonaldE.Knuth.Volume1-3,SecondEdition.DataStructures,Algorithms,andApplicationsinC++(Part3)SartajSahni,ChinaMachinePressetc.目前十七頁\總數九十八頁\編于十六點一、算法基礎參考資料:《計算機算法基礎》
第二章
《Introductiontoalgorithms》Chapter1、Chapter3目前十八頁\總數九十八頁\編于十六點1.1算法的定義及特性1.什么是算法?如數字、計算一樣,算法是一個基本概念。算法是解一確定類問題的任意一種特殊的方法。在計算機科學中,算法是使用計算機解一類問題的精確、有效方法的代名詞;
算法是一組有窮的規(guī)則,它規(guī)定了解決某一特定類型問題的一系列運算。目前十九頁\總數九十八頁\編于十六點對算法概念的理解算法由運算組成算術運算、邏輯運算、賦值運算、過程調用算法有其特殊性解決不同問題的算法是不相同的,有沒有一個萬能的算法?算法是有窮的計算過程靜態(tài)上:規(guī)則/運算/語句的數量有窮動態(tài)上:計算過程/計算時間有限目前二十頁\總數九十八頁\編于十六點我們已經接觸過的算法:分類(排序)算法:將已知的n個元素按照關鍵值大小的非增/非降順序重新排列。如:冒泡排序、插入排序、歸并排序查找算法:從已知的元素集合中找出滿足要求的一個或一組元素。如:順序查找、二分查找、第k小元素圖算法:在已知的圖中找出滿足某些性質的結點或邊。如:最短路徑算法、最小成本生成樹目前二十一頁\總數九十八頁\編于十六點思考:我們學會了解決一個個具體問題的算法,那么在這些算法的設計中有沒有一些共性的東西?有沒有可以總結出來的規(guī)律、規(guī)則和方法?這些規(guī)律、規(guī)則和方法對于其它算法的設計有沒有指導意義?能不能找到一些算法設計的一般策略、技術和方法?目前二十二頁\總數九十八頁\編于十六點算法:求解問題的一組規(guī)則檢索問題分治策略排序問題貪心策略路徑問題規(guī)則的設計設計策略動態(tài)規(guī)劃最優(yōu)化問題檢索遍歷問題回溯…分枝限界….發(fā)現指導形成算法產生算法設計的指導思想和基本規(guī)律目前二十三頁\總數九十八頁\編于十六點較高的算法設計能力不僅在于簡單地使用一些具體的算法,更在于對算法設計方法的掌握上。只有深入理解算法設計的策略、技術和方法,才能在面對新問題時創(chuàng)造出新的算法。算法學習要做到:深入理解算法設計的一般規(guī)律、技術和方法靈活運用現有的算法解決實際問題在改造客觀世界的過程中,運用學到的知識創(chuàng)造新的算法,解決新的問題目前二十四頁\總數九十八頁\編于十六點2.算法的五個重要特性確定性、能行性、輸入、輸出、有窮性1)確定性:算法使用的每種運算必須要有確切的定義,不能有二義性。例:不符合確定性的運算5/0將6或7與x相加未賦值變量參與運算目前二十五頁\總數九十八頁\編于十六點2)能行性算法中有待實現的運算都是基本的運算,原理上每種運算都能由人用紙和筆在“有限”的時間內完成。例:整數的算術運算是“能行”的實數的算術運算可能是“不能行”的目前二十六頁\總數九十八頁\編于十六點如何認識算法的確定性和能行性?確定性和能行性是算法設計過程可能存在的問題。一個實際的程序設計語言定義了該語言中可以使用的數據類型和能夠參與的運算,編譯器可以對程序中的非法運算檢錯。非確定、非能行的“臆造”運算是不能存在的,程序的正確性主要在于邏輯正確。但算法本身的正確性不僅在于此。目前二十七頁\總數九十八頁\編于十六點3)輸入每個算法都有0個或多個輸入。這些輸入是在算法開始之前給出的量,取自于特定的對象集合——定義域4)輸出一個算法產生一個或多個輸出,這些輸出是同輸入有某種特定關系的量。目前二十八頁\總數九十八頁\編于十六點算法的狀態(tài)轉換算法:把特定的輸入轉換成需要的輸出。算法輸入輸出狀態(tài):算法/程序中一組變量的當前值稱為算
法/程序的當前狀態(tài)。算法:狀態(tài)轉換器,算法把輸入時的初始狀態(tài)
轉換為輸出時的終止狀態(tài)目前二十九頁\總數九十八頁\編于十六點5)有窮性一個算法總是在執(zhí)行了有窮步的運算之后終止。計算過程:滿足確定性、能行性、輸入、輸出,但不一定滿足有窮性的一組規(guī)則。算法和計算過程的關系:計算過程:操作系統(不終止的運行過程)
算法是“可以終止的計算過程”目前三十頁\總數九十八頁\編于十六點時效性:實際問題往往都有時間要求。例:國際象棋(啟發(fā))數值天氣預報
只有在要求的時間內解決問題才是有意義的。目前三十一頁\總數九十八頁\編于十六點
針對算法的時效性,只有把在相當有窮步內終止的算法投入到計算機上運行才是實際可行的。何為“相當有窮”?
——通過算法分析,了解算法速度,給出算法計算時間的一個精確的描述,以衡量算法的執(zhí)行速度,選擇合適的算法解決問題。
注:算法分析還包括空間分析。目前三十二頁\總數九十八頁\編于十六點與算法學習相關的內容五個方面:設計、表示、證明、分析、測試1)設計:構思算法的處理規(guī)則,創(chuàng)造性的活動。2)表示:用語言把算法描述出來。類計算機語言、偽代碼
(SPARKS語言、類C語言)、流程圖、自然語言等3)證明:證明算法的正確性。正確性:對合法輸入能得出正確的答案。
算法證明:證明算法的正確性,與語言無關程序證明:證明程序的正確性(理論證明,程序邏輯)
目前三十三頁\總數九十八頁\編于十六點一個例子:插入分類輸入:n個元素存放在數組A中:A[1]~A[n],無序輸出:按照從小到大的順序重新整理的有序數組A插入分類算法的設計思想:1.將第一個元素(A[1])看作只有一個元素的有序子序列;2.置循環(huán)i=2ton,將A[i]插入到由A[1]~A[i-1]元素組成的有序子序列中。思考問題:上述設計思路對嗎?如何實現?
目前三十四頁\總數九十八頁\編于十六點SPARKS語言算法描述:
procedureINSERTIONSORT(A,n)A(0)←-∞//A[0]做監(jiān)視哨fori←2tondo//從第二個元素開始循環(huán)item←A(i);//將A[i]放到臨時變量item中
j←i-1//從后往前查找當前元素的插入位置whileitem<A(j)doA(j+1)←A(j);//比item大的元素往后移一位
j←j-1;//繼續(xù)往前查找repeatA(j+1)←item;//將item插入到正確的位置上repeatendINSERTIONSORT
目前三十五頁\總數九十八頁\編于十六點算法導論算法描述:INSERTIONSORT(A,n)A[0]←-∞▽A[0]做監(jiān)視哨fori←2ton▽從第二個元素開始循環(huán)doitem←A[i]▽將A[i]放到臨時變量item中
j←i-1▽從后往前查找當前元素的插入位置whileitem<A[j]doA[j+1]←A[j]▽比item大的元素往后移一位
j←j-1;▽繼續(xù)往前查找A(j+1)←item;▽將item插入到正確的位置上
目前三十六頁\總數九十八頁\編于十六點基于上述算法,思考:這個算法描述正確嗎?
能行、確定、輸入、輸出、有窮?
正確性證明運算得快嗎?時間復雜度分析使用了多少內存?空間復雜度分析進一步我們需要回答:它能夠應用到那些領域?要做深入進一步分析利用不同語言實現需要那些技巧?實現目前三十七頁\總數九十八頁\編于十六點4)分析:對算法的時、空特性做定性、定量分析,以了解算法的性質。5)測試:將算法變成程序,放到計算機上運行,觀察運行情況編程中的調試:排錯過程?!罢{試只能指出有錯誤,而不能指出它們不存在錯誤”——Dijkstra的名言運行中的測試:分析過程。作時空分布圖,驗證分析結論,進一步優(yōu)化算法的設計。本課程集中于學習算法的設計與分析。通過學習,掌握計算機算法設計和分析基本策略與方法,為設計更復雜、更有效的算法奠定基礎目前三十八頁\總數九十八頁\編于十六點1.分析算法的目的?算法選擇的需要:對同一個問題可以設計不同的算法,不同算法的時間和空間特性是不同的
?算法優(yōu)化的需要:有沒有可以改進的地方,以使算法工作得更好?分析算法的目的在于:通過對算法的分析了解算法的性能,1)可以在解決同一問題的不同算法之間比較性能的好壞,從而運行好的算法,改進差的算法,避免無益的人力和物力浪費。2)可以對算法的性質作深入了解,從而可以進一步優(yōu)化算法,讓其更好地工作。1.2分析算法基礎目前三十九頁\總數九十八頁\編于十六點2.重要的假設和約定1)計算機模型的假設計算機形式理論模型:有限狀態(tài)自動機、Turing機通用的順序計算機模型:單CPU——串行算法有足夠的“內存”,并能在固定的時間內存取數據單元
RAM——random-accessmachine區(qū)分計算機的理論模型與實際的計算機目前四十頁\總數九十八頁\編于十六點2)計算的約定算法的執(zhí)行時間是算法中所有運算執(zhí)行時間的總和,可以表示為:
算法的執(zhí)行時間=
其中,
fi:是運算i的執(zhí)行次數,稱為該運算的頻率計數
——僅與算法的控制流程有關,與實際使用的計算機硬件和編制程序的語言無關。
ti
:是運算i在實際的計算機上每執(zhí)行一次所用的時間
——與程序設計語言和計算機硬件有關。如何確定算法使用了哪些運算,每種運算的fi和ti又是多少?目前四十一頁\總數九十八頁\編于十六點運算的分類依照運算的時間特性,將運算分為時間囿界于常數的運算和時間非囿界于常數的運算。
囿界的含義:限于......
時間囿界于常數的運算:
·基本算術運算,如整數、浮點數的加、減、乘、除
·字符運算、賦值運算、過程調用等特點:執(zhí)行時間是固定量,與具體的操作數無關。
例:1+1=2vs10000+10000=20000100*100=10000vs10000*10000=100000000CALLINSERTIONSORT目前四十二頁\總數九十八頁\編于十六點更一般的情況設有n種運算c1,c2,…,cn,它們的執(zhí)行時間分別是t1,t2,…,tn。令t0=max(t1,t2,…,tn),則每種運算執(zhí)行一次的時間都可以用t0進行限界(上界)。視t0為一個單位時間,則這些運算“理論”上都可視為僅花一個固定的單位時間t0即可完成的運算——稱具有這種性質的運算為時間囿界于常數的運算。目前四十三頁\總數九十八頁\編于十六點運算的分類(續(xù))
時間非囿界于常數的運算:字符串操作:與字符串中字符的數量成正比例:字符串的比較運算(strcmp)記錄操作:與記錄的屬性數、屬性類型等有關特點:運算時間與操作數相關,每次執(zhí)行的時間是一個不定的量。
目前四十四頁\總數九十八頁\編于十六點怎么分析時間非囿界于常數的運算?這類運算通常是由更基本的運算組成的。而這些基本運算是時間囿界于常數的運算。如:字符串的比較運算是由一組字符比較運算組成的。非囿界于常數的運算的一次執(zhí)行時間是其包含的所有基本運算的執(zhí)行時間之和:如:字符串比較時間tstring
=Length(String)*tchar故:分析時間非囿界于常數的運算時,只需將其分解成若干時間囿界于常數的運算即可。目前四十五頁\總數九十八頁\編于十六點3)工作數據集的選擇算法的執(zhí)行情況與輸入數據的特征有關,體現在:
·算法的執(zhí)行時間與輸入數據的規(guī)模相關,一般
規(guī)模越大,執(zhí)行時間越長。
·在不同的數據配置上,同一算法有不同的執(zhí)行
情況,可分為最好、最壞和平均等情況討論。編制不同的數據配置,分析算法的最好、最壞、平均工作情況是算法分析的一項重要工作。如插入排序有最好O(n)、最壞O(n2)的工作情況。目前四十六頁\總數九十八頁\編于十六點注:編制測試數據對算法分析與程序調試都是關鍵的,但目的不同。算法分析數據集:反映算法的典型執(zhí)行情況(最好、最壞、平均);調試程序數據集:排錯。力求走到程序的每個分支,驗證各種情況下程序執(zhí)行正確與否。目前四十七頁\總數九十八頁\編于十六點3.如何進行算法分析?對算法的全面分析將分兩個階段進行:事前分析和事后測試(理論分析和程序測試)。事前分析:求算法時間/空間復雜度的限界函數。限界函數通常是關于問題規(guī)模n的特征函數,被表示成Ο、Ω或Θ的形式。如歸并排序的O(nlogn)。特征函數是通過分析算法的控制邏輯得來的,是對算法所用運算執(zhí)行次數的統計結果。與使用的程序設計語言和計算機硬件無關。目前四十八頁\總數九十八頁\編于十六點事后測試:將算法編制成程序,放到實際的計算機上運行,收集程序的執(zhí)行時間和空間占用情況等統計數據,然后進行分析判斷。事后測試與物理實現直接有關。
算法分析主要集中于與物理實現無關的事前分析階段——獲取算法的理論時間/空間復雜度。目前四十九頁\總數九十八頁\編于十六點1)事前分析目標:獲取算法的時間(空間)復雜度函數,從理論上分析算法性能的好壞。可以分為時間、空間兩個方面:時間分析:了解算法中使用了哪些運算(主要是具有單位執(zhí)行時間的基本運算)。分析程序的控制流程,從而確定各類運算的執(zhí)行次數。將對運算執(zhí)行次數的統計分析結果表示成關于問題規(guī)模n的特征函數。算法性能有最好、平均、最壞等情況,與數據配置有關。分析典型的數據配置,了解算法在各種情況下的執(zhí)行情況。目前五十頁\總數九十八頁\編于十六點空間分析:分析算法中各類變量的定義情況和使用情況將空間占用量表示成為問題規(guī)模n的特征函數??臻g占用有最大、平均、最少等情況,與數據配置有關。分析典型的數據配置,了解算法在各種情況下的空間占用情況。目前五十一頁\總數九十八頁\編于十六點如何進行時間分析?(一)統計算法中各類運算的執(zhí)行次數——頻率計數
★統計對象:運算
1)基本運算:指那些時間囿界于常數的運算
2)復合運算:具有固定執(zhí)行時間的程序塊,如一條語句、一個過程或函數等,它們的一次執(zhí)行時間也可視為常量、單位時間。
★頻率計數:運算的執(zhí)行次數是從算法的控制流程得來的。順序結構中的運算:執(zhí)行次數計為1
嵌套結構中的運算:執(zhí)行次數等于被循環(huán)執(zhí)行的次數
★控制流程分析的關鍵:確定算法中使用的嵌套結構,包括循環(huán)語句、嵌套調用等。目前五十二頁\總數九十八頁\編于十六點
例:執(zhí)行次數的統計
x←x+yfori←1tondofori←1tondox←x+yforj←1tondorepeatx←x+yrepeatrepeat(a)(b)(c)
分析:
(a):x←x+y執(zhí)行了1次
(b):x←x+y執(zhí)行了n次
(c):x←x+y執(zhí)行了n2次fori←1tondoforj←itondox←x+yrepeatrepeat(d)目前五十三頁\總數九十八頁\編于十六點(二)將頻率計數表示成問題規(guī)模n的函數:
如:an2+bn+c★
算法的執(zhí)行時間是算法中各類運算執(zhí)行時間之和,將正比于各類運算的頻率計數之和?!锸虑胺治龅念l率計數結果與所使用的機器及其他環(huán)境因素無關(如程序設計語言、編譯器),只與算法本身的控制流程有關。目前五十四頁\總數九十八頁\編于十六點例:插入分類
procedureINSERTIONSORT(A,n)//將A(1:n)中的元素按非降次序分類,n≥1//執(zhí)行次數單位執(zhí)行時間
A(0)←-∞//設置初始邊界值1t1forj←2tondo//A(1:j-1)已分類//n-1t2item←A(j);n-1t3
i←j-1n-1t4
whileitem<A(i)do//0≤i<j//最多i次,最少1次t5A(i+1)←A(i);最多i-1次,最少0次t6i←i-1;最多i-1次,最少0次t4repeatA(i+1)←item;n-1次t7repeatendINSERTIONSORT目前五十五頁\總數九十八頁\編于十六點
令t0=max(t1,t2,t3,t4,t5,t6,t7),則最壞情況(逆序)最好情況(正序)目前五十六頁\總數九十八頁\編于十六點進一步的分析:主要針對算法最主要的部分進行分析,抓住主要矛盾即可,如插入排序中,可以僅集中于對for/while雙重嵌套循環(huán)的分析,而忽略順序或執(zhí)行次數較低的部分。(三)函數表達式的數量級(階)函數表達式中的最高次項的次數,稱為函數表達式的數量級,是衡量頻率計數的“大小”的一種測度。目前五十七頁\總數九十八頁\編于十六點數量級從本質上反映了算法復雜度的高低數量級越小,算法的復雜度越低,同等規(guī)模下算法執(zhí)行時間越短。反之,數量級越大,算法的復雜度越高,同等規(guī)模下算法執(zhí)行時間越長。例:假如求解同一個問題的三個算法分別具有n,n2
,n3
數量級。若n=10,則可能的執(zhí)行時間將分別是10,100,1000
個單位時間——與環(huán)境因素無關。實例:工資的級別(定性的表示)目前五十八頁\總數九十八頁\編于十六點(四)限界函數
一般用頻率計數函數表達式中的最高次項表示算法復雜性分析的最終結果——限界函數,且忽略掉其系數,記為:g(n)。g(n)通常是關于n的形式簡單的函數式,如:logn,nlogn,n2等。
★
不同算法的g(n)有不同的具體形式。
★
g(n)通常是對算法中最復雜的計算部分分析而來的。
★
g(n)忽略了函數表達式中次數較低的“次要”項,體現了算法復雜性的最本質特征。
★
g(n)通常取單項的形式??臻g特性分析(與時間特性的分析類似,略)目前五十九頁\總數九十八頁\編于十六點2)事后測試把算法編制成程序,在實際的計算機硬件平臺上運行程序,統計執(zhí)行中實際耗費的時間與空間,與事前分析的結論進行比較,驗證先前的分析結論是否正確,并優(yōu)化所設計的算法。分析手段:作時、空性能分布圖目前六十頁\總數九十八頁\編于十六點4.計算時間的漸近表示——Ο、Ω、Θ的定義
算法時間/空間復雜度的限界函數常用的有三個:上界函數、下界函數、“均值”函數。定義如下:記:算法的實際計算時間為f(n),計算時間的限界函數為g(n),其中,n是問題規(guī)模的某種測度。f(n)是與機器及語言有關的量。g(n)是事前分析的結果,是一個形式簡單的函數,與頻率計數有關、而與機器及語言無關。
目前六十一頁\總數九十八頁\編于十六點1)O、Ω、Θ記號定義1.1(上界函數)如果存在兩個正常數c和n0,對于所有的n≥n0,有|f(n)|≤c|g(n)|,則記作f(n)=Ο(g(n))。
含義:如果算法用n值不變的同一類數據(規(guī)模相等,性質相同)在某臺機器上運行,所用的時間總小于|g(n)|的一個常數倍。函數f至多是函數g的c倍,除非n<n0。即是說,當n充分大時,g是f的一個上界函數(在一個非零常數倍的意義下)。這時候也稱f(n)的數量級就是g(n)。目前六十二頁\總數九十八頁\編于十六點
g(n)是通過對算法中運算的使用情況分析而得出的函數表達式,通常情況下,取函數式里的最高次項,舍掉低階項和常數(因為低階項和常數最終被湮滅在高次項里),且忽略系數。如:c=O(1):f(n)等于非零常數,可看作n04n+3=O(n):可取c=5,n0=3100n+6=O(n):可取c=101,n0=66×2n+n2=O(2n):可取c=7,n0=410n2+4n+3=O(n2)3logn+2n+n2=O(n2)nlogn+n2=O(n2)目前六十三頁\總數九十八頁\編于十六點注:1.總是試圖求出數量級最小的g(n)作為f(n)的上界函數,即,
g(n)應該盡量接近函數f(n)。數量級越小,限界越精確。
如
若:3n+2=O(n2)則是松散的界限;
而:3n+2=O(n)就是較緊的界限。2.不要產生錯誤界限。
如,n2+100n+6,當n<3時,n2+100n+6<106n,
由此就認為n2+100n+6=O(n)是錯誤的。
事實上,對任何正的常數c,只要n>c-100就有n2+100n+6>c×n。
提示:注意大系數低次項的影響
同理,3n2+4×2n=O(n)也是錯誤的。目前六十四頁\總數九十八頁\編于十六點3.f(n)=O(g(n))不能寫成g(n)=O(f(n))。f(n)與g(n)并不等價,這里的等號也并不是通常相等的含義。O更精確的定義可以用集合表示:O(g(n))={f(n)|f(n)滿足:存在正的常數c和n0,使得當n≥n0
時,f(n)≤cg(n)}這里O(g(n))是一個集合,f(n)=O(g(n))讀作:
“f(n)是g(n)的一個大O成員”
記作:f(n)∈O(g(n))
但通常寫作:f(n)=O(g(n))。(以上內容參見《IntruductiontoAlgorithm》Chapter3,Ω、Θ相同)
目前六十五頁\總數九十八頁\編于十六點
[定理1.1大O比率定理]對于函數f(n)和g(n),若
存在,則f(n)=O(g(n)),當且僅當存在確定的常數c,有
≤c。證明:1)如果f(n)=O(g(n)),則存在c>0及某個n0,使得對于所有的n≥n0,有f(n)/g(n)≤c,因此≤c。2)假定≤c,它表明存在一個n0,使得對于所有的n≥n0,有f(n)≤max{1,c}*g(n)。證畢。目前六十六頁\總數九十八頁\編于十六點例:因為,所以5n+2=O(n)因為,所以7n2+5n+2=O(n2)因為,所以5×2n+n2=O(2n)考察下式:因為,所以n9+3n2=O(2n),是否合適?顯然這不是一個好的上界估計。原因在于:極限值不是一個正常數(見O的定義)。目前六十七頁\總數九十八頁\編于十六點用于估算復雜性階的定理[定理1.2]對于任意正實數x和ε,有下面的不等式:1)存在某個n0,使得對于任何n≥n0,有(logn)x<(logn)x+ε2)存在某個n0,使得對于任何n≥n0
,有(logn)x<n。3)存在某個n0,使得對于任何n≥n0,有nx<nx+ε。4)存在某個n0,使得對于任何n≥n0
,有nx<2n。5)對任意實數y,存在某個n0,使得對于任何n≥n0,有
nx(logn)y<nx+ε目前六十八頁\總數九十八頁\編于十六點例:
根據定理1.2,很容易得出:n3+n2logn=O(n3);n4+n2.5log20n=O(n4);2nn4log3n+2nn5/log3n=O(2nn5)。目前六十九頁\總數九十八頁\編于十六點定義1.2(下界函數)
如果存在兩個正常數c和n0,對于所有的n≥n0,有|f(n)|≥c|g(n)|,則記作f(n)=Ω(g(n))。含義:如果算法用n值不變的同一類數據在某臺機器上運行,所用的時間總不小于|g(n)|的一個常數倍。函數f至少是函數g的c倍,除非n<n0
。即是說,當n充分大時,g是f的一個下界函數(在一個非零常數倍的意義下)。目前七十頁\總數九十八頁\編于十六點注:1.通常情況下,下界函數也取單項的形式。2.總是試圖求出數量級最大的g(n)作為f(n)的下界函數,g(n)應該盡量接近函數f(n)。3.類似于大O符號,可以參考定理1.2所列的不等式,來估計復雜性函數的下界。其它具有和大O類似的性質。目前七十一頁\總數九十八頁\編于十六點
[定理1.3大Ω比率定理]對于函數f(n)和g(n),若
存在,則f(n)=Ω(g(n)),當且僅當存在確定的常數c,有
≤c。注:這里,當n充分大時,g(n)≤cf(n)意味著,
由此不難看出上述判別規(guī)則的正確性。目前七十二頁\總數九十八頁\編于十六點定義1.3(“平均情況”)
如果存在正常數c1,c2和n0,對于所有的n≥n0,有c1|g(n)|≤|f(n)|≤c2|g(n)|,
則記作含義:算法在最好和最壞情況下的計算時間就一個常數因子范圍內而言是相同的。可看作:既有f(n)=Ω(g(n)),又有f(n)=Ο(g(n))函數f介于函數g的c1和c2倍之間,即當n充分大時,g既是f的下界,又是f的上界。目前七十三頁\總數九十八頁\編于十六點
[定理1.4大Θ比率定理]對于函數f(n)和g(n),若
和
都存在,則f(n)=
Θ(g(n)),當且僅當存在確定的常數c1和c2,有
≤c1和≤c2。目前七十四頁\總數九十八頁\編于十六點2)關于算法復雜度的討論(1)數量級的大小對算法的有效性有決定性的影響。
以上界函數O(g(n))為例,例:假設解決同一個問題的兩個算法,它們都有n個輸入,
計算時間的數量級分別是n2和nlogn。則,
n=1024:分別需要1048576和10240次運算。
n=2048:分別需要4194304和22528次運算。可以看到:★同等規(guī)模n=1024下,計算量有近百倍的差距;★而在規(guī)模加倍后,一個Ο(n2)的算法計算時間增長4倍,而一個Ο(nlogn)算法則只增長一倍多一點。目前七十五頁\總數九十八頁\編于十六點(2)算法時間復雜度的分類根據上界函數的特性,可以將算法分為:多項式時間算法和指數時間算法。多項式時間算法:可用多項式函數對計算時間限界的
算法。常見的多項式限界函數有:
Ο(1)<Ο(logn)<Ο(n)<Ο(nlogn)<Ο(n2)<Ο(n3)指數時間算法:計算時間用指數函數限界的算法。常見的
指數時間限界函數:
Ο(2n)<Ο(n!)<Ο(nn)復雜性越來越高復雜性越來越高目前七十六頁\總數九十八頁\編于十六點當n取值較大時,指數時間算法和多項式時間算法在計算時間上非常懸殊。計算時間的典型函數曲線目前七十七頁\總數九十八頁\編于十六點計算時間函數值比較lognnnlognn2n32n010112122484248166416382464512256416642564096655365321601024327684294967296表1.1典型函數的值目前七十八頁\總數九十八頁\編于十六點對算法復雜性的一般認識當數據集的規(guī)模很大時,要在現有的計算機系統上運行具有比Ο(nlogn)復雜度還高的算法是比較困難的。指數時間算法只有在n取值非常小時才實用。要想在順序處理機上擴大所處理問題的規(guī)模,有效的途徑是降低算法的計算復雜度,而不是(僅僅依靠)提高計算機的速度。目前七十九頁\總數九十八頁\編于十六點NP問題:Non-deterministicPolynomial,多項式復雜程度的非確定性問題。什么是非確定性問題呢?
有些計算問題是確定性的,比如加減乘除之類,只要按照公式推導,按部就班一步步來,就可以得到結果。但是,有些問題是無法按部就班直接地計算出來。比如,找大質數的問題。有沒有一個公式就可以一步步推算出來,下一個質數應該是多少呢?這樣的公式是沒有的。再比如,大的合數分解質因數的問題,有沒有一個公式,把合數代進去,就直接可以算出,它的因子各自是多少?也沒有這樣的公式。這種問題的答案,是無法直接計算得到的,只能通過間接的“猜算”來得到結果。這也就是非確定性問題。
但對這些問題通常有個算法,它不能直接告訴你答案是什么,但可以告訴你,某個可能的結果是正確的答案還是錯誤的。這個可以告訴你“猜算”的答案正確與否的算法,假如可以在多項式時間內算出來,就叫做多項式非確定性問題。而如果這個問題的所有可能答案,都是可以在多項式時間內進行正確與否的驗算的話,就叫完全多項式非確定問題。完全多項式非確定性問題可以用窮舉法得到答案,一個個檢驗下去,最終便能得到結果。但是這樣算法的復雜程度,是指數關系,因此計算的時間隨問題的復雜程度成指數的增長,很快便變得不可計算了。目前八十頁\總數九十八頁\編于十六點(3)多項式定理定理1若A(n)=amnm+…+a1n+a0是一個m次多項式,則有
A(n)=Ο(nm)即:變量n的固定階數為m的任一多項式,與此多項式的最高階nm同階。證明:取n0=1,當n≥n0時,有
|A(n)|≤|am|nm+…+|a1|n+|a0|
=(|am|+|am-1|/n+…+|a0|/nm)nm
≤(|am|+|am-1|+…+|a0|)nm
令c=|am|+|am-1|+…+|a0|,即有|A(n)|≤cnm
。證畢。應用:如果一個算法的復雜度函數是多項式形式,則其階函數就可取該多項式的最高次項。目前八十一頁\總數九十八頁\編于十六點3)
限界函數的性質傳遞性:若且,則。(同)自反性:對稱性:若,則。轉置對稱性:當且僅當證明:從定義出發(fā)。
證明過程略。目前八十二頁\總數九十八頁\編于十六點定理:設d(n)、e(n)、f(n)和g(n)是將非負整數映射到非負實數的函數,則(1)如果d(n)是O(f(n)),那么對于任何常數a>0,ad(n)是O(f(n));
常數不影響數量級(2)如果d(n)是O(f(n)),e(n)是O(g(n)),那么d(n)+e(n)是O(f(n)+g(n));加法原理(3)如果d(n)是O(f(n)),e(n)是O(g(n)),那么d(n)e(n)是O(f(n)g(n));乘法原理(4)對于任意固定的x>0和a>1,nx是O(an);(5)對于任意固定的x>0,lognx是O(logn);這里x是常數(6)對于任意固定的常數x>0和y>0,logxn是O(ny);目前八十三頁\總數九十八頁\編于十六點例:2n3+4n2logn=O(n3)證明:logn=O(n)規(guī)則64n2logn=O(4n3)規(guī)則3,乘法原理2n3+4n2logn=O(2n3+4n3)規(guī)則2,加法原理2n3+4n3=O(n3)規(guī)則1、多項式定理2n3+4n2logn=O(n3)目前八十四頁\總數九十八頁\編于十六點4)o,ω記號定義1.4o記號形式1:對任意正常數c,存在常數n0>0,使對所有的n≥n0,有|f(n)|≤c|g(n)|,則記作:
f(n)=o(g(n))。形式2:若則記f(n)=o(g(n))。例:2n=o(n2),但2n2≠o(n2)目前八十五頁\總數九十八頁\編于十六點O和o的區(qū)別O:o:在o表示中,當n趨于無窮時,f(n)相對于g(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《小烏龜看爺爺》課件
- 《電氣安全操作技術》課件
- 三年級數學認識分數課件
- 《神經系統的療養(yǎng)》課件
- 單位管理制度集合大合集人員管理篇十篇
- 單位管理制度匯編大合集人力資源管理十篇
- 中心對稱課件
- 單位管理制度分享大全職工管理篇
- 《證據法的基礎知識》課件
- 《診斷學》課程標準
- 2024-2030年中國船用燃料油市場供需趨勢及競爭狀況綜合分析研究報告
- 中醫(yī)適宜技術匯報
- 2023-2024全國初中物理競賽試題:物態(tài)變化(學生版)
- 《計算機組成原理》周建敏主編課后習題答案
- 市政道路及綜合管網工程施工組織設計
- 09J801民用建筑工程建筑施工圖設計深度圖樣
- JGJ/T235-2011建筑外墻防水工程技術規(guī)程
- DL∕T 1315-2013 電力工程接地裝置用放熱焊劑技術條件
- 曼娜回憶錄完整版三篇
- 青島市平度市2022-2023學年七年級上學期期末地理試題
- 漁業(yè)資源基本術語-編制說明
評論
0/150
提交評論