版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第2章
大數(shù)據(jù)相關技術演講人2024/12/24目錄2.1云計算與大數(shù)據(jù)2.2人工智能與大數(shù)據(jù)2.3物聯(lián)網(wǎng)與大數(shù)據(jù)2.4小結012.1云計算與大數(shù)據(jù)ONE2.1.1云計算的基本概念云計算是一種提供存儲和計算資源的網(wǎng)絡,用戶能夠隨時獲取“云上”資源,按需求量使用。在用戶視角下,存儲和計算資源可以看成無限擴展,按照使用時長、數(shù)量付費。因此,“云”就像自來水廠一樣,用戶能夠隨時使用水,不限定時間、用量,只需要按照使用量付費給自來水廠。云計算實現(xiàn)了通過網(wǎng)絡提供可伸縮、廉價的分布式計算能力,用戶僅需接入互聯(lián)網(wǎng),即可隨時隨地獲取所需的各類存儲和計算資源。云計算代表了基于虛擬化、低成本、動態(tài)可擴展的基礎網(wǎng)絡應用設施,目前已經(jīng)廣泛應用到各行各業(yè)。2.1.1云計算的基本概念1.云計算的提出云計算的概念發(fā)源于20世紀60年代,斯坦福大學計算機教授約翰?麥卡錫(JohnMcCarthy)在講座中提到“計算機將會變成一種公共資源”,同時代的道格拉斯?帕克希爾(DouglasParkhill)在著作《計算機效用變革》中將計算機資源類比為電力資源,并提出了私有資源、公有資源、社區(qū)資源等概念,這些概念在云計算的應用中沿用至今?,F(xiàn)代云計算誕生于20世紀90年代末的互聯(lián)網(wǎng)大潮。1997年拉姆納特?切爾阿帕(RamnathChellappa)教授在演講中首次提出“云計算(CloudComputing)”概念;2006年8月,GoogleCEO埃里克?施密特(EricSchmidt)正式定義了“云計算(CloudComputing)”概念,推動了云計算的商業(yè)化應用。2.1.1云計算的基本概念1.云計算的提出在云計算的商業(yè)化應用中,1999年成立的Salesforce公司被公認為云計算的先驅,其主要業(yè)務是面向企業(yè)客戶銷售基于云的“軟件即服務”產(chǎn)品。2006年,Amazon公司推出了商業(yè)化云計算產(chǎn)品“亞馬遜網(wǎng)絡服務AWS”,其中重要的產(chǎn)品為“彈性計算云EC2”,是業(yè)界首款面向公眾提供基礎架構的云服務產(chǎn)品。繼AmazonAWS產(chǎn)品以后,各類云計算產(chǎn)品層出不窮,不但包括Microsoft、Google等互聯(lián)網(wǎng)巨頭構建的云計算產(chǎn)品,還包括國內互聯(lián)網(wǎng)巨頭構建的阿里云、騰訊云、百度云以及京東云等產(chǎn)品。表2-1給出了云計算發(fā)展簡史。2.1.1云計算的基本概念1.云計算的提出表2-1云計算發(fā)展簡史2.1.1云計算的基本概念云計算的定義廣義上來講,云計算是信息技術、軟件和互聯(lián)網(wǎng)相關技術提供的共享服務,這種服務將存儲和計算以“共享池”的方式提供,并命名為“云”。云計算整合了存儲和計算資源,并通過軟件實現(xiàn)自動化管理,只需要投入較少的管理資源,即可提供大規(guī)模的資源共享服務。在互聯(lián)網(wǎng)的流通中,云計算像普通生活中的水、電、煤一樣,可以自由、方便的隨取隨用,且價格較為低廉。實際上,云計算的概念較為抽象,且近幾年發(fā)展快速、并趨于完善,迄今為止并沒有一個標準的定義,各類知識圖譜中均給出了關于“云計算”的概念定義:(1)百度百科:云計算是分布式計算的一種,指的是通過網(wǎng)絡“云”將巨大的數(shù)據(jù)計算處理程序分解成無數(shù)個小程序,然后,通過多部服務器組成的系統(tǒng),處理和分析這些小程序,并將結果返回給用戶。2.1.1云計算的基本概念云計算的定義(2)維基百科:云計算是一種基于互聯(lián)網(wǎng)的計算方式,通過這種方式,共享的軟硬件資源和信息可以按照需求提供給計算各種終端和其他設備,使用服務商提供的計算機基礎設施作為存儲和計算資源。(3)云計算安全聯(lián)盟(CSA):云計算的本質是一種服務提供模型,通過這種模型可以隨時、隨地、按需地通過網(wǎng)絡訪問共享資源池的資源。資源池中的資源包括計算資源、網(wǎng)絡資源、存儲資源等,這些資源能夠被動態(tài)地分配與調整,在不同用戶之間靈活劃分。符合這些特點的互聯(lián)網(wǎng)服務都可被稱為云計算服務。2.1.1云計算的基本概念云計算的定義(4)美國國家標準與技術研究院(NIST):云計算通過網(wǎng)絡構建了便利、按需付費的計算資源獲取方式,包括網(wǎng)絡、服務器、存儲、應用和服務等。這些資源來自共享、可配置的計算機資源池,且能夠以最小的管理代價或服務提供商交互的方式快速獲取資源。總之,云計算并不是一種全新的網(wǎng)絡技術,而是全新的網(wǎng)絡應用概念,其核心概念是以互聯(lián)網(wǎng)為中心,為用戶提供快速、安全的存儲服務和計算服務,讓每個互聯(lián)網(wǎng)用戶都能夠使用龐大的計算資源和數(shù)據(jù)中心。2.1.2云計算的基本要素與優(yōu)勢1.云計算的基本要素NIST為云計算定義了NIST800-145標準,該標準定義了云計算的五大基本要素:自助服務、網(wǎng)絡分發(fā)服務、可衡量服務、資源靈活調度以及資源共享池。圖2-1給出了NIST提出的云計算要素示意圖。在NIST的標準中,云計算按照服務模式可以分為:基礎架構即服務(IaaS),平臺即服務(PaaS)以及軟件即服務(SaaS)三個類別;按照部署方式可以分為:公有云、私有云、行業(yè)云和混合云四個類別。
NIST800-145標準被業(yè)界普遍接受,主要原因是該標準建立了云計算的五大基本要素,簡潔地說明了云計算的基本特征。通過云計算的五個基本要素可以很容易區(qū)分云計算服務和普通信息化服務,具體基本要素的內容為:2.1.2云計算的基本要素與優(yōu)勢1.云計算的基本要素圖2-1NIST提出的云計算要素示意圖2.1.2云計算的基本要素與優(yōu)勢1.云計算的基本要素(1)自助服務:云計算為用戶提供自助的資源獲取服務。自助式服務充分發(fā)揮了云計算架構強大的運算能力,保障用戶獲得高效、便捷的體驗。例如:基于騰訊云的在線會議系統(tǒng),用戶可以自助的選擇會議類型、設置參會人數(shù),上傳會議資料等。當會議開啟后,騰訊云服務器將參會人員連接到虛擬的在線會議室。騰訊云并不需要人工干預流程,所有服務細節(jié)需求由用戶決定。不同于騰訊云方便快捷的資源服務,傳統(tǒng)多方會議服務需將分散的終端機房統(tǒng)一集中到中心機房,軟硬件設施較為僵化,需要人工劃分、分配資源。(2)網(wǎng)絡分發(fā)服務:基于互聯(lián)網(wǎng)分發(fā)服務,能夠打破資源使用的地理位置限制,打破硬件部署環(huán)境的限制。云計算實現(xiàn)了只要接入網(wǎng)絡就能享受計算資源,革命性地改變了計算機的使用習慣。以文檔編輯為例,基于金山云的WPS在線文檔編輯,僅需使用者通過手機、電腦或平板等終端登錄后,即可進行在線的文檔編輯。共享式WPS文檔提供了Word、Excel、PPT等常見文檔編輯功能,不再需要購買和安裝Office類軟件,僅需通過Web瀏覽器即可辦公,且文檔還支持多人協(xié)同編輯,極大地提升了工作效率。2.1.2云計算的基本要素與優(yōu)勢1.云計算的基本要素(3)可衡量服務:成熟、穩(wěn)定的云計算平臺,能夠實時跟蹤用戶對于存儲、CPU和網(wǎng)絡帶寬的需求,通過后臺的實時分析給出量化指標。根據(jù)量化指標,云平臺運營商能夠快速進行后臺資源的調整與優(yōu)化,從而為用戶提供彈性云服務,提升資源使用效率,降低資源使用成本。(4)資源靈活調度:實際上,云平臺的存儲、計算資源被虛擬成“云”,云計算提供商能夠快速將新設備添加到“云”上,以滿足不同客戶日益增長的資源需求?;谟脩粢暯?,只需要根據(jù)資源使用按時付費,即可獲得幾乎無限的資源提供,云平臺的資源調度非常靈活。例如:基于阿里云、騰訊云的應用能夠滿足用戶不斷增長的資源需求。在騰訊會議或釘釘會議中,已經(jīng)同時召開過千人級別的全球視頻會議,還能夠支持更大規(guī)模的多方視頻會議。2.1.2云計算的基本要素與優(yōu)勢1.云計算的基本要素(5)資源共享池:云計算平臺的計算資源“存儲、CPU和網(wǎng)絡帶寬”通常被稱為“資源共享池”。資源共享池是將所有設備的存儲、計算能力放在資源池中,并進行統(tǒng)一的資源分配。當用戶發(fā)出資源請求時,即可直接從資源共享池中為其分配資源,所有用戶都“共享”地使用資源池中的所有資源。NIST云計算五大關鍵要素非常形象地提煉了云計算模式的基本要素,在絕大多數(shù)成功的云計算服務中,都能很容易地感受到五大基本要素。例如:AmazonAWS的EC2云計算產(chǎn)品,其所提供的資源服務可以直接在網(wǎng)站上自助開通,通過網(wǎng)絡分發(fā)為用戶提供共享的資源服務,用戶可直接在EC2后臺中查看計算資源使用情況。此外,EC2提供了一個用于云計算資源“負載均衡”的資源調配系統(tǒng),能夠滿足瞬息萬變的用戶需求。這些基本要素將EC2塑造成了優(yōu)秀的云計算服務提供商,也界定了優(yōu)秀云計算服務的基本特點,成為后續(xù)云計算服務爭相模仿的對象。2.1.2云計算的基本要素與優(yōu)勢2.云計算的優(yōu)勢云計算問世接近20年,截止到2018年,根據(jù)國際數(shù)據(jù)集團(IDC)的數(shù)據(jù)統(tǒng)計顯示,69%的信息化企業(yè)已經(jīng)采用了云計算資源服務,18%的信息化企業(yè)計劃在未來采用云計算資源服務。云計算服務擁有如下的六大優(yōu)勢:(1)超大規(guī)模:“云計算”能夠為用戶提供前所未有的存儲和計算能力。統(tǒng)計數(shù)據(jù)表明,截止到2023年,Google云服務一共擁有24個數(shù)據(jù)中心,分布在包括北美洲、歐洲、亞洲和南美洲等全球范圍,Amazon和Yahoo等云服務提供商均擁有幾十上百萬臺服務器。國內的阿里云與騰訊云走在了云平臺建設前列,在世界各地為云平臺構建了數(shù)據(jù)中心,圖2-2給出了騰訊云建設的印度數(shù)據(jù)中心。2.1.2云計算的基本要素與優(yōu)勢2.云計算的優(yōu)勢(2)虛擬化:云計算支持用戶在任意位置、任意時間采用各類終端設備獲取服務資源。用戶所請求的資源來自虛擬的“云平臺”,而不是實物物理硬件,用戶的應用程序則在虛擬“云平臺”上的某個節(jié)點上運行。實際上,用戶無須了解應用程序的具體運行位置,直接通過網(wǎng)絡獲取虛擬化的服務。圖2-2的印度數(shù)據(jù)中心2.1.2云計算的基本要素與優(yōu)勢2.云計算的優(yōu)勢(3)敏捷性:云計算為用戶提供全面的基礎工具和操作系統(tǒng),用戶可以根據(jù)需要快速啟動資源,從云存儲、云計算、數(shù)據(jù)庫到物聯(lián)網(wǎng)、大數(shù)據(jù)分析等業(yè)務,都可以快速、自由的試驗,具有較高的敏捷性。(4)彈性可擴展:云計算具有理論上無限制的存儲和計算資源,用戶無須為日后高速增長的業(yè)務而過度預置資源。彈性伸縮服務是云平臺的重要功能之一,通過策略自動調整業(yè)務資源服務,保障按需調整云服務資源。表2-2給出了云平臺彈性伸縮服務的典型應用場景。2.1.2云計算的基本要素與優(yōu)勢2.云計算的優(yōu)勢表2-2云平臺彈性伸縮服務的典型應用場景2.1.2云計算的基本要素與優(yōu)勢2.云計算的優(yōu)勢(5)數(shù)據(jù)安全:數(shù)據(jù)安全是政府、企業(yè)等云計算用戶的重要需求之一,云平臺提供了許多高級安全功能,確保數(shù)據(jù)得到安全的存儲和處理。一方面,通過聯(lián)合角色進行精細權限和訪問管理,限制不同角色對敏感數(shù)據(jù)的訪問權限;另一方面,通過大數(shù)據(jù)分析實施基線保護,例如:身份驗證、訪問控制和數(shù)據(jù)加密等。(6)高可靠性:可靠性是眾多云計算應用的另一個重要需求,云平臺采用數(shù)據(jù)副本容錯、計算節(jié)點重構、日志回滾等措施構建了高可靠性,用戶可以靈活實現(xiàn)數(shù)據(jù)的備份和恢復。2.1.3云計算的體系架構云計算的體系結構可以通過兩種方式劃分,一是基于服務模式劃分為三個類別;二是基于部署方式劃分為四個類別。2.1.3云計算的體系架構1.云計算的服務模式云計算提供如下三種服務模式:(1)基礎架構即服務(IaaS):早期最基礎的云服務為虛擬主機(VirtualMachine),隨著計算機技術和互聯(lián)網(wǎng)技術的發(fā)展,基礎服務被拆分為CPU、存儲、網(wǎng)絡和數(shù)據(jù)庫等基礎云產(chǎn)品,實現(xiàn)了整個云計算的基礎架構。IaaS允許用戶進行靈活組合,實現(xiàn)彈性計費。(2)平臺即服務(PaaS):PaaS指的是基于IaaS提供的編程語言、庫和開發(fā)工具,創(chuàng)建應用服務平臺,即將本地環(huán)境中的開發(fā)服務平臺遷移到云端。常見的開發(fā)平臺服務包括:提供音視頻、短信和郵件的通信服務,提供地圖、定位和導航相關的地理信息服務,提供面向人工智能開發(fā)者的數(shù)據(jù)標注以及模型訓練服務等。2.1.3云計算的體系架構1.云計算的服務模式(3)軟件即服務(SaaS):SaaS是為用戶提供基于IaaS和PaaS構建的應用程序,即將本地環(huán)境中的信息應用系統(tǒng)遷移到云端。常見的軟件應用服務包括:辦公協(xié)同系統(tǒng)、企業(yè)OA系統(tǒng)、財務報銷系統(tǒng)以及銷售CRM系統(tǒng)等。隨著5G網(wǎng)絡的普及,我國率先進入大數(shù)據(jù)與人工智能時代,自動駕駛、工業(yè)互聯(lián)、云醫(yī)療等場景的興起,對基礎設施的要求越來越高,云計算的服務模式也越來越清晰。表2-3給出了三種云計算服務模式的特性對比。2.1.3云計算的體系架構1.云計算的服務模式表2-3三種云計算服務模式的對比2.1.3云計算的體系架構1.云計算的服務模式為了加深讀者對云計算服務模式的理解,以下用一個“比薩餅服務平臺”案例進行形象的比喻,如圖2-3所示。(1)如果不使用外界資源,完全自制比薩餅,則需要您準備所有的器具和原材料,并自己完成制作的全過程。這相當于所謂的“傳統(tǒng)架構”(沒有應用云計算服務),自己不但要掌握全部的技術方法,還需要準備所有的資源。(2)如果從“比薩餅服務平臺”上訂購制作比薩餅的原材料,自己準備制作的器具并完成制作的過程,這相當于應用“IaaS架構”的云服務,自己要掌握制作技術,但基礎原料由服務商提供。2.1.3云計算的體系架構云計算的服務模式03(3)如果在“比薩餅服務平臺”上請了一位面點師上門制作,他不但準備了原材料,還負責制作過程。而您甚至不需要準備制作的器具,只需要備有蘇打水和桌子,這就相當于應用了“PaaS架構”的服務。04(4)如果在“比薩餅服務平臺”上直接購買了比薩餅,則您要的產(chǎn)品全部由服務商提供,您只需要根據(jù)自己的需要付費使用即可,這就相當于得到“SaaS架構”的服務。2.1.3云計算的體系架構1.云計算的服務模式圖2-3基于“比薩餅服務平臺”理解三種云服務模式2.1.3云計算的體系架構2.云計算的部署方式云計算提供如下四種部署方式:(1)公有云:公有云指的是第三方提供商為用戶提供的公開云服務,通過互聯(lián)網(wǎng)接入使用,核心屬性是共享資源服務。公有云以低廉的成本,提供有吸引力的服務,為用戶創(chuàng)造新的價值。公有云面向普通大眾,隱私安全性低于私有云,但是其作為支撐平臺,能夠整合上游服務提供者和下游服務用戶,打造新的價值鏈和生態(tài)系統(tǒng)。(2)私有云:私有云指為特定用戶構建的云計算平臺,能夠為用戶提供高質量的服務,提高數(shù)據(jù)和資源的安全性,其核心屬性是專有資源。私有云不但可以部署在企業(yè)數(shù)據(jù)中心的防火墻內,還能夠部署在安全主機托管場所,提供了遠高于公有云的隱私安全性。2.1.3云計算的體系架構2.云計算的部署方式(3)混合云:無論是公有云還是私有云,在服務場景中都存在一定的限制。混合云融合了公有云和私有云,是云服務的創(chuàng)新模式和發(fā)展方向。云服務用戶既想將私密數(shù)據(jù)存放在私有云中,同時又希望獲得公有云的計算資源。這種情況下,需要將公有云和私有云進行融合、匹配使用,以期獲得更具個性化的云服務方案。(4)行業(yè)云:行業(yè)云是面向某個行業(yè)構建的共享云端基礎設施,支撐特定行業(yè)的資源服務需求,這類云服務一般建立在混合云之上,通過云服務共同構建行業(yè)服務,其中面向政府的重要應用場景為“政務云”?!景咐?-1】“人民黨建云”政務云平臺。2.1.3云計算的體系架構2.云計算的部署方式2014年3月,人民網(wǎng)中國共產(chǎn)黨新聞網(wǎng)推出“全國黨建云平臺”欄目,搭建了“云信息、云服務、云管理”的新型黨建宣傳模式,形成以全國黨建云平臺為主體,中央和國家機關、國企、非公、高校四個子平臺為輔的“一體四翼”發(fā)展模式,逐步建成覆蓋全國的黨建綜合信息平臺。經(jīng)過近八年的發(fā)展,截止到2021年底,全國黨建云平臺已經(jīng)有超過10萬個入駐單位,涵蓋了黨委、政府、企事業(yè)單位、社會組織等各類組織。全國黨建云平臺是黨建工作的重要信息化平臺,通過云計算等新技術,實現(xiàn)黨建工作的智能化、信息化和網(wǎng)絡化,為黨建工作提供強有力的支撐和保障。在全國黨建云平臺上,各級組織可以開展黨建工作的各類活動,具體包括:2.1.3云計算的體系架構2.云計算的部署方式(1)網(wǎng)上支部:隨時隨地開展網(wǎng)上支部會,會議過程中黨員可通過文字、語音、圖片等形式記錄學習情況,形成完整的會議記錄。此外,黨組織也能夠隨時檢索黨員在組織中的生活記錄,通過大數(shù)據(jù)與人工智能技術,解決異地會議、三會一課留痕、會議記錄造假等問題,為黨組織評價提供有力的證據(jù)。(2)組織生活:通過圖文、視頻等形式在線上開展組織生活。黨員之間評論打分,與工作考核任務綁定,構建了自動化、流程化的考核分析,實現(xiàn)看得見、可量化的黨建工作。(3)積分排行:搭建黨組織的積分系統(tǒng),通過排名方式激勵黨員學習、分享和活動,充分調用黨員工作的積極性。(4)工作考核:將黨組織和黨員的考核工作搬上“云端”,打造在線的黨組織任務布置、黨員完成考核的全流程,便于紀委監(jiān)督隨時了解情況,實現(xiàn)黨建工作向基層延伸。2.1.3云計算的體系架構2.云計算的部署方式國內最大的云計算服務商為阿里云和騰訊云,為各類企業(yè)和個人提供公有云服務。除此之外,華為云、金山云、百度云、天翼云等屬于第二梯隊,為中大型企業(yè)定制私有云服務。電信和??档绕髽I(yè)則主要進行基于混合云的行業(yè)云建設,主要應用產(chǎn)品包括政務云等。表2-4給出了四種云計算部署方式的對比。2.1.3云計算的體系架構2.云計算的部署方式表2-4四種云計算部署方式的對比2.1.4云計算的核心技術云計算的核心技術包括虛擬化、分布式存儲及計算、并行編程和云安全等,下面對核心相關技術進行簡要介紹。2.1.4云計算的核心技術1.虛擬化技術虛擬化是云計算最重要的特征之一。虛擬化技術將實體存儲和計算資源予以抽象、轉換后呈現(xiàn)出來,打破了實體資源不可切割的屏障,使得物理單元和邏輯單元解耦,用戶能夠通過更好的方式使用存儲和計算資源。云計算上的虛擬化技術解決了資源使用的諸多瓶頸:01(1)服務器整合:物理服務器的性能瓶頸受限于單臺服務器,沒有虛擬化技術之前,很難將多個服務器整合成一個高性能服務器。利用虛擬化技術,可以快速整合多臺服務器的存儲和計算資源,為用戶提供彈性資源服務。02(2)靈活資源分配:通過虛擬化技術,云平臺能夠動態(tài)調配資源給每個用戶,資源使用進程中能夠在不同物理機之間“不停機”地轉移,避免了硬件故障導致服務停滯的問題。同時,虛擬化技術能夠采用負載均衡策略,為用戶提供所需的服務資源。032.1.4云計算的核心技術1.虛擬化技術(3)快速部署:在服務器部署中,物理機的部署需要硬件組裝、驅動配置和軟件安裝等流程,部署效率低且難以維護。在虛擬化技術下,云計算用戶僅需簡單的設置,即可快速產(chǎn)生一臺或多臺標準化的虛擬機,節(jié)省了大量的部署時間,同時也提升了維護的效率。(4)可用性與數(shù)據(jù)備份:虛擬快照是一種重要的虛擬化技術,將虛擬機的當前狀態(tài)通過“照片”的形式存儲。當出現(xiàn)失誤或事故時,能夠通過虛擬快照快速恢復當前狀態(tài),而物理機則難以做到這一點。2.1.4云計算的核心技術2.分布式存儲及計算技術分布式存儲及計算技術是云計算的另一個重要特征。云平臺將計算任務分布在云端的分布式計算設備上,數(shù)據(jù)也存儲在云端分布式存儲設備中。其中,分布式計算技術將大量計算的工程數(shù)據(jù)分區(qū)成小塊,由云端的多個計算機節(jié)點分別計算,再上傳合并進行數(shù)據(jù)分析處理。通過分布式計算,可以節(jié)約整體計算時間,極大的提升效率。此外,云平臺服務大量用戶,若采用集中式存儲無法滿足海量大數(shù)據(jù)的存儲需求,分布式存儲技術則能夠在多臺計算機上搭建大規(guī)模存儲集群。分布式存儲是一種全新的數(shù)據(jù)存儲應用技術,通過網(wǎng)絡連接計算機集群,使用每臺計算機上的磁盤空間進行存儲,將分散的存儲資源構建成統(tǒng)一的數(shù)據(jù)存儲中心。分布式存儲追求在云端為每個用戶提供可擴展、價格低廉的存儲服務。1.4云計算的核心技術分布式存儲及計算技術云存儲是分布式存儲的發(fā)展與延續(xù),二者之間不是替代關系,而是互補與結合的關系。分布式存儲技術是云存儲實現(xiàn)的基本條件,云存儲利用分布式存儲技術提供可靠、廉價的存儲服務,并延伸出了重要的技術革新。例如:流媒體網(wǎng)站存儲的發(fā)展離不開分布式存儲技術,通過分布式存儲技術構建的云存儲,為優(yōu)酷、騰訊、愛奇藝等視頻網(wǎng)站提供了內容分發(fā)網(wǎng)絡服務(CDN)。CDN服務是云存儲的自然延伸和有效補充,通過網(wǎng)絡進行內容分發(fā),形成了自下而上的多中心化的分布式網(wǎng)絡模式。表2-5給出了云存儲和分布式存儲的對比。2.1.4云計算的核心技術2.分布式存儲及計算技術表2-5云存儲和分布式存儲的對比2.1.4云計算的核心技術2.分布式存儲及計算技術從概念層次上來講,云計算與分布式計算之間,既包含相互獨立的關系,又包含交叉關聯(lián)的關系。云計算是分布式計算技術面向應用的延伸,分布式計算是云計算的實現(xiàn)基礎。沒有分布式計算技術,云計算的概念和應用無法落地表2-6給出了云計算和分布式計算的對比。2.1.4云計算的核心技術2.分布式存儲及計算技術表2-6云計算和分布式計算的對比2.1.4云計算的核心技術3.并行編程技術為了提升計算效率和系統(tǒng)處理能力,云平臺在總體設計和邏輯設計中,廣泛采用并行編程技術,保證各個計算任務能夠并行執(zhí)行,提升云計算的效率。因此,云平臺的這種特性要求操作系統(tǒng)支持并發(fā)性和資源共享,能夠采用并行編程的方式設計程序,同時支持兩個以上的運算或邏輯操作。在常用的云計算并行編程技術中,一般采用MapReduce并行編程模型,將計算任務劃分為多個子任務,通過Map步驟和Reduce步驟實現(xiàn)大規(guī)模節(jié)點的調度與分配。2.1.4云計算的核心技術4.云安全技術云平臺提供優(yōu)質的安全管理服務,例如:針對大量用戶的運行軟件,進行軟件異常監(jiān)測。在強大的云存儲、云計算和網(wǎng)絡互連基礎上,云平臺能夠快速獲取最新的木馬、漏洞和惡意程序信息,并推送至云端進行自動分析和處理。云端的分析結果能夠自動分配到各個客戶端,監(jiān)測客戶端可能發(fā)生的最新異常,從而保障客戶端的安全運行。云安全技術理論上能夠通過云端的統(tǒng)一分析與調配,將病毒的傳播范圍控制在一定范圍內,提升所有用戶的安全性。2.1.5云計算的發(fā)展現(xiàn)狀與主流平臺1.云計算發(fā)展現(xiàn)狀云計算的產(chǎn)業(yè)結構包含三層產(chǎn)業(yè)鏈。上游產(chǎn)業(yè)鏈為基礎設施供應商以及互聯(lián)網(wǎng)數(shù)據(jù)中心服務商,提供各類芯片、服務器、存儲設備,以及建設數(shù)據(jù)中心;中游產(chǎn)業(yè)鏈即為云計算服務本身,提供IaaS/PaaS/SaaS服務;下游產(chǎn)業(yè)鏈為云生態(tài),包括基礎平臺和原生云服務等。到目前為止,全球云計算市場整體呈現(xiàn)高速增長,2017年美國云服務占據(jù)全球59.5%的市場份額,其次是歐洲占據(jù)21.5%的市場份額,亞洲市場份額僅占12.1%。從市場分布來看,國際云計算產(chǎn)業(yè)經(jīng)過多年發(fā)展,市場規(guī)模相對成熟,公有云占據(jù)主體部分。此外,2021年的統(tǒng)計數(shù)據(jù)顯示,SaaS服務在全球的云計算市場占比較高且超過66%,而PaaS服務的市場規(guī)模最小。根據(jù)中國信息通信研究院2023年7月的《云計算白皮書(2023年)》的數(shù)據(jù),2.1.5云計算的發(fā)展現(xiàn)狀與主流平臺1.云計算發(fā)展現(xiàn)狀圖2-4給出了2020-2024年全球云計算市場規(guī)模及同比增速,其中2023、2024年為預測結果。從圖中數(shù)據(jù)可知,全球的云計算市場在2021年前高速增長,從2022年開始逐漸趨于穩(wěn)步增長,云計算市場趨于穩(wěn)定。2.1.5云計算的發(fā)展現(xiàn)狀與主流平臺1.云計算發(fā)展現(xiàn)狀近十年,我國的經(jīng)濟模式發(fā)生了翻天覆地的變化,云計算技術在中國市場已經(jīng)進入成熟階段。我國云計算市場的IaaS服務占比最大,其次是PaaS服務,占比最小的是SaaS服務。根據(jù)中國信息通信研究院的統(tǒng)計結果,2022年,中國云計算總體處于快速發(fā)展階段,市場規(guī)模達到4550億元,比2021年增長40.9%。如圖2-5所示,2022年公有云市場規(guī)模達到3256億元,增長率由前一年的70.8%放緩至49.3%。公有云將成為未來幾年中國云計算市場增長的主要動力。2.1.5云計算的發(fā)展現(xiàn)狀與主流平臺1.云計算發(fā)展現(xiàn)狀從公有云細分的三種服務市場來看,公有云的IaaS和PaaS服務保持高速增長,SaaS服務穩(wěn)步發(fā)展。如圖2-6所示,2021年,公有云IaaS服務市場規(guī)模達到1615億元,增速為80.4%,占公有云總體規(guī)模的75%。PaaS服務依然保持著細分市場中最高的增長率,規(guī)模達到196億元同比增長90.7%,SaaS服務穩(wěn)步增長規(guī)模達到370億元,同比增長滑落至32.9%。根據(jù)國際數(shù)據(jù)公司IDC的統(tǒng)計數(shù)據(jù)顯示,2022年上半年我國公有云服務市場整體規(guī)模達到165.8億美元,其中IaaS市場同比增長27.3%,PaaS市場同比增長45.4%。從國內云計算服務廠商的市場占比來看,如圖2-7所示,阿里云、天翼云、騰訊云、華為云和移動云占據(jù)公有云IaaS服務市場前5名,而公有云PaaS服務市場排名前列的則是阿里云、華為云、騰訊云和百度云。2.1.5云計算的發(fā)展現(xiàn)狀與主流平臺1.云計算發(fā)展現(xiàn)狀圖2-52017年至2022年中國公有云服務市場規(guī)模趨勢圖數(shù)據(jù)來源:中國信通院,2022年1.5云計算的發(fā)展現(xiàn)狀與主流平臺云計算發(fā)展現(xiàn)狀圖2-62017年至2022年中國公有云服務細分市場規(guī)模統(tǒng)計圖數(shù)據(jù)來源:中國信通院,2022年2.1.5云計算的發(fā)展現(xiàn)狀與主流平臺1.云計算發(fā)展現(xiàn)狀圖2-72021年中國公有云IaaS服務市場分布數(shù)據(jù)來源:中國信通院,2022年2.1.5云計算的發(fā)展現(xiàn)狀與主流平臺1.云計算發(fā)展現(xiàn)狀私有云在我國云計算市場也占據(jù)了半壁江山。2022年12月,在賽迪顧問《2022年中國私有云市場研究報告》中,給出了中國私有云市場的發(fā)展脈絡。如圖2-8所示,按照市場能力和技術能力,將中國私有云提供商劃分為四個象限。其中,市場能力和發(fā)展能力突出的“領導者”,包括由華為、新華三和華云組成的“中國私有云三華”,以及天翼云和浪潮。在“挑戰(zhàn)者”象限,勢頭迅猛的金山云和深信服正在迎頭趕上;在“可期待者”象限,則有以技術突破創(chuàng)新的騰訊云和阿里云;“跟隨者”象限則是近年來進入私有云行業(yè)的新興企業(yè),包括曙光云、京東云和百度云等。2.1.5云計算的發(fā)展現(xiàn)狀與主流平臺1.云計算發(fā)展現(xiàn)狀圖2-82021年中國私有云提供商競爭力象限分析圖數(shù)據(jù)來源:賽迪顧問,2022年11月2.1.5云計算的發(fā)展現(xiàn)狀與主流平臺1.云計算發(fā)展現(xiàn)狀企業(yè)數(shù)字化轉型和企業(yè)使用云服務等模式,將隨著新一代私有云技術革新而升級。在業(yè)務驅動和政策利好等因素影響下,我國私有云市場增長迅速。2022年11月,賽迪顧問關于中國私有云的統(tǒng)計數(shù)據(jù)顯示,未來三年中國私有市場將保持高速增長,增速維持在30%以上。圖2-9給出了2022-2025年中國私有云市場規(guī)模與增長預測。預計到2025年,我國私有云市場規(guī)模將達到3035.1億元,每年增速持續(xù)平穩(wěn)在32%至33%左右。2.1.5云計算的發(fā)展現(xiàn)狀與主流平臺1.云計算發(fā)展現(xiàn)狀圖2-92022-2025年中國私有云市場規(guī)模與增長預測數(shù)據(jù)來源:賽迪顧問、中商產(chǎn)業(yè)研究院,2022年2.1.5云計算的發(fā)展現(xiàn)狀與主流平臺2.云計算主流平臺當前,隨著云計算生態(tài)的不斷完善,國內外涌現(xiàn)出大批的優(yōu)秀云計算服務提供商。以IaaS服務為例,美國主導了行業(yè)生態(tài),擁有AamazonAWS、MicrosoftAzure等基礎設施服務提供商;中國的IaaS服務市場則由阿里云、騰訊云、UCloud等服務商領跑。下面,我們介紹國內外主流的云計算平臺?!景咐?-2】AmazonAWS平臺2002年初,Amazon已經(jīng)開始規(guī)劃網(wǎng)絡服務(云服務的前身)AWS系統(tǒng)架構,并于2006年正式推出云計算產(chǎn)品。2013年,AmazonAWS中標了美國中情局(CIA)構建政務私有云的6億美元超級訂單,奠定了AWS系列產(chǎn)品在全球云計算產(chǎn)業(yè)中的領導地位。當前,AmazonAWS在全球22個國家和地區(qū)建設了69個數(shù)據(jù)中心,為全球用戶提供1700+個云端節(jié)點。2020年開始,Amazon計劃在日本、南非、意大利、西班牙和印尼等地區(qū)新增五大數(shù)據(jù)中心,為更多地區(qū)的用戶提供基礎和應用云服務。目前,AmazonAWS云平臺提供了全面,多達上千種云服務,為用戶提供全面可選擇的IaaS服務、PaaS服務和SaaS服務,涵蓋存儲、計算、網(wǎng)絡、操作系統(tǒng)、應用等服務,為用戶配備智能管理工具、安全配置工具以及運行監(jiān)控工具等?!景咐?-2】AmazonAWS平臺表2-7給出了AamzonAWS的主要IaaS服務產(chǎn)品。從表中可以看出,Amazon的基礎設施服務涵蓋云計算、云存儲、云數(shù)據(jù)庫和內容分發(fā)網(wǎng)絡。據(jù)統(tǒng)計,2022年第三季度,AmazonAWS在全球公有云市場占比為34%,是目前公認的全球最大的公有云提供商。此外,AmazonAWS在2022年整年實現(xiàn)銷售收入801億美元,與2021年相比增長179億美元,增長率達到29%。2022年上半年,AmazonAWS在中國的IaaS+PaaS市場占比份額達到9%,同比增長30.7%。【案例2-2】AmazonAWS平臺表2-7AamzonAWS的主要IaaS服務產(chǎn)品【案例2-3】MicrosoftAzure平臺【案例2-3】MicrosoftAzure平臺。
2008年,Microsoft進入云計算市場,正式創(chuàng)建云計算服務WindowsAzure。用戶通過MicrosoftAzure即可在全球任意位置訪問Microsoft數(shù)據(jù)中心,享受云服務提供的計算、存儲、數(shù)據(jù)庫、應用程序和大數(shù)據(jù)分析等業(yè)務。Azure系列產(chǎn)品屬于典型的進入市場早,但是發(fā)力較晚的云服務平臺。雖然于2008年進入了全球云計算市場,但是沉寂了6年后才進入公眾視野,成為了AmazonAWS的重要戰(zhàn)略對手。2014年,Microsoft新任總裁納德拉開始重視云服務和開源社區(qū),將WindowsAzure正式更名為MicrosoftAzure,至此Azure成為了成熟、開放的云平臺,并支持多種編程語言實現(xiàn)計算應用服務。Azure為用戶提供IaaS、PaaS和SaaS服務,【案例2-3】MicrosoftAzure平臺由于Microsoft成熟的操作系統(tǒng)和軟件體系,Azure在SaaS產(chǎn)品中呈現(xiàn)領先優(yōu)勢,與AWS同為全球云計算的龍頭產(chǎn)品。圖2-10給出了MicrosoftAzure公有云IaaS服務支持的主要功能產(chǎn)品。圖2-10MicrosoftAzure公有云IaaS服務支持的主要功能產(chǎn)品【案例2-3】MicrosoftAzure平臺
當前,MicrosoftAzure已經(jīng)在全球建設超過200個數(shù)據(jù)中心,可以部署至全球44個區(qū)域,為全球超過10億用戶和2000萬公司提供云計算服務。據(jù)統(tǒng)計,2022年第二季度,MicrosoftAzure營收約為110.69億美元,同比增長46%。同時,2022年第三季度,MicrosoftAzure在全球公有云市場占比為21%,是目前公認的全球第二大公有云提供商。目前,在MicrosoftAzure持續(xù)環(huán)比增長情況下,有望在2023年反超MicrosoftOffice,成為Microsoft第一大產(chǎn)品。【案例2-4】UCloud平臺【案例2-4】UCloud平臺。UCloud(優(yōu)刻得)成立于2012年3月,是國內基礎云計算服務提供商,長期專注于移動互聯(lián)網(wǎng)領域,深度了解移動互聯(lián)網(wǎng)場景的云計算和云存儲需求。UCloud的核心團隊來自騰訊、阿里、Amazon等國內外知名企業(yè),通過自主技術研發(fā),為用戶提供了計算資源、存儲資源、網(wǎng)絡資源等必備的基礎IT架構服務。UCloud提供如下的產(chǎn)品:通用計算、I/O密集型計算、科學計算等多場景的計算服務產(chǎn)品;高速緩存、高可用塊存儲、低成本歸檔存儲等多需求的存儲服務產(chǎn)品;滿足底層架構靈活性、國內高效訪問和國際加速訪問的網(wǎng)絡服務產(chǎn)品。
UCloud云服務在全球擁有32個區(qū)域,500+個加速節(jié)點,為用戶提供業(yè)務架構豐富靈活的業(yè)務需求。2017年到2018年,UCloud分別接受了元禾控股和中國移動十億級別的融資?!景咐?-4】UCloud平臺2020年1月,UCloud正式在上交所科創(chuàng)板掛牌上市,成為中國云計算第一股上市公司。2021年,UCloud承辦世界人工智能創(chuàng)新大賽,為大賽順利進行保駕護航。2022年,UCloud響應國家“東數(shù)西算”工程,分別部署了上海青浦云計算中心和內蒙古烏蘭布察云計算中心,滿足政企數(shù)字化增效需求。同年,入選“2022年中國互聯(lián)網(wǎng)企業(yè)綜合實力百強”。2.1.6云計算與大數(shù)據(jù)的關系云計算與大數(shù)據(jù)之間密不可分,云計算為大數(shù)據(jù)提供了有力的工具與途徑,大數(shù)據(jù)則為云計算提供了有價值的用武之地。起初,云計算包含兩方面的含義:一是Google開發(fā)的大規(guī)模分布式存儲和計算技術;二是Amazon提供的“按需租用”AWS服務。隨著大數(shù)據(jù)技術的發(fā)展,大規(guī)模分布式存儲和計算技術從最初的“云計算”概念剝離,成為大數(shù)據(jù)技術的核心部分。云計算則由原始的“按需租用”,擴展成IaaS、PaaS、SaaS服務,以及公有云、私有云和混合云等服務體系。如今,大數(shù)據(jù)技術著眼于“數(shù)據(jù)”,關注實際業(yè)務,包括數(shù)據(jù)采集、存儲、分析和挖掘方法,重點關注信息沉淀能力;云計算技術則著眼于“計算”,關注信息系統(tǒng)的基礎架構、解決方案,重點關注計算資源服務能力。因此,云計算與大數(shù)據(jù)的關系非常微妙,既密不可分又有區(qū)別。表2-8給出了云計算與大數(shù)據(jù)技術的對比。2.1.6云計算與大數(shù)據(jù)的關系表2-8云計算與大數(shù)據(jù)技術的對比022.2人工智能與大數(shù)據(jù)2.2人工智能與大數(shù)據(jù)ArtificalIntelligent(AI)翻譯成中文即為人工智能,簡單來說,人工智能就是通過算法建立模擬人類智能的理論、方法、技術和系統(tǒng)。人工智能是計算機科學的一個分支,企圖了解人類智能的本質,并設計一種與人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語音識別、圖像識別、自然語言處理以及專家系統(tǒng)等。2022年10月,習近平總書記《在中國共產(chǎn)黨第二十次全國代表大會上的報告》指出:“推動戰(zhàn)略性新興產(chǎn)業(yè)融合集群發(fā)展,構建新一代信息技術、人工智能等一批新的增長引擎,加快發(fā)展數(shù)字經(jīng)濟,促進數(shù)字經(jīng)濟與實體經(jīng)濟深度融合?!比斯ぶ悄軐⒆鳛樾屡d技術,在數(shù)字經(jīng)濟的發(fā)展和科學技術的創(chuàng)新中,具有排頭兵和先行者的作用。如今,人工智能技術已經(jīng)進入我們生活的方方面面。2.2.1人工智能的基本概念1.人工智能發(fā)展史人工智能,顧名思義即人造的智能,是認知科學、邏輯學、計算機科學等科學交叉形成的一種新型科學技術,人工智能研究的目標就是使機器能夠表現(xiàn)出類似人類的智慧,具有智能行為。近70年來,人工智能的發(fā)展主要包含四大階段:2.2.1人工智能的基本概念人工智能誕生期人工智能概念誕生于20世紀40年代至50年代。1950年,“人工智能之父”艾倫?圖靈(AlanTurning)給出了圖靈測試的定義:“如果一臺機器能夠與人類展開交互,而不會被人類辨別出機器的身份,那么這臺機器具有智能”。1956年,美國達特茅斯學院舉行了第一次人工智能研討會,會上“人工智能(AI)”概念由約翰?麥卡錫(JohnMcCarthy)提出,赫伯特?西蒙(HerbertSimon)和艾倫?紐厄爾(AllenNewell)展示了編寫邏輯理論的機器,此次研討會被認為是人工智能誕生的標志。2.2.1人工智能的基本概念人工智能黃金期人工智能進入高速發(fā)展的黃金期是20世紀50年代至70年代。1966年,世界上第一個聊天機器人ELIZA由麻省理工學院魏澤?鮑姆(WeizenBaum)研發(fā),ELIZA能夠理解簡單的人類自然語言,并能夠與人類產(chǎn)生簡單的互動。1966年至1972年,美國斯坦福研究所研發(fā)出世界上第一臺基于人工智能的移動機器人Shakey,標志著人工智能應用的發(fā)展。1968年,美國斯坦福研究所道格?恩格勒(DougEngelbart)發(fā)明了計算機鼠標,并構想出了超文本鏈接概念,為現(xiàn)代互聯(lián)網(wǎng)建立了基礎。2.2.1人工智能的基本概念人工智能低谷期20世紀70年代處,受限于計算機的存儲和計算性能,人工智能的研究遭遇低谷期。人工智能的應用場景要求機器具有兒童認知水平,但是研究者發(fā)現(xiàn)這個要求過高。在1970年左右,研究者無法構建一個支持正常人類兒童智力水平的數(shù)據(jù)庫,計算機程序的學習能力也無法像人類兒童那樣迅速、快捷。由于缺乏能夠應用的研究進展,人工智能相關的研究逐漸遭遇低谷,出資方也停止了研究資助。2.2.1人工智能的基本概念人工智能爆發(fā)期2012年,隨著深度神經(jīng)網(wǎng)絡的提出,深度學習在人工智能領域得到了極大的發(fā)展和廣泛應用。2012年,加拿大神經(jīng)科學團隊構建了具備簡單認知、含有250萬個模擬“神經(jīng)元”的虛擬大腦Spaun,能夠通過最基本的智商測試。2013年開始,深度學習被廣泛應用于產(chǎn)品開發(fā),F(xiàn)acebook成立人工智能實驗室、Google收購語音和圖像識別公司,推廣深度學習平臺,百度創(chuàng)建了深度學習研究院。2015年,Google開源了深度學習平臺Tensorflow。2016年,Google開發(fā)的人工智能圍棋系統(tǒng)AlphaGo戰(zhàn)勝世界冠軍李世石,圍棋人機對弈讓人工智能被世人所知,深度學習成為人工智能市場的導火索,人工智能開啟了新一輪爆發(fā)期。2.2.1人工智能的基本概念2.人工智能的定義人工智能的定義可以分為兩部分,即“人工”和“智能”,人工是實現(xiàn)AI的途徑,智能是實現(xiàn)AI的目標?!爸悄堋敝傅氖前ㄈ祟?、一些動物在內的生物所具備的學習、理解和推理的能力。百度百科關于“人工智能”的定義為:人工智能是計算機科學的一個分支,旨在了解智能的實質,并產(chǎn)生出一種新的能以人類智能相似方式做出反應的智能機器,該領域的研究包括機器人、語音識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能自誕生以來,理論和技術日益成熟,應用領域也不斷擴大。未來人工智能帶來的科技產(chǎn)品,將會是人類智慧的“容器”。人工智能可以對人的意識、思維的信息過程模擬,雖然不是人的智能,但能夠像人那樣思考,甚至在某些方面超過人的智慧。人工智能是研究使用計算機來模擬人類的某些思維過程和智能行為,如:學習,推理、思考和規(guī)劃等,其任務包括使用計算機實現(xiàn)智能的原理、制造類人腦智能的計算機,以及使用計算機實現(xiàn)更高層次的智能應用。2.1人工智能的基本概念2.人工智能的定義在人工智能及相關學科的70余年發(fā)展歷史中,由于人工智能學科的交叉性,有許多不同學科背景的學者都基于本學科給出了對人工智能的理解,提出了不同的觀點,因此人工智能的發(fā)展產(chǎn)生了不同的學術流派。圖2-11所示,人工智能三大主流學術流派分別為:符號主義(Symbolism)、聯(lián)結主義(Connectionism)和行為主義(Actionism)。圖2-11人工智能三大流派2.2.1人工智能的基本概念2.人工智能的定義(1)符號主義:符號學派的理論基礎是“物理符號系統(tǒng)假設”和“有限合理性原理”。該流派認為任何一個模式,只要能與其他模式相區(qū)別,就被認為是一個符號。符號主義致力于通過某種符號來描述人類的認知過程,并將符號輸入到能處理符號的計算機中,從而模擬人類的認知過程,實現(xiàn)人工智能。(2)聯(lián)結主義:聯(lián)結學派研究非程序的、適應性的、大腦風格的信息處理本質和能力。該流派基于神經(jīng)網(wǎng)絡以及網(wǎng)絡間的聯(lián)結機制與學習算法,研究智能模擬方法。聯(lián)結主義從神經(jīng)生理學和認知科學的研究成果出發(fā),將人的智能歸結為人腦高層活動的結果,強調人類智能是大量簡單的神經(jīng)元通過復雜相互連接后并行運行的結果,以此為理論實現(xiàn)人工智能。2.2.1人工智能的基本概念2.人工智能的定義(3)行為主義:行為學派認為智能取決于感知和行動,應該直接利用機器對環(huán)境的響應為原型設計人工智能模型,智能行為體現(xiàn)在現(xiàn)實世界中,通過智能體與周圍環(huán)境交互而表現(xiàn)出來。行為主義認為學習是刺激與反應之間的鏈接,理論假設為:行為是學習者對環(huán)境刺激所做出的反應,學習過程是漸進的嘗試錯誤的過程,強化是學習成功的關鍵。此外,在人工智能的實現(xiàn)和應用中也分為“強人工智能”和“弱人工智能”。強人工智能認為,有可能制造出真正能推理和解決問題的人工智能機器,且機器有知覺、有自我意識。強人工智能包含兩類:一類是類人的人工智能,構建與人類思維和推理一樣的機器,另一類是非類人的人工智能,構建與人類知覺、意識和思維完全不一樣的推理機器。弱人工智能認為,不可能制造出真正能推理和解決問題的人工智能機器,現(xiàn)有的機器只不過看起來像“智能”,但是并不真正擁有智能,也不會有自主意識。2.2.2人工智能的研究領域人工智能是包含自然科學、社會科學以及工程技術的交叉邊緣學科,涉及的研究和領域包括機器學習、群體智能優(yōu)化、人工神經(jīng)網(wǎng)絡、專家系統(tǒng)、知識圖譜、計算機視覺、自然語言處理、語音處理、人機交互以及智能機器人等,下面簡單介紹人工智能常見的研究領域:2.2.2人工智能的研究領域1.機器學習學習是人類獲取知識的重要途徑和產(chǎn)生智能的重要標志。機器學習是讓計算機模擬人的學習行為,自動地通過學習獲取知識和技能,不斷改善性能,實現(xiàn)自我完善。圖2-12給出了一個完整的機器學習系統(tǒng),包括環(huán)境、學習環(huán)節(jié)、知識庫、執(zhí)行與評價。其中,環(huán)境向系統(tǒng)的學習部件提供支持信息;學習環(huán)節(jié)對環(huán)境提供的信息進行整理、分析、歸納或類比,形成知識,存入知識庫;知識庫存儲預處理后的知識,為執(zhí)行評價提供數(shù)據(jù)支持;執(zhí)行環(huán)節(jié)根據(jù)知識庫完成任務,同時將獲得的信息反饋給評價環(huán)節(jié),對所學習到的知識進行評價,進一步改善執(zhí)行環(huán)節(jié)的行為。圖2-12一個完整的機器學習系統(tǒng)2.2.2人工智能的研究領域1.機器學習機器學習包含三個類別:一是監(jiān)督學習,即在機器學習模型訓練時,提供訓練樣本及對應的類別標簽,因此又稱為有導師學習;二是無監(jiān)督學習,即在機器學習模型訓練時,只提供訓練樣本,而不提供或不存在樣本對應的類別標簽信息,又稱為無導師學習;三是強化學習,即在機器學習模型訓練時,通過試錯的方式發(fā)現(xiàn)最優(yōu)行為策略,而不是采用帶標簽的樣本學習。通常情況下,強化學習的樣本來自環(huán)境,標簽具有延遲性。近年來,深度學習成為了機器學習領域的研究熱點,作為機器學習的主要分支,推動著機器學習的理論及應用研究的發(fā)展,眾多數(shù)據(jù)驅動的人工智能應用都基于深度學習技術。2.2.2人工智能的研究領域2.群體智能優(yōu)化群體智能優(yōu)化算法是計算智能的常用算法,屬于人工智能在優(yōu)化領域的重要分支之一。群體智能算法的基本理論是模擬自然界中魚群、鳥群、蜂群以及狼群等動物群體的行為,利用群體之間的信息交流與合作,個體之間的互動達到優(yōu)化目的。1989年,杰拉爾多貝尼首次提出群體智能概念,認為群體智能是研究由大量簡單個體構成的群體系統(tǒng)的學科。與個體智能相比,群體智能算法往往沒有復雜、精妙的內部設計,但是具有更強的魯棒性、穩(wěn)定性和適應性。優(yōu)化問題是人工智能的經(jīng)典問題之一,群體智能算法是求解優(yōu)化問題的重要分支之一。與傳統(tǒng)優(yōu)化算法相比,基于仿生學的群體智能優(yōu)化算法本質上是基于概率的并行搜索算法,尋優(yōu)速度快,搜索范圍廣,不易陷入局部最優(yōu)解,往往能夠搜索到全局最優(yōu)解。2.2.2人工智能的研究領域2.群體智能優(yōu)化經(jīng)過三十余年的發(fā)展,群體智能優(yōu)化算法發(fā)展出了多個分支,包含三大經(jīng)典算法:遺傳算法是一種基于自然選擇過程機制的搜索優(yōu)化算法,基于“適者生存”的基本概念,即模擬了自然界強者傾向于適應和生存,而弱者傾向于死亡的過程。蟻群算法靈感來源于真實螞蟻的覓食行為。模擬螞蟻在搜索空間中移動時會釋放“信息素”,信息素反映了螞蟻的路徑強度,螞蟻則根據(jù)信息素的強度來選擇路徑。粒子群算法采用迭代計算群體和個體最優(yōu)位置的機制,模仿鳥類和魚群的群體行為,將群體中的個體抽象為粒子,引導粒子尋找全局最優(yōu)解。2.2.2人工智能的研究領域3.人工神經(jīng)網(wǎng)絡人工神經(jīng)網(wǎng)絡是基于生物學中神經(jīng)網(wǎng)絡的基本原理,在理解和抽象了神經(jīng)元以及外界刺激響應機制后,以網(wǎng)絡拓撲知識為理論基礎,模擬人腦神經(jīng)系統(tǒng)對復雜信息處理機制的數(shù)學模型。神經(jīng)網(wǎng)絡模型具有并行分布處理能力強、高容錯性、智能性以及自學習等特點。實際上,人工神經(jīng)網(wǎng)絡是由單個簡單元件相互連接而成的復雜網(wǎng)絡,具有高度的非線性,能夠進行復雜的邏輯操作和非線性計算,在人工智能領域具有廣泛的應用。在人工神經(jīng)網(wǎng)絡中,神經(jīng)元處理單元可以表示不同的對象,如特征、字符、概念以及抽象模式等。神經(jīng)網(wǎng)絡處理單元即為“神經(jīng)元”,主要包括輸入單元、隱含單元以及輸出單元。其中,輸入單元接受外部數(shù)據(jù)的輸入,輸出單元實現(xiàn)網(wǎng)絡結果的輸出,隱含單元在二者之間建立非線性聯(lián)系。人工神經(jīng)網(wǎng)絡的發(fā)展已經(jīng)有超過70年的歷史。表2-9給出了人工神經(jīng)網(wǎng)絡的發(fā)展中的關鍵模型。2.2.2人工智能的研究領域3.人工神經(jīng)網(wǎng)絡表2-9人工神經(jīng)網(wǎng)絡的發(fā)展時期及其關鍵模型2.2.2人工智能的研究領域4.專家系統(tǒng)專家系統(tǒng)是人工智能領域的重要研究分支,可以被看作是具有專門知識和經(jīng)驗的計算機智能系統(tǒng)。專家系統(tǒng)采用人工智能的“知識表示”以及“知識推理”技術,模擬領域專家解決復雜問題的過程,因此專家系統(tǒng)也被稱為基于知識的系統(tǒng)。不同于數(shù)據(jù)驅動的人工智能模型,專家系統(tǒng)適合于沒有數(shù)據(jù)或數(shù)據(jù)量很少的情況,在構建專家系統(tǒng)過程需具備三大要素:領域專家級知識、模擬專家思維以及達到專家級水平。經(jīng)典理論認為“專家系統(tǒng)=知識庫+推理機”,即專家系統(tǒng)需要通過一定的知識獲取方法,將專家知識存儲在知識庫中,然后運用推理機進行復雜問題的求解。按照推理規(guī)則分類,專家系統(tǒng)一般可以劃分為三個類別:2.2.2人工智能的研究領域4.專家系統(tǒng)(1)基于規(guī)則的專家系統(tǒng):此類方法是將專家所掌握的現(xiàn)有知識與經(jīng)驗,通過規(guī)則轉化方法,進行啟發(fā)式推理過程,給予明確的前提條件,專家系統(tǒng)能夠給出明確的結果。(2)基于案例的專家系統(tǒng):此類方法是通過從數(shù)據(jù)庫中檢索已經(jīng)解決的、類似的案例,通過比較新舊問題的特點和條件,總結相同點和區(qū)別,再根據(jù)現(xiàn)有知識進行推理。(3)基于人工神經(jīng)網(wǎng)絡的專家系統(tǒng):規(guī)則或案例類專家系統(tǒng)只有固定數(shù)量的專家知識,且規(guī)則的推導邏輯比較固定?;谌斯ど窠?jīng)網(wǎng)絡的專家系統(tǒng)則可以動態(tài)增加專家知識,不設置固定的推導邏輯,通過大數(shù)據(jù)訓練神經(jīng)網(wǎng)絡模型,提升專家系統(tǒng)面向復雜問題的處理能力。目前,專家系統(tǒng)已經(jīng)逐漸被機器學習、深度學習所取代,但是專家系統(tǒng)是人工智能發(fā)展過程中的重要組成部分,表2-10國內外研制的經(jīng)典專家系統(tǒng)。22..2人工智能的研究領域4.專家系統(tǒng)表2-10國內外研制的經(jīng)典專家系統(tǒng)2.2.2人工智能的研究領域5.知識圖譜知識表達在人工智能領域具有很高的重要性,在眾多知識表達方式中,知識圖譜是一種擁有極強表達能力以及靈活建模能力的語義網(wǎng)絡。首先,知識圖譜采用語義表達現(xiàn)實世界,包括對實體、概念、屬性以及之間的相關關系建模;其次,知識圖譜還衍生出了數(shù)據(jù)交換標準,其本身即為數(shù)據(jù)建模協(xié)議,包含知識抽取、知識集成、知識管理以及知識應用環(huán)節(jié)。知識圖譜實際上是一種特殊的圖數(shù)據(jù),即帶有標記的有向屬性圖,其中每個節(jié)點含有若干個屬性和屬性值,對應現(xiàn)實世界的實體或者概念。邊表示節(jié)點之間的關聯(lián)關系,邊上標記關系的類型,每條邊或屬性對應現(xiàn)實中的一條知識。知識圖譜采用了人類容易識別的字符串表示各個元素,同時采用圖數(shù)據(jù)結構也能夠輕易使用計算機處理。2.2.2人工智能的研究領域5.知識圖譜目前,各大信息檢索引擎已經(jīng)構建了全面的知識圖譜。以百度搜索為例,圖2-13給出了百度關于“大數(shù)據(jù)”的知識圖譜,從圖中可以看出,關于大數(shù)據(jù)這個實體,包含百度百科關于“大數(shù)據(jù)”詞條的解釋、《大數(shù)據(jù)》學術期刊的網(wǎng)址、大數(shù)據(jù)關聯(lián)企業(yè)“美亞柏科”、大數(shù)據(jù)關聯(lián)廣告“Statista”平臺,以及大數(shù)據(jù)相關的推薦書籍。圖2-13百度關于“大數(shù)據(jù)”的知識圖譜2.2.2人工智能的研究領域6.計算機視覺計算機視覺是利用攝像機和計算機代替人眼,模擬生物視覺構建視覺基礎功能,其主要任務是讓計算機理解圖像或識別其中的內容,并給出相應的反饋與決策,就像生物智能每天使用視覺完成日常生活一樣。在人類的視覺研究中,眼球、視網(wǎng)膜和大腦皮層組成了人類視覺系統(tǒng),為了讓計算機能夠模擬人類視覺,研究者使用“攝像頭”模擬眼球,收集圖像信息;使用“數(shù)字圖像處理技術”模擬視網(wǎng)膜,完成圖像信息的預處理;使用“計算機視覺技術”模擬大腦皮層,實現(xiàn)圖像信息的高層處理,如識別、決策等??傊嬎銠C視覺技術是人工智能的重要分支,即解決計算機如何模擬人“看”的問題。計算機視覺領域的經(jīng)典任務包括:2.2.2人工智能的研究領域6.計算機視覺(1)圖像分類:圖像分類是計算機視覺領域的基礎任務,在人工智能中具有廣泛的應用。圖像分類是用于解決“是什么”的問題,即通過標簽描述圖像中的主要內容。圖像分類的典型應用場景包括車牌號碼識別、交通燈識別、人臉識別等。(2)目標檢測:目標檢測是計算機視覺的重要任務之一,用于解決模擬人類視覺“目標在哪里”的任務。例如,給定一張含有狗的圖像,其主要任務不但需要分類出其中的目標“狗”,還需給出目標“狗”實際的位置坐標。目標檢測的典型應用場景包括姿態(tài)估計、人臉檢測、口罩檢測等。(3)圖像分割:圖像分割是計算機視覺的另一個重要任務,根據(jù)圖像的色彩、紋理和結構等特征將圖像劃分為若干個相似的區(qū)域。圖像分割適合于更為精確的目標定位、圖像語義理解和識別等任務。圖像分割的典型應用場景包括自動駕駛、衛(wèi)星成像、醫(yī)學影像等。1232.2.2人工智能的研究領域7.自然語言處理人工智能的研究領域涵蓋運算智能、感知智能、認知智能以及創(chuàng)造智能。隨著計算機視覺技術在感知智能研究中大放異彩,自然語言處理(NLP)技術則在認知智能中處于核心地位。從微觀角度,NLP技術是構建人類自然語言到計算機內部的映射;從宏觀角度,NLP技術是讓計算機擁有模擬人類所期望的語言功能。NLP技術的經(jīng)典任務包括:(1)回答問題:計算機模擬人類能夠正確回答用自然語言輸入的相關問題。(2)摘要生成:計算機能夠分析輸入的文本內容,自動生成文本含義的摘要。(3)語言釋義:計算機能夠使用不同的詞語、句型復述所輸入的文本內容信息。(4)機器翻譯:計算機自動將輸入的文本語言翻譯成另一種文本語言。2.2.2人工智能的研究領域7.自然語言處理(5)對話生成:計算機能夠根據(jù)上下文的文本內容,自動理解對話意圖并生成對話。2022年12月,OpenAI發(fā)布ChatGPT機器人聊天系統(tǒng)。ChatGPT運用最新的自然語言處理技術,將人們輸入的自然語言自動轉換為機器可以理解的指令。隨后,將這些指令輸入深度神經(jīng)網(wǎng)絡模型中,進行語音分析、對話管理和對話生成,幫助用戶解決問題、完成任務和提供服務。ChatGPT的一項重要技能是基于現(xiàn)有的上下文,自動生成語義推斷,更好地理解用戶語言。另一項優(yōu)勢則是基于完善的對話系統(tǒng),可以識別用戶語言中的意圖,并建立跟蹤用戶意圖的模型,理解用戶語言中的需求。新版的ChatGPT添加了對話生成系統(tǒng),根據(jù)用戶的意圖和上下文,通過深度神經(jīng)網(wǎng)絡模型自動生成有意義的句子,幫助ChatGPT更好地回答用戶問題,為用戶提供高效服務。2.2.2人工智能的研究領域8.語音處理語音處理是研究語音發(fā)聲過程、語音信號統(tǒng)計特性、語音的自動識別、語音機器合成以及語音感知等技術的總稱。語音處理主要包括如下三種主流任務:(1)語音識別:語音識別技術是將語音信號自動轉換為相應文本的過程。在實際應用中,語音信號經(jīng)常與自然語言理解、自然語言生成等技術相結合,成為語音及語義人工智能研究分支。語音識別過程包括特征提取、聲學模型以及語言模型構建,首先通過特征提取方法從語音信號中提取有意義的特征,然后將特征分別輸入聲學模型、語言模型,獲取相應的聲學得分和語言得分,在構建的搜索空間中尋找最佳路徑,獲取語音信號對應的文本。(2)語音合成:語音合成技術是將任意輸入的文本信息,轉換成自然流暢的語音輸出,又稱為文語轉換。該技術在銀行、醫(yī)院的信息播報系統(tǒng)、汽車導航系統(tǒng)、自動呼叫中心、智能電話客服等場景中都有廣泛應用。2.2.2人工智能的研究領域8.語音處理(3)語音轉換:語音信號中除了包含語義內容信息外,還包括說話人信息、語音場景信息等,這些信息通常是個人隱私應該受到保護。語音轉換技術是通過語音處理技術,改變語音中的說話人信息以及場景信息,使得改變后的語音信號聽起來像其他人在其他場景下發(fā)出的,在個人、背景隱私保護中具有廣泛應用。2.2.2人工智能的研究領域9.人機交互人機交互是人與計算機之間采用一定的方式進行交互,目的是完成特定任務的信息交換過程。人機交互是集認知心理學、社會工程學、多媒體、虛擬現(xiàn)實以及人工智能多個學科及前沿技術為一體的綜合學科。傳統(tǒng)的人機交互采用鍵盤、鼠標、顯示器等基礎信息交互和圖形交互,隨著人工智能技術的飛速發(fā)展,腦電圖、心電圖、眼動儀、可穿戴設備等新興技術的發(fā)展,革新了人機交互的方式,建立了語音交互、情感交互、體感交互、腦機交互以及虛擬交互等多種交互方式。人機交互具有廣泛的應用場景,以腦機交互為例,人類通過大腦直接與計算機進行信息交換,不再利用外周肌肉系統(tǒng)進行通信,又稱為腦機接口技術。2020年1月,浙江大學研究團隊在高位截癱志愿者腦內植入Utah陣列電極,實現(xiàn)了基于意念的腦機交互,控制機械手臂實現(xiàn)進食、飲水和握手等重要功能。同時,證明了高齡患者采用植入式腦機接口,能夠進行復雜、有效的人機交互,有助于患者提高生活質量。未來,基于腦機接口的人機交互技術,將對輔助運動功能、失能者功能重建、老年機能增強等多個領域產(chǎn)生積極影響。2.2.2人工智能的研究領域10.智能機器人智能機器人是集機械、電子、控制、傳感器以及人工智能多個學科及前沿技術為一體的高端裝備,是制造技術的制高點。機器人的視覺可以通過攝像頭獲取環(huán)境圖像,并通過視覺處理算法進行分析和解譯,讓機器人能夠辨識目標并確定在環(huán)境中的位置;機器人的觸覺采用觸覺傳感器獲取,主要包括接觸覺、壓力覺、滑動覺、接近覺以及溫度覺等,在機器人的精細操作中具有重要意義;機器人的聽覺采用聽覺傳感器接收聲波,并采用語音處理技術為機器人提供語音及語義交互能力;機器人的運行采用智能導航與規(guī)劃方式,其自動避障系統(tǒng)由數(shù)據(jù)庫、知識庫、機器學習以及推理機共同構成,保障機器人的安全運行;機器人的人機交互通過語言、表情、動作或者穿戴設備實現(xiàn),保障機器人與人之間自由地進行信息交流與理解??傊悄軝C器人是人工智能各個分支技術的綜合體。2.2.3人工智能的產(chǎn)業(yè)與應用1.人工智能的產(chǎn)業(yè)人工智能技術的核心產(chǎn)業(yè)包括基礎設施服務、技術服務以及產(chǎn)品服務三個方面:2.2.3人工智能的產(chǎn)業(yè)與應用基礎設施服務人工智能基礎設施服務是整個產(chǎn)業(yè)鏈的最底層,提供人工智能模型、方法和技術的算力支持,保障人工智能產(chǎn)業(yè)上層的正常運轉。基礎設施服務主要包括三類服務:智能芯片服務,尤其是深度學習成為熱點以后,GPU作為深度學習芯片進入發(fā)展快車道;智能傳感器服務,數(shù)據(jù)驅動的人工智能算法模型離不開海量的感知大數(shù)據(jù),帶動了傳感器的快速發(fā)展;智能計算框架,以Python編程為代表的經(jīng)典機器學習算法庫、深度學習算法庫,也作為基礎設施不斷發(fā)展。2.2.3人工智能的產(chǎn)業(yè)與應用技術服務人工智能技術服務關注的目標是構建人工智能技術平臺,為人工智能技術的應用提供相關的技術服務。在人工智能產(chǎn)業(yè)鏈中,智能技術服務處于關鍵位置,主要提供三類服務:技術平臺和算法模型、應用場景的解決方案、基于云計算的智能在線服務。2.2.3人工智能的產(chǎn)業(yè)與應用產(chǎn)品服務人工智能產(chǎn)品服務是將技術成果應用到實際的行業(yè),提升行業(yè)的效率。目前,我國人工智能產(chǎn)品主要應用到四大行業(yè),分別是視覺人工智能、語音及語義人工智能、人工智能機器人以及決策類人工智能。表2-11給出了四大行業(yè)的典型人工智能應用產(chǎn)品。如今,人工智能借助于學科發(fā)展、科學建模、技術創(chuàng)新以及軟硬件驅動,將進一步引導我國的各行業(yè)由信息化向智能化轉變。圖2-14給出了2017年至2022年中國人工智能行業(yè)市場規(guī)模預測趨勢圖。2.2.3人工智能的產(chǎn)業(yè)與應用產(chǎn)品服務圖2-142017年至2022年中國人工智能行業(yè)市場規(guī)模預測趨勢圖數(shù)據(jù)來源:中商產(chǎn)業(yè)研究院,2022年2.2.3人工智能的產(chǎn)業(yè)與應用產(chǎn)品服務表2-11四大行業(yè)的典型人工智能應用產(chǎn)品2.2.3人工智能的產(chǎn)業(yè)與應用產(chǎn)品服務統(tǒng)計數(shù)據(jù)表明,2021年我國人工智能行業(yè)市場規(guī)模達到1987億元,從2017年至2021年,人工智能市場規(guī)模年均復合增長率為58.1%。人工智能技術正在逐年突破創(chuàng)新,大量新的應用場景有待開發(fā),預計2022年我國人工智能行業(yè)市場規(guī)模達到2845億元。同時,圖2-15給出了2021年我國人工智能行業(yè)細分市場占比統(tǒng)計。在人工智能行業(yè)的四大類別中,視覺人工智能的占比最多,達到43.3%。緊隨其后的分別是決策類人工智能、語音及語義人工智能和人工智能機器人,市場占比分別是23.7%、18.1%和14.8%。2.2.3人工智能的產(chǎn)業(yè)與應用產(chǎn)品服務圖2-152021年我國人工智能行業(yè)細分市場占比統(tǒng)計數(shù)據(jù)來源:中商產(chǎn)業(yè)研究院,2022年2.2.3人工智能的產(chǎn)業(yè)與應用2.人工智能的應用人工智能技術的飛速發(fā)展不斷革新、重塑各個行業(yè)。當前,人工智能技術已經(jīng)被廣泛應用于智能安防、智能零售、智能醫(yī)療、智能交通等行業(yè)。下面,從兩大國內新興的人工智能技術公司介紹人工智能技術在國內的主流應用?!景咐?-5】曠視科技:Face++人工智能開放平臺。
曠視科技創(chuàng)立于2011年,是一個人工智能產(chǎn)品和解決方案品牌,以深度學習為核心競爭力,融合算法、算力和數(shù)據(jù),打造“三位一體”的新一代人工智能生產(chǎn)力平臺。Face++是曠視科技2012年開發(fā)的首個人臉識別云平臺。在隨后的4年時間里,數(shù)以萬計的用戶使用Face++提供的人臉識別API或SDK,使得“Face++”逐漸成為人臉識別領域最具影響力的品牌。隨著曠視科技在計算機視覺中的不斷探索,于2016年推出了全新的“Face++人工智能開發(fā)平臺”,為視覺人工智能領域提供成熟的解決方案和最新的算法模型。如今,F(xiàn)ace++云平臺成為了國內頂級的視覺人工智能開放平臺,為開發(fā)者提供人臉、人體、文字、圖像各類識別服務。具體業(yè)務包括:2.2.3人工智能的產(chǎn)業(yè)與應用2.人工智能的應用(1)人臉識別:提供人臉屬性檢測、比對、搜索、關鍵點檢測能力,支持膚質檢測、面部特征識別等不同場景下的人臉應用。(2)人像處理:提供人臉融合、人臉美型美顏、濾鏡貼紙等能力,滿足多種營銷應用場景。基于高精度人臉關鍵點檢測,使得人像處理效果真實自然,構建了貼合臉型的智能美顏。(3)人體識別:提供人體屬性識別、骨骼關鍵點檢測等功能模塊,支持人體摳圖、手勢識別等多個人體識別應用場景,適應人體重疊等復雜場景的識別,包含各種人體姿態(tài)識別。(4)文字識別:提供身份證、駕駛證、行駛證等卡證識別服務,支持各類票據(jù)、文書、卡證等普適的格式化文本識別,適應復雜場景的文本能識別,也提供靈活定制的文字識別目標。(5)圖像識別:提供車牌識別、犬鼻紋識別、場景與物體識別等特定場景圖像識別任務,支持定制化業(yè)務模式,識別模型適應復雜識別場景。22..3人工智能的產(chǎn)業(yè)與應用2.人工智能的應用【案例2-6】科大訊飛:語音及語義人工智能開放平臺。
科大訊飛成立于1999年,來自中國科學技術大學學生創(chuàng)業(yè)團隊。自成立以來,長期從事語音及語義、自然語言理解、機器學習推理及自主學習等核心技術研究,并處于國際前沿技術水平。2014年,公司正式啟動“訊飛超腦計劃”,研發(fā)基于類人神經(jīng)網(wǎng)絡的認知智能系統(tǒng)。22016年,發(fā)布“訊飛翻譯機”,開創(chuàng)智能消費新品類。2018年,機器翻譯系統(tǒng)首次達到專業(yè)翻譯員水平。
訊飛開放平臺1.0版本于2010年正式上線,集成了語音合成、語音搜索、自然語言理解和語音聽寫等功能模塊,此時期平臺的商業(yè)模式主要是提供人工智能單項能力的解決方案。2.2.3人工智能的產(chǎn)業(yè)與應用2.人工智能的應用2021年,訊飛開放平臺升級到2.0版本,其功能模塊由二維變成了三維,開放平臺將由訊飛和頭部垂直行業(yè)公司共同打造,面向行業(yè)場景賦能開發(fā)者。其中,訊飛開放平臺提供人工智能模型、云計算平臺以及深度神經(jīng)網(wǎng)絡訓練算法;行業(yè)龍頭提供應用場景、專家知識以及業(yè)務模型;開發(fā)者基于現(xiàn)有技術和資源,進一步完善場景,開展各類人工智能流程開發(fā),形成具體的行業(yè)解決方案。如今,科大訊飛開放平臺2.0版本將聚焦18個行業(yè),長期布局人工智能賽道??拼笥嶏w開放平臺的核心業(yè)務模塊聚焦語音及語義人工智能,主要包括:(1)語音識別:提供語音聽寫、語音撰寫、實時語音轉寫、離線語音聽寫、語音喚醒、離線命令詞識別等功能,主要是將語音信號轉化為文字,實現(xiàn)語音向文字的轉化。2.2.3人工智能的產(chǎn)業(yè)與應用2.人工智能的應用1(2)語音合成:提供在線語音合成、離線語音合成、音庫定制、有聲閱讀等功能,主要是將文字轉化為語音信號,支持定制自己的語音特點,并應用至有聲閱讀等應用場景。2(3)語音分析:提供語音評測、性別年齡識別、聲紋識別、歌曲識別等功能,主要是針對特定人的語音,進行語音信號的分析與識別。3(4)多語種技術:提供多語種識別、多語種合成、多語種翻譯、多語種文字識別等功能,主要是對各種特殊語種的語音識別、翻譯以及合成等功能。4(5)自然語言處理:提供詞法分析、依存句法分析、語義依存分析、語義角色標注、情感分析等功能,主要是自然語言處理的基礎功能,基于此可以構建更多基于自然語言處理的上層場景應用。2.2.3人工智能的產(chǎn)業(yè)與應用2.人工智能的應用根據(jù)科大訊飛的人工智能戰(zhàn)略布局,未來每年要在語音及語義人工智能開放平臺投入5億研發(fā)基金,并聯(lián)合超過百萬的合作伙伴,打造全新的人工智能解決方案,共同拓展數(shù)字化市場。根據(jù)科大訊飛的財報顯示,語音及語義人工智能開放平臺是科大訊飛的核心業(yè)務之一,2020年貢獻超過19億元收入,占據(jù)公司營收的15%。2021年上半年的平臺收入近13億元,同比增幅超過130%。2020年至2021年,科大訊飛開放平臺開發(fā)者數(shù)量增至265萬,同比增長69%。2021年開始,科大訊飛提出了人工智能產(chǎn)業(yè)的奮斗目標:達到十億用戶、實現(xiàn)千億收入、帶動萬億產(chǎn)業(yè)生態(tài)、成為中國人工智能產(chǎn)業(yè)領導者。2.2.4人工智能與大數(shù)據(jù)的關系人工智能和大數(shù)據(jù)是如今信息行業(yè)的熱門技術。根據(jù)上述介紹,我們知道人工智能技術的發(fā)展早于大數(shù)據(jù)技術,人工智能技術于20世紀50年代伴隨著計算機技術發(fā)展,大數(shù)據(jù)技術則伴隨計算機高速存儲、快速計算能力的形成,于2010年左右開始受到重視圖2-16給出了“人工智能”和“大數(shù)據(jù)”關鍵詞的百度指數(shù),從指數(shù)對比可以看出,從2013年開始,大數(shù)據(jù)的搜索指數(shù)追上人工智能;2014年到2017年,大數(shù)據(jù)的搜索指數(shù)在多數(shù)情況高于人工智能,人工智能在某些特殊特點事件呈現(xiàn)較高的峰值;2018年至今,由于AlphaGo采用深度學習擊敗圍棋世界冠軍,讓人工智能的搜索指數(shù)在近幾年超過大數(shù)據(jù)。其中,2019年3月至4月,國民短暫的關注了“大數(shù)據(jù)殺熟”問題,因此在該時期出現(xiàn)大數(shù)據(jù)搜索較高的峰值情況。綜合來看,近十年來,人工智能和大數(shù)據(jù)之間的搜索指數(shù)幾乎具有相似的規(guī)律,表明了二者之間具有密切的關聯(lián)關系。2.2.4人工智能與大數(shù)據(jù)的關系圖2-16“人工智能”和“大數(shù)據(jù)”關鍵詞的百度指數(shù)2.2.4人工智能與大數(shù)據(jù)的關系1.人工智能與大數(shù)據(jù)之間的聯(lián)系在過去,由于數(shù)據(jù)的稀缺和較高的存儲成本,人工智能方法往往采用理論驅動或模型驅動,尤其是機器學習方法一般基于概率論、群體智能算法一般基于生物學模型。然而,隨著大數(shù)據(jù)時代的到來,為人工智能的方法、模型和系統(tǒng)提供了海量的大數(shù)據(jù)支撐,提升了人工智能的發(fā)展速度,尤其是以深度學習為代表的“數(shù)據(jù)驅動型模型”,通過海量的大數(shù)據(jù)訓練深度學習模型,在人工智能各個領域得到了廣泛應用。另一方面,大數(shù)據(jù)技術提供的分布式計算思維,還能夠拓展人工智能方法和模型,提升效率。因此,大數(shù)據(jù)技術為人工智能的騰飛做出了巨大貢獻。2.2.4人工智能與
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度智能旅游服務提供商與高品質酒店深度合作框架協(xié)議4篇
- 2025年度寵物繁殖基地合作協(xié)議模板4篇
- 2025年度多功能圍墻施工與智慧城市合同4篇
- 二零二五年度中小企業(yè)會計代理合作協(xié)議4篇
- 二零二五年度新能源汽車充電車位預訂合同4篇
- 2025年度環(huán)保產(chǎn)業(yè)承債式股權轉讓協(xié)議范本4篇
- 2025年度老舊小區(qū)綜合改造裝修工程合同4篇
- 2025年度農(nóng)業(yè)機械租賃合同車輛作為抵押的農(nóng)業(yè)設備融資租賃協(xié)議4篇
- 2025年度打樁工程保險合同標準范本4篇
- 二零二五版門診中醫(yī)診療服務承包經(jīng)營合同4篇
- 定額〔2025〕1號文-關于發(fā)布2018版電力建設工程概預算定額2024年度價格水平調整的通知
- 公共政策學-陳振明課件
- SHSG0522023年石油化工裝置工藝設計包(成套技術)內容規(guī)定
- 《運營管理》案例庫
- 醫(yī)院安全保衛(wèi)部署方案和管理制度
- 我的自我針灸記錄摘錄
- 中醫(yī)學-五臟-心-課件
- 《駱駝祥子》閱讀記錄卡
- 教育學原理完整版課件全套ppt教程(最新)
- 醫(yī)療安全不良事件報告培訓PPT培訓課件
- 膽管癌的護理查房
評論
0/150
提交評論