有關(guān)容器的六大誤區(qū)和八大正確場景_第1頁
有關(guān)容器的六大誤區(qū)和八大正確場景_第2頁
有關(guān)容器的六大誤區(qū)和八大正確場景_第3頁
有關(guān)容器的六大誤區(qū)和八大正確場景_第4頁
有關(guān)容器的六大誤區(qū)和八大正確場景_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 有關(guān)容器的六大誤區(qū)和八大正確場景 做容器的研究和容器化幾年了,從最初對于容器的初步認識,到積攢了大量的容器遷移經(jīng)驗,并和客戶解釋了容器技術(shù)之后,發(fā)現(xiàn)原來對于容器的理解有大量的誤解,而且容器并非虛擬機的替代,而是有十分具體的應(yīng)用場景的。第一部分:容器的理解誤區(qū)誤區(qū)一:容器啟動速度快,秒級啟動這是很多人布道容器的時候經(jīng)常說的一句話,往往人們會啟動一個nginx之類的應(yīng)用,的確很快就能夠啟動起來了。容器為啥啟動快,一是沒有內(nèi)核,二是鏡像比較小。然而容器是有主進程的,也即Entrypoint,只有主進程完全啟動起來了,容器才算真正的啟動起來,一個比喻是容器更像人的衣服,人站起來了,衣服才站起來,人躺

2、下了,衣服也躺下了。衣服有一定的隔離性,但是隔離性沒那么好。衣服沒有根(內(nèi)核),但是衣服可以隨著人到處走。所以按照一個nginx來評判一個容器的啟動速度有意義么?對于Java應(yīng)用,里面安裝的是tomcat,而tomcat的啟動,加載war,并且真正的應(yīng)用啟動起來,如果你盯著tomcat的日志看的話,還是需要一些時間的,根本不是秒級。如果應(yīng)用啟動起來要一兩分鐘,僅僅談容器的秒級啟動是沒有意義的。現(xiàn)在OpenStack中的VM的啟動速度也優(yōu)化的越來越快了,啟動一個VM的時候,原來需要從Glance下載虛擬機鏡像,后來有了一個技術(shù),是的Glance和系統(tǒng)盤共享Ceph存儲的情況下,虛擬機鏡像無需下載

3、,啟動速度就快很多。而且容器之所以啟動速度快,往往建議使用一個非常小的鏡像,例如alpine,里面很多東西都裁剪掉了,啟動的速度就更快了。OpenStack的虛擬機鏡像也可以經(jīng)過大量的裁剪,實現(xiàn)快速的啟動我們可以精細的衡量虛擬機啟動的每一個步驟,裁剪掉相應(yīng)的模塊和啟動的過程,大大降低虛擬機的啟動時間。例如在UnitedStack的一篇博客里面:/blog/build-block-storage-service,我們可以看到這樣的實現(xiàn)和描述“使用原生的OpenStack創(chuàng)建虛擬機需要13分鐘,而使用改造后的OpenStack僅需要不到10秒鐘時間。這是因為nova-compute不再需要通過HT

4、TP下載整個鏡像,虛擬機可以通過直接讀取Ceph中的鏡像數(shù)據(jù)進行啟動?!彼詫τ谔摂M機的整體啟動時間,現(xiàn)在優(yōu)化的不錯的情況下,一般能夠做到十幾秒到半分鐘以內(nèi)。這個時間和Tomcat的啟動時間相比較,其實不算是負擔(dān),和容器的啟動速度相比,沒有質(zhì)的差別,可能有人會說啟動速度快一點也是快,尤其是對于在線環(huán)境的掛掉自修復(fù)來講,不是分秒必爭么?關(guān)于自修復(fù)的問題,我們下面另外說。然而虛擬機有一個好處,就是隔離性好,如果容器是衣服,虛擬機就是房子,房子立在那里,里面的人無論站著還是躺著,房子總是站著的,房子也不會跟著人走。使用虛擬機就像人們住在公寓里面一樣,每人一間,互補干擾,使用容器像大家穿著衣服擠在公交

5、車里面,看似隔離,誰把公交弄壞了,誰都走不了。綜上所述,容器的啟動速度不足以構(gòu)成對OpenStack虛擬機的明顯優(yōu)勢,然而虛擬機的隔離性,則秒殺容器。誤區(qū)二:容器輕量級,每個主機會運行成百上千個容器很多人會做實驗,甚至?xí)蛻粽f,容器平臺多么多么牛,你看我們一臺機器上可以運行成百上千個容器,虛擬機根本做不到這一點。但是一個機器運行成百上千個容器,有這種真實的應(yīng)用場景么?對于容器來講,重要的是里面的應(yīng)用,應(yīng)用的核心在于穩(wěn)定性和高并發(fā)支撐,而不在于密度。我在很多演講的會議上遇到了很多知名的處理雙十一和618的講師,普遍反饋當(dāng)前的Java應(yīng)用基本上4核8G是標配,如果遇見容量不足的情況,少部分通過縱

6、向擴容的方式進行,大部分采用橫向擴容的方式進行。如果4核8G是標配,不到20個服務(wù)就可以占滿一臺物理服務(wù)器,一臺機器跑成百上千個nginx有意思么? 這不是一個嚴肅的使用場景。當(dāng)然現(xiàn)在有一個很火的Serverless無服務(wù)架構(gòu),在無服務(wù)器架構(gòu)中,所有自定義代碼作為孤立的、獨立的、常常細粒度的函數(shù)來編寫和執(zhí)行,這些函數(shù)在例如AWS Lambda之類的無狀態(tài)計算服務(wù)中運行。這些計算服務(wù)可以是虛擬機,也可以是容器。對于無狀態(tài)的函數(shù)來講,需要快速的創(chuàng)建可刪除,而且很可能執(zhí)行一個函數(shù)的時間本身就非常短,在這種情況下容器相比于虛擬機還是有一定優(yōu)勢的。目前無服務(wù)架構(gòu)比較適用于運行一些任務(wù)型批量操作,利用進程

7、級別的橫向彈性能力來抵消進程創(chuàng)建和銷毀帶來的較大的代價。在spark和mesos的集成中,有一個Fine-Grained模式,同通常大數(shù)據(jù)的執(zhí)行的時候,任務(wù)的執(zhí)行進程早就申請好了資源,等在那里分配資源不同,這種模式是當(dāng)任務(wù)分配到的時候才分配資源,好處就是對于資源的彈性申請和釋放的能力,壞處是進程的創(chuàng)建和銷毀還是粒度太大,所以這種模式下spark運行的性能會差一些。spark的這種做法思想類似無服務(wù)架構(gòu),你會發(fā)現(xiàn)我們原來學(xué)操作系統(tǒng)的時候,說進程粒度太大,每次都創(chuàng)建和銷毀進程會速度太慢,為了高并發(fā),后來有了線程,線程的創(chuàng)建和銷毀輕量級的多,當(dāng)然還是覺得慢,于是有了線程池,事先創(chuàng)建在了那里,用的時候

8、不用現(xiàn)創(chuàng)建,不用的時候交回去就行,后來還是覺得慢,因為線程的創(chuàng)建也需要在內(nèi)核中完成,所以后來有了協(xié)程,全部在用戶態(tài)進行線程切換,例如AKKA,Go都使用了協(xié)程,你會發(fā)現(xiàn)趨勢是為了高并發(fā),粒度是越來越細的,現(xiàn)在很多情況又需要進程級別的,有種風(fēng)水輪流轉(zhuǎn)的感覺。誤區(qū)三:容器有鏡像,可以保持版本號,可以升級和回滾容器有兩個特性,一個是封裝,一個是標準。有了容器鏡像,就可以將應(yīng)用的各種配置,文件路徑,權(quán)限封裝起來,然后像孫悟空說“定”,就定在了封裝好的那一刻。鏡像是標準的,無論在哪個容器運行環(huán)境,將同樣的鏡像運行起來,都能還原當(dāng)時的那一刻。容器的鏡像還有版本號,我們可以根據(jù)容器的版本號進行升級,一旦升級

9、有錯,可以根據(jù)版本號進行回滾,回滾完畢則能夠保證容器內(nèi)部還是原來的狀態(tài)。但是OpenStack虛擬機也是有鏡像的,虛擬機鏡像也是可以打snapshot的,打snapshot的時候,也會保存當(dāng)時的那一刻所有的狀態(tài),而且snapshot也可以有版本號,也可以升級和回滾。似乎容器有的這些特性O(shè)penStack虛擬機都有,二者有什么不同呢?虛擬機鏡像大,而容器鏡像小。虛擬機鏡像動不動就幾十個G甚至上百G,而容器鏡像多幾百M。虛擬機鏡像不適合跨環(huán)境遷移。例如開發(fā)環(huán)境在本地,測試環(huán)境在一個OpenStack上,開發(fā)環(huán)境在另一個OpenStack上,虛擬機的鏡像的遷移非常困難,需要拷貝非常大的文件。而容器就

10、好的多,因為鏡像小,可以很快的從不同的環(huán)境之間遷移。虛擬機鏡像不適合跨云遷移。當(dāng)前沒有一個公有云平臺支持虛擬機鏡像的下載和上傳(安全的原因,盜版的原因),因而一個鏡像在不同的云之間,或者同一個云不同的region直接,無法進行遷移,只能重新做一個鏡像,這樣環(huán)境的一致性就得不到保障。而容器的鏡像中心是獨立于云之外的,只要能夠連上鏡像中心,到哪個云上都可以下載,并且因為鏡像小,下載速度快,并且鏡像是分層的,每次只需要下載差異的部分。OpenStack對于鏡像方面的優(yōu)化,基本上還是在一個云里面起作用,一旦跨多個環(huán)境,鏡像方便的多。誤區(qū)四:容器可以使用容器平臺管理自動重啟實現(xiàn)自修復(fù)容器的自修復(fù)功能是經(jīng)

11、常被吹噓的。因為容器是衣服,人躺下了,衣服也躺下了,容器平臺能夠馬上發(fā)現(xiàn)人躺下了,于是可以迅速將人重新喚醒工作。而虛擬機是房子,人躺下了,房子還站著,因而虛擬機管理平臺不知道里面的人能不能工作,所以容器掛了會被自動重啟,而虛擬機里面的應(yīng)用掛了,只要虛擬機不掛,很可能沒人知道。這些說法都沒錯,但是人們慢慢發(fā)現(xiàn)了另外的場景,就是容器里面的應(yīng)用沒有掛,所以容器看起來還啟動著,但是應(yīng)用以及不工作沒有反應(yīng)了。當(dāng)啟動容器的時候,雖然容器的狀態(tài)起來了,但是里面的應(yīng)用還需要一段時間才能提供服務(wù)。所以針對這種場景,容器平臺會提供對于容器里面應(yīng)用的health check,不光看容器在不在,還要看里面的應(yīng)用能不能

12、用,如果不能,可自動重啟。一旦引入了health check,和虛擬機的差別也不大了,因為有了health check,虛擬機也能看里面的應(yīng)用是否工作了,不工作也可以重啟應(yīng)用。還要就是容器的啟動速度快,秒級啟動,如果能夠自動重啟修復(fù),那就是秒級修復(fù),所以應(yīng)用更加高可用。這個觀點當(dāng)然不正確,應(yīng)用的高可用性和重啟的速度沒有直接關(guān)系。高可用性一定要通過多個副本來實現(xiàn),在任何一個掛掉之后,不能通過這一個應(yīng)用快速重啟來解決,而是應(yīng)該靠掛掉的期間,其他的副本馬上把任務(wù)接過來進行解決。虛擬機和容器都可以有多副本,在有多個副本的情況下,重啟是一秒還是20秒,就沒那么重要了,重要的是掛掉的這段時間內(nèi),程序做了什

13、么,如果程序做的是無關(guān)緊要的操作,那么掛了20秒,也沒啥關(guān)系,如果程序正在進行一個交易和支付,那掛掉一秒也不行,也必須能夠修復(fù)回來。所以應(yīng)用的高可用性要靠應(yīng)用層的重試,冪等去解決,而不應(yīng)該靠基礎(chǔ)設(shè)施層重啟的快不快來解決。對于無狀態(tài)服務(wù),在做好重試的機制的情況下,通過自動重啟修復(fù)是沒有問題的,因為無狀態(tài)的服務(wù)不會保存非常重要的操作。對于有狀態(tài)服務(wù),容器的重啟不但不是推薦的,而且可能是災(zāi)難的開始。一個服務(wù)有狀態(tài),例如數(shù)據(jù)庫,在高并發(fā)場景下,一旦掛了,哪怕只有一秒,我們必須要弄清楚這一秒都發(fā)生了什么,哪些數(shù)據(jù)保存了,哪些數(shù)據(jù)丟了,而不能盲目的重啟,否則會很可能造成數(shù)據(jù)的不一致性,后期修都沒法修。例如

14、高頻交易下的數(shù)據(jù)庫掛了,按說DBA應(yīng)該嚴格審核丟了哪些數(shù)據(jù),而不是在DBA不知情的情況下,盲目的重啟了,DBA還覺得沒什么事情發(fā)生,最終很久才能發(fā)現(xiàn)問題。所以容器比較適合部署無狀態(tài)服務(wù)的,隨便重啟都可以。而容器部署有狀態(tài)容器不是不能,而是要非常小心,甚至都是不推薦的。雖然很多的容器平臺都支持有狀態(tài)容器,然而平臺往往解決不了數(shù)據(jù)問題,除非你對容器里面的應(yīng)用非常非常非常熟悉,當(dāng)容器掛了,你能夠準確的知道丟了哪些,哪些要緊,哪些不要緊,而且要寫代碼處理這些情況,然后才能支持重啟。網(wǎng)易這面的數(shù)據(jù)庫主備同步的情況下,是通過修改mysql源代碼,保證主備之間數(shù)據(jù)完全同步,才敢在主掛了的情況下,備自動切換主

15、。而宣傳有狀態(tài)容器的自動重啟,對于服務(wù)客戶來講是很不經(jīng)濟的行為,因為客戶往往沒有那么清楚應(yīng)用的邏輯,甚至應(yīng)用都是買的,如果使用有狀態(tài)容器,任憑自動重啟,最終客戶發(fā)現(xiàn)數(shù)據(jù)丟失的時候,還是會怪到你的頭上。所以有狀態(tài)的服務(wù)自動重啟不是不可用,需要足夠?qū)I(yè)才行。誤區(qū)五:容器可以使用容器平臺進行服務(wù)發(fā)現(xiàn)容器平臺swarm, kubernetes,mesos都是支持服務(wù)發(fā)現(xiàn)的,當(dāng)一個服務(wù)訪問另一個服務(wù),都會有服務(wù)名轉(zhuǎn)化為VIP,然后訪問具體的容器。然而人們會發(fā)現(xiàn),基于Java寫的應(yīng)用,服務(wù)之間的調(diào)用多不會用容器平臺的服務(wù)發(fā)現(xiàn),而是用Dubbo或者spring cloud的服務(wù)發(fā)現(xiàn)。因為容器平臺層的服務(wù)發(fā)現(xiàn)

16、,還是做的比較基礎(chǔ),基本是一個域名映射的過程,對于熔斷,限流,降級都沒有很好的支持,然而既然使用服務(wù)發(fā)現(xiàn),還是希望服務(wù)發(fā)現(xiàn)中間件能夠做到這一點,因而服務(wù)之間的服務(wù)發(fā)現(xiàn)之間使用容器平臺的少,越是需要高并發(fā)的應(yīng)用,越是如此。那容器平臺的服務(wù)發(fā)現(xiàn)沒有用了么?不是,慢慢你會發(fā)現(xiàn),內(nèi)部的服務(wù)發(fā)現(xiàn)是一方面,這些Dubbo和spring cloud能夠搞定,而外部的服務(wù)發(fā)現(xiàn)就不同了,比如訪問數(shù)據(jù)庫,緩存等,到底是應(yīng)該配置一個數(shù)據(jù)庫服務(wù)的名稱,還是IP地址呢?如果使用IP地址,會造成配置十分復(fù)雜,因為很多應(yīng)用配置之所以復(fù)雜,就是依賴了太多的外部應(yīng)用,也是最難管理的一方面。如果有了外部的服務(wù)發(fā)現(xiàn),配置就會簡單很

17、多,也只需要配置外部服務(wù)的名稱就可以了,如果外部服務(wù)地址變了,可以很靈活的改變外部的服務(wù)發(fā)現(xiàn)。誤區(qū)六:容器可以基于鏡像進行彈性伸縮在容器平臺上,容器有副本數(shù)的,只要將副本數(shù)從5改到10,容器就基于鏡像進行了彈性伸縮。其實這一點虛擬機也能做到,AWS的Autoscaling就是基于虛擬機鏡像的,如果在同一個云里面,就沒有區(qū)別。當(dāng)然如果跨云無狀態(tài)容器的彈性伸縮,容器方便很多,可以實現(xiàn)混合云模式,當(dāng)高并發(fā)場景下,將無狀態(tài)容器擴容到公有云,這一點虛擬機是做不到的。容器理解誤區(qū)總結(jié)如圖,左面是經(jīng)常掛在嘴邊的所謂容器的優(yōu)勢,但是虛擬機都能一一懟回去。如果部署的是一個傳統(tǒng)的應(yīng)用,這個應(yīng)用啟動速度慢,進程數(shù)量

18、少,基本不更新,那么虛擬機完全能夠滿足需求。應(yīng)用啟動慢:應(yīng)用啟動15分鐘,容器本身秒級,虛擬機很多平臺能優(yōu)化到十幾秒,兩者幾乎看不出差別內(nèi)存占用大:動不動32G,64G內(nèi)存,一臺機器跑不了幾個?;静桓拢喊肽旮乱淮危摂M機鏡像照樣能夠升級和回滾應(yīng)用有狀態(tài):停機會丟數(shù)據(jù),如果不知道丟了啥,就算秒級啟動有啥用,照樣恢復(fù)不了,而且還有可能因為丟數(shù)據(jù),在沒有修復(fù)的情況下,盲目重啟帶來數(shù)據(jù)混亂。進程數(shù)量少:兩三個進程相互配置一下,不用服務(wù)發(fā)現(xiàn),配置不麻煩如果是一個傳統(tǒng)應(yīng)用,根本沒有必要花費精去容器化,因為白花了力氣,享受不到好處。第二部分:容器化,微服務(wù),DevOps三位一體什么情況下,才應(yīng)該考慮做

19、一些改變呢?傳統(tǒng)業(yè)務(wù)突然被互聯(lián)網(wǎng)業(yè)務(wù)沖擊了,應(yīng)用老是變,三天兩頭要更新,而且流量增大了,原來支付系統(tǒng)是取錢刷卡的,現(xiàn)在要互聯(lián)網(wǎng)支付了,流量擴大了N倍。沒辦法,一個字:拆拆開了,每個子模塊獨自變化,少相互影響。拆開了,原來一個進程扛流量,現(xiàn)在多個進程一起扛。所以稱為微服務(wù)。微服務(wù)場景下,進程多,更新快,于是出現(xiàn)100個進程,每天一個鏡像。容器樂了,每個容器鏡像小,沒啥問題,虛擬機哭了,因為虛擬機每個鏡像太大了。所以微服務(wù)場景下,可以開始考慮用容器了。虛擬機怒了,老子不用容器了,微服務(wù)拆分之后,用Ansible自動部署是一樣的。這樣說從技術(shù)角度來講沒有任何問題。然而問題是從組織角度出現(xiàn)的。一般的公

20、司,開發(fā)會比運維多的多,開發(fā)寫完代碼就不用管了,環(huán)境的部署完全是運維負責(zé),運維為了自動化,寫Ansible腳本來解決問題。然而這么多進程,又拆又合并的,更新這么快,配置總是變,Ansible腳本也要常改,每天都上線,不得累死運維。所以這如此大的工作量情況下,運維很容易出錯,哪怕通過自動化腳本。這個時候,容器就可以作為一個非常好的工具運用起來。除了容器從技術(shù)角度,能夠使得大部分的內(nèi)部配置可以放在鏡像里面之外,更重要的是從流程角度,將環(huán)境配置這件事情,往前推了,推到了開發(fā)這里,要求開發(fā)完畢之后,就需要考慮環(huán)境部署的問題,而不能當(dāng)甩手掌柜。這樣做的好處就是,雖然進程多,配置變化多,更新頻繁,但是對于

21、某個模塊的開發(fā)團隊來講,這個量是很小的,因為5-10個人專門維護這個模塊的配置和更新,不容易出錯。如果這些工作量全交給少數(shù)的運維團隊,不但信息傳遞會使得環(huán)境配置不一致,部署量會大非常多。容器是一個非常好的工具,就是讓每個開發(fā)僅僅多做5%的工作,就能夠節(jié)約運維200%的工作,并且不容易出錯。然而本來原來運維該做的事情開發(fā)做了,開發(fā)的老大愿意么?開發(fā)的老大會投訴運維的老大么?這就不是技術(shù)問題了,其實這就是DevOps,DevOps不是不區(qū)分開發(fā)和運維,而是公司從組織到流程,能夠打通,看如何合作,邊界如何劃分,對系統(tǒng)的穩(wěn)定性更有好處。所以微服務(wù),DevOps,容器是相輔相成,不可分割的。不是微服務(wù),根本不需要容器,虛擬機就能搞定,不需要DevOps,一年部署一次,開發(fā)和運維溝通再慢都能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論