版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
跨入新的計(jì)算時(shí)代——GPU超算技術(shù)的發(fā)展及應(yīng)用1“快”...僅僅只是"快"嗎?如果提高2~3倍,那只是"快“多作一些事、少等一會(huì)兒不會(huì)改變你的工作模式如果提高10倍以上,那是個(gè)"重大的改變“是否值得升級(jí)?是否考慮改寫部分應(yīng)用軟件?如果...提高"100倍"以上,那可是種"顛覆""守住舊系統(tǒng)"將面臨淘汰的命運(yùn)值得更換應(yīng)用平臺(tái),值得重新架構(gòu)應(yīng)用軟件(并行運(yùn)算)"創(chuàng)新"將被重新定義,許多過去認(rèn)為不可能的應(yīng)用,都將實(shí)現(xiàn)2開場:小蝦米挑戰(zhàn)大鯨魚小蝦米:1萬美金的GPU臺(tái)式計(jì)算機(jī)挑戰(zhàn)大鯨魚:CalcUA的五百萬美金256CPUNodes(512cores)超級(jí)Cluster運(yùn)算3比賽:斷層掃瞄影像重建時(shí)間1萬美金的GPU臺(tái)式計(jì)算機(jī)超過五百萬美金512cores超級(jí)Cluster67.4秒59.9秒小蝦米勝出55606570Source:UniversityofAntwerp,Beigium
4更多的挑戰(zhàn)結(jié)果--科研領(lǐng)域ComputationalChemistry化學(xué)模擬NeurologicalModeling神經(jīng)模型CellphoneSimulation電磁模擬3DCTUltrasound斷層掃瞄245倍130倍37倍11倍4.6天2.7天8小時(shí)3小時(shí)27分30分13分16分5GPU的廣泛應(yīng)用6更多的挑戰(zhàn)成果......數(shù)百倍的提速7更多的挑戰(zhàn)成果......數(shù)百倍的提速8GPU開發(fā)平臺(tái)9GPU加速處理器+并行運(yùn)算
的強(qiáng)大優(yōu)勢10二萬美金的GPU工作站高級(jí)PC臺(tái)式機(jī),加4片GPU卡(右圖)每片GPU卡提供448個(gè)運(yùn)算核,一套GPU工作站具備1792個(gè)運(yùn)算核小蝦米的秘密:GPU+并行運(yùn)算實(shí)現(xiàn)『并行運(yùn)算』架構(gòu),提升速度達(dá)百倍以上(與“串行運(yùn)算”比較)GPU關(guān)鍵元件主要供應(yīng)商N(yùn)VIDIA11GPU計(jì)算優(yōu)勢1:大量運(yùn)算核(ALU)DRAMGPU
架構(gòu)示意圖大量ALUCacheALUControlALUALUALUDRAMCPU架構(gòu)示意圖主頻匯流排內(nèi)存帶寬12GPU計(jì)算優(yōu)勢2:輕易實(shí)現(xiàn)"并行運(yùn)算"GPU是天然的并行計(jì)算設(shè)備(大量ALU)透過CUDA輕易容易實(shí)現(xiàn)并行運(yùn)算支持C/C++、Fortran、Matlab等語言擴(kuò)充性與延展性強(qiáng)Load/storeGlobalMemoryThreadExecutionManagerInputAssemblerHostTextureTextureTextureTextureTextureTextureTextureTextureTextureParallelData
CacheParallelData
CacheParallelData
CacheParallelData
CacheParallelData
CacheParallelData
CacheParallelData
CacheParallelData
CacheLoad/storeLoad/storeLoad/storeLoad/storeLoad/store13GPU計(jì)算優(yōu)勢3:浮點(diǎn)運(yùn)算速度14GPU方案超優(yōu)異"性價(jià)比"(16倍)純CPU方案4cores/臺(tái)單臺(tái)速度:0.07Teraflop/臺(tái)單臺(tái)價(jià)格:40,000人民幣/臺(tái)單臺(tái)功耗:400W/臺(tái)共需1429臺(tái)CPUservers總成本:人民幣5716
萬總耗電:571KW(GPU+CPU)方案1792cores/套單套速度:4Teraflops/套單套價(jià)格:150,000人民幣/套單套功耗:(400+900)W/套共需25套(GPU+CPU)總成本:人民幣475萬總耗電:32.5KW組建一個(gè)具有100TF處理能力的集群,采用CPU和GPU的對(duì)比:空間差28倍速度快57倍成本差12倍耗電差17倍GPU的優(yōu)勢15NVIDIAGPU產(chǎn)品介紹16GPU方案超優(yōu)異"性價(jià)比"(16倍)17GPU方案超優(yōu)異"性價(jià)比"(16倍)18GPU應(yīng)用介紹與成功案例19GPU應(yīng)用領(lǐng)域視覺影像領(lǐng)域:"3D"與"高清"3D/2D之特效制作加速、渲染加速:20倍電影"阿凡達(dá)"、"2012"、"風(fēng)云2"均使用GPU技術(shù)動(dòng)漫、游戲、精密機(jī)構(gòu)影像視頻之標(biāo)清轉(zhuǎn)高清應(yīng)用:10倍家庭視聽設(shè)備:高清電視、3D電視商業(yè)應(yīng)用:數(shù)據(jù)量大,對(duì)精度要求不高即時(shí)(決策)系統(tǒng):即時(shí)股市分析系統(tǒng)數(shù)據(jù)挖掘(分析):保險(xiǎn)業(yè)、信用卡、電信業(yè)等海量數(shù)據(jù)統(tǒng)計(jì)分析、門戶網(wǎng)站的即時(shí)IP分析大量比對(duì)(搜索):信息安全:病毒比對(duì)(卡巴斯基)、垃圾郵件、上網(wǎng)行為管理、攔截不當(dāng)言論發(fā)表(博客、短訊)影像庫搜索(imagesearching):Google服務(wù)安防領(lǐng)域:人臉識(shí)別、表情識(shí)別、行為預(yù)測數(shù)據(jù)庫路由規(guī)劃:流通業(yè)(物連網(wǎng)應(yīng)用)加密解密:流媒體、數(shù)字版權(quán)管理科研領(lǐng)域:偏微分方程,對(duì)精度要求很高數(shù)學(xué)運(yùn)算:石油探勘、醫(yī)學(xué)成橡(CT)、航太、氣象模型模擬:EDA、電磁模擬、流體模擬、分子動(dòng)力仿真應(yīng)用:汽車碰撞模擬、飛行模擬高清晰視頻20GPU應(yīng)用領(lǐng)域MATLAB加速應(yīng)用軟件Matlab,labview等數(shù)學(xué)運(yùn)算程序成像及計(jì)算機(jī)視覺MartenBjorkman
,SiftGPU,F(xiàn)lowlib:密集型光流,貝葉斯光流分子動(dòng)力學(xué)VMD,NAMD,HOOMD等分子動(dòng)力學(xué)軟件包計(jì)算電磁學(xué)和電磁力學(xué)FDTD算法,Acceleware
電磁學(xué)解決方案計(jì)算化學(xué)Gaussian和GAMESS等工作,直接自洽場(SCF)計(jì)算,雙電子積分評(píng)估計(jì)算金融隨機(jī)數(shù)字生成器以及蒙特卡洛模擬,期權(quán)定價(jià)、風(fēng)險(xiǎn)分析、算法交易計(jì)算流體動(dòng)力學(xué)納維—斯托克斯(Navier-Stokes)模型以及LatticeBoltzman方法生物信息學(xué)HMMER,MUMER等DNA序列比對(duì)數(shù)據(jù)挖掘、分析學(xué)GPUminer,Cmatch
數(shù)據(jù)挖掘,比對(duì)天氣、大氣、海洋建模與空間科學(xué)WRF模型,海嘯模擬醫(yī)療成像Digisens
SnapCT
體層重建,高級(jí)MRI重建21NAMD實(shí)際測試22NAMD實(shí)際測試結(jié)果23支持GPU/CUDA之應(yīng)用(快速增加中)24中國GPU實(shí)際案例:港口貨柜安檢北方某港口采用高科技斷層掃瞄技術(shù),掃瞄所有進(jìn)出港的集裝箱傳統(tǒng)CPU電腦影像處理速度問題,每一個(gè)貨柜的掃瞄成像,平均需要25~30分鐘時(shí)間,造成港口嚴(yán)重堵塞該掃瞄成像系統(tǒng),於09年7月改用GPU方案大幅提高成像速度達(dá)50倍以上將成像時(shí)間縮短至1分鐘以內(nèi)大大改善擁塞問題25應(yīng)用范例:Bloomberg節(jié)省90%成本彭博公司(Bloomberg)是一家專門提供經(jīng)濟(jì)資訊的財(cái)經(jīng)公司1996年成立于紐約和新澤西州,目前是全美最具權(quán)威的『資產(chǎn)評(píng)估』公司。提供『資產(chǎn)擔(dān)保債券估值』,每晚發(fā)布計(jì)算的結(jié)果數(shù)據(jù).2008年金融風(fēng)暴後,客戶”高精度計(jì)算”需求快速增長,數(shù)據(jù)中心的硬件需求將成10倍地增長所需的CPU處理器核心數(shù)目將從原有的800個(gè)猛增到8000個(gè)左右機(jī)房空間也需要增加10倍以上.最後,彭博選擇采用GPU了Nvidia的TeslaGPU系統(tǒng)產(chǎn)品只用48套系統(tǒng),空間節(jié)省90%以上總體成本節(jié)省90%以上花費(fèi)了1年左右的時(shí)間進(jìn)行程序改寫(CUDA并行運(yùn)算)Nvidia的Tesla服務(wù)器擔(dān)負(fù)了90%的運(yùn)算任務(wù),裝備Tesla服務(wù)器的數(shù)據(jù)中心的性能則因此而提升了800%。26吉浦迅科技
在GPU應(yīng)用的技術(shù)優(yōu)勢27吉浦迅科技簡介2009年9月成立於蘇州工業(yè)園區(qū)獨(dú)墅湖高教區(qū)注冊(cè)資本額:人民幣500萬元(內(nèi)資)是國內(nèi)首家"專注於GPU應(yīng)用"的科技公司成立便獲得蘇州工業(yè)園區(qū)科技局『高新科技投資』GPU行業(yè)資質(zhì):NVidia推薦供應(yīng)商(TPP:TeslaPreferredProvider)麗臺(tái)科技Tesla產(chǎn)品中國區(qū)代理華碩電腦GPU服務(wù)器/工作站中國區(qū)戰(zhàn)略合作伙伴Accelereyes首家中國區(qū)JacketOEM合作伙伴,為國內(nèi)廣大Matlab用戶提供最專業(yè)的Jacket技術(shù)支持與升級(jí)輔導(dǎo)業(yè)務(wù),并提供GPU應(yīng)用的合作開發(fā)。28發(fā)揮GPU效益的關(guān)鍵:優(yōu)化技術(shù)GPU優(yōu)化技術(shù),是個(gè)『整合性』的技術(shù),包括對(duì)GPU硬件架構(gòu)、硬件配置的深度了解對(duì)GPU應(yīng)用介面(例如CUDA、OpenCL)的深度了解對(duì)并行運(yùn)算的深度了解對(duì)應(yīng)用領(lǐng)域的深度了解(與行業(yè)應(yīng)用開發(fā)商合作)29吉浦迅科技的技術(shù)優(yōu)勢核心技術(shù)團(tuán)隊(duì)來自於NVidia鉆研GPU應(yīng)用均有八年以上經(jīng)驗(yàn),是國內(nèi)非常稀缺的GPU應(yīng)用技術(shù)資源中國最熟悉GPU硬件架構(gòu)、驅(qū)動(dòng)、配置的稀缺人力中國最能掌握GPU技術(shù)發(fā)展趨
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年全球及中國PWM制氫電源行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報(bào)告
- 必殺03 第六單元 我們生活的大洲-亞洲(綜合題20題)(解析版)
- 講稿《教育強(qiáng)國建設(shè)規(guī)劃綱要(2024-2035年)》學(xué)習(xí)宣講
- 2025關(guān)于合同中的表見代理
- 商業(yè)物業(yè)租賃合同范本
- 試驗(yàn)檢測未來的發(fā)展方向
- 天然氣購銷合同模板
- 2025機(jī)械加工合同
- 卷簾門電機(jī)售后合同范本
- 商鋪的買賣合同年
- 9.2溶解度(第1課時(shí)飽和溶液不飽和溶液)+教學(xué)設(shè)計(jì)-2024-2025學(xué)年九年級(jí)化學(xué)人教版(2024)下冊(cè)
- 2024年審計(jì)局公務(wù)員招錄事業(yè)單位招聘考試招錄139人完整版附答案【研優(yōu)卷】
- 濰坊市人民醫(yī)院招聘真題
- 銷售人員薪資提成及獎(jiǎng)勵(lì)制度
- 2017年江蘇南京中考滿分作文《無情歲月有味詩》5
- 2023年宏觀經(jīng)濟(jì)學(xué)考點(diǎn)難點(diǎn)
- 2024-2030年中國智慧水務(wù)行業(yè)應(yīng)用需求分析發(fā)展規(guī)劃研究報(bào)告
- 山體排險(xiǎn)合同模板
- 特殊感染手術(shù)的配合與術(shù)后處理課件
- 檢驗(yàn)科生物安全工作總結(jié)
- 即時(shí)通訊系統(tǒng)建設(shè)方案
評(píng)論
0/150
提交評(píng)論