




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
高等計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)
復(fù)習(xí)
(第二講)
福旭
2005年2月28日
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
計(jì)算機(jī)工程化方法論
Implementation
Complexity/
Benchmarks
Technology、
Trends
pinentNe
g而」\k
GenerLiJonS'/J
0河山溝維
Work
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
測(cè)量工具
?基準(zhǔn)程序(Benchmarks)、蹤跡(Traces)、頻度
(Mixes)
?成本(Cost)、延遲(delay)、大小(area)、功率(power)
?模擬(Simulation)(多個(gè)級(jí)別)
?ISA,RT,Gate,Circuit
?排隊(duì)論(QueuingTheory)
?經(jīng)驗(yàn)知識(shí)(RulesofThumb)
?基本原貝^FundamentalLaws)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
性能■成本
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
性能和成本
吞吐率
飛機(jī)華盛頓-巴黎速度乘客數(shù)量
(pmph)
Boeing7476.5小時(shí)610mph470286,700
BAD/Sud
3小時(shí)1350mph132178,200
Concorde
?完成任務(wù)的時(shí)間(執(zhí)行時(shí)間)
?執(zhí)行時(shí)間(executiontime),響應(yīng)時(shí)間(responsetime),延遲
(latency)
?單位時(shí)間(每天、小時(shí)、星期、秒、納秒…等等)內(nèi)完成的任務(wù)數(shù)
量(性能)
?吞吐率(throughput),帶寬(bandwidth)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
性能和成本(續(xù))
Performace(X)=
ExTime(X)
“X比Y快n倍”(“XisntimesfasterthanY")
是指
ExTime(Y)Performance(X)
ExTime(X)Performance(Y)
?速度:Concorde與Boeing747
?吞吐率:Boeing747與Concorde
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
Amdahl定律
通過增加E,獲得的加速比(Speedup):
加諫孤*=沒有E時(shí)的執(zhí)行時(shí)間二增加E后的性能
(廠增加E后的執(zhí)行時(shí)間一沒有E時(shí)的性能
假設(shè),增加E可以加速整個(gè)任務(wù)的F部分,加速因子為S;并且這個(gè)
任務(wù)的其他部分不受影響.
那么
執(zhí)行時(shí)間(增加E)=(J-F)+-乂執(zhí)行時(shí)間口殳有E)
\S)
力口速比I曾加E):7執(zhí)彳("有E)
。-方)+,x執(zhí)行時(shí)間版有E)
<S)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
Amdahl定律(續(xù))
口浮點(diǎn)指令的性能改進(jìn)了兩倍;但是只有10%的實(shí)
際指令是浮點(diǎn)指令
ExTimenew=ExTime01dx(0.9+.1/2)=0.95xExTime0,d
SpeedUPoverall="—1.053
0.95
大規(guī)律事件原則
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
性能的計(jì)量
/每月的響應(yīng)
應(yīng)用程序/每秒的操作
\編程語言/
\編譯
(millions)ofInstructionspersecond-MIPS
1ISA1(millions)of(F.P.)operationspersecond-MFLOP/s
據(jù)通路\
/控制、-Megabytespersecond
/功能部件
/晶體管導(dǎo)線管月川Cyclespersecond(clockrate)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
影響CPU性能的幾4、方面
秒數(shù)―Z號(hào)令數(shù)j時(shí)鐘數(shù)秒婁
CPU時(shí)間=:—x
一程序一程序八指令周其夕
指令總數(shù)CPI時(shí)鐘頻率
程序X
編譯器XX
指令系統(tǒng)體系結(jié)構(gòu)XX
組成XX
X
工藝技術(shù)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
CPI
CPU時(shí)間X時(shí)鐘頻率每條指令的平均周期數(shù)
CPI
指令總數(shù)(Averagecyclesperinstruction)
時(shí)鐘周期數(shù)
指令總數(shù)
CPU時(shí)間=時(shí)鐘周期時(shí)間X2,X(—ionfrequency")
CPI=YCPIixFi這里F二___L—
仁JJj指令總數(shù)
哪里是瓶頸(時(shí)間不夠用),就對(duì)那里的資源
增加投資!
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
示例:計(jì)算CPI
BaseMachine(Reg/Reg)
OpFreqCPLCPI"(%Time)
ALU50%1.5(33%)
Load20%2,4(27%)
Store10%2.2(13%)
Branch20%2,4(27%)
/
/1.5
TypicalMix
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
選擇基準(zhǔn)程序集(BenchmarkSets)
Toybenchmarks
Kernels
Syntheticbenchmarks
?e.g.WhetstonesandDhrystones
Realprograms
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
SPEC:
SystemPerformanceEvaluationCooperative
第一版1989
10個(gè)程序(6Fp+4Int)產(chǎn)生單一數(shù)值(SPECmarks)
第二版1992
SPECInt92(6Int)和SPECfp92(14Fp)
不限制編譯器的開關(guān).DEC4000Model610在93年3月:
spice:unix.c:/def=(sysv,has_bcopy,掘copy(a,b,c)=memcpy(b,a,c)
wave5:/ali=(all,dcom=nat)/ag=a/ur=4/ur=200
nasa7:/norecu/ag=a/ur=4/ur2=200/lc=blas
第三版1995
一組新的程序:SPECint95(8Int)和SPECfp95(lOFp)
捷有效期三年?
對(duì)所有程序使用同一開關(guān)設(shè)置:SPECint_base95,SPECfp_base95
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
第一版SPEC
□1989年,第一版;10個(gè)程序,用單一數(shù)值來總結(jié)性能
(6Fp+4lnt),相對(duì)于VAX11/780
□其中有一個(gè)程序:99%的時(shí)間耗費(fèi)在該程序的單一一行代碼上
□新型前端編譯器可以非常顯著地改進(jìn)它的性能
8oo
7oo
6oo
5oo
00
3
00
00
00
T
-s+-
nld
pd>
ooOd
pwOdto5
bjE
①CXO2
,BS
E
Benchmark
北京大學(xué)計(jì)I_____________________________「.,_____________________________________________[開發(fā)中心
SPEC95
BenchmarkDescription
goArtificialintelligence;playsthegameofGo
m88ksimMotorola88kchipsimulator;runstestprogram
gccTheGnuCcompilergeneratingSPARCcode
compressCompressesanddecompressesfileinmemory
liLispinterpreter
ijpegGraphiccompressionanddecompression
perlManipulatesstringsandprimenumbersinthespecial-purposeprogramminglanguagePerl
vortexAdatabaseprogram
tomcatvAmeshgenerationprogram
swimShallowwatermodelwith513x513grid
su2corquantumphysics;MonteCarlosimulation
hydro2dAstrophysics;HydrodynamicNaiverStokesequations
mgridMultigridsolverin3-Dpotentialfield
appluParabolic/ellipticpartialdifferentialequations
trub3dSimulatesisotropic,homogeneousturbulenceinacube
apsiSolvesproblemsregardingtemperature,windvelocity,anddistributionofpollutant
fppppQuantumchemistry
wave5Plasmaphysics;electromagneticparticlesimulation
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
.
Ip
gzrpe
SourceDescriptionSPEC2KcpU
VpcTcy
gcdcCompressionusingtheLempel-Zivalgorithm
cocFPGAcircuitplacementandrouting
cfConsistsoftheGNUCcompilergeneratingoptimizedmachine
e
ITlc
cafcCombinatorialoptimizationofpublictransitscheduling
rcc
piarnsChess-playingprogram
eoNtyc
cSyntacticEngishlanguageparser
pe.Graphicsvisualizationusingprobabilisticraytracinc
nsemc++
spcPerl(aninterpretedstring-processinglanguage)withfourinput
g-a
cpt
vo.Agrouptheoryapplicationpackage
bIzpexAnobject-orienteddatabasesystem
wN
ol)2fAblock-sortingcompressionalgorithm
Timberwolf:asimulatedannealingalgorithmforVLSIplaceand
rcDulte
FpF77
,FpF77Latticegaugetheorymodelofquantumchromodynamics
sIn
zdFpF77Solvesshallowwaterequationsusingfinitedifferenceequations
Fp7Multigridsolveroverthree-dimensionalfield
rrayF7C
aFpParabolicandellipticpartialdifferentialequationsolver
FThree-dimensionalgraphicslibrary
Tlesepo
rrgFpF9CComputationalfluiddynamics
algF
a計(jì)pcImagerecognitionofathermalimageusingneuralnetworks
FpSimulationofseismicwavepropagation
Fc
pcFacerecognitionusingwaveletsandgraphmatching
FMoleculardynamicssimulationofaproteininwater
arFPo
坦
系
學(xué)
計(jì)算FoPerformsprimalitytestingfor.Mersenneprimes”一?
-c舸拓苣告恪布宿&已由祜屣,cFfeff^Hulaitiori理器研無開發(fā)中心
「
-一-■■■■■>a■■■.■
EEMBC
BenchmarktypeNumberofExamplebenchmarks
kernels
Automotive/industria166microbenchmarks(arithmeticoperations,
1pointerchasing,memoryperformance,matrix
arithmetic,tablelookup,bitmanipulation),5
automobilecontrolbenchmarks,and5filteror
Consumer5E幫保Sfl的舊電監(jiān)chmarks(JPEG
compress/decompress,filtering,andRGB
Conversions)
Networking3Shortest-pathcalculation,IProuting,and
packetflowoperations
Officeautomation4Graphicsandtextbenchmarks(Beziercurve
calculation,dithering,imagerotation,text
processing)
Telecommunications6FilteringandDSPbenchmarks(autocorrelation,
FFT,decoder,encoder)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
如何總結(jié)性能
口算術(shù)平均值(或者加權(quán)算術(shù)平均值)追蹤執(zhí)行時(shí)間:
SUM(Ti)/n或者SUM(Wi*Ti)
□比率(例如MFLOPS)的調(diào)和平均值(或者加權(quán)調(diào)和平均值)
追蹤執(zhí)行時(shí)間:
n/SUM(l/Ri)或者n/SUM(Wi/Ri)
□為了按比例伸縮性能,規(guī)格化執(zhí)行時(shí)間是非常便捷的!
例如,參照機(jī)器的時(shí)間4-被評(píng)測(cè)機(jī)器的時(shí)間
□注意,不可使用規(guī)格化的執(zhí)行時(shí)間的算術(shù)平均值,而應(yīng)該使用幾
彳可平均值!
□幾何平均值平等對(duì)待所有的改進(jìn)情況:
A程序的執(zhí)行從2秒減少到1秒
與B程序的執(zhí)行從2000秒減少到1000秒
同等重要!
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
為什么對(duì)規(guī)格化數(shù)值要進(jìn)行幾何平均?
1
Program11101100.11
Program2100010010.1101
Arithmeticmean500.55515.055.051
Geometricmean31.631.61111
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
性能評(píng)測(cè)
□orbetterorworse,benchmarksshapeafield
□Goodproductscreatedwhenhave:
?Goodbenchmarks
?Goodwaystosummarizeperformance
□Givensalesisafunctioninpartofperformance
relativetocompetition,investmentinimprovingproduct
asreportedbyperformancesummary
□Ifbenchmarks/summaryinadequate,thenchoosebetween
improvingproductforrealprogramsvs.improving
producttogetmoresales;
Salesalmostalwayswins!
□Executiontimeisthemeasureofcomputerperformance!
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
低成制作流程
Blankwafers
Slicer
20to30processingsteps
TestedIndividualdies
Patternedwafers
dies(onewafer)
Dieaa
QIoi.■IL■■■■
??,國(guó)國(guó)WDicer
■0”atester■廣■■J
吧薩3fl
Testedpackageddies
Part零
Shiptocustomers
tester
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
集成電路的成本
Wafer_cost
Diecost=
Dies_per_waferxDie_yield
7rx(Wafer_diameter/2)27ixWafer_diameter
Dies_per_wafer=
DieareaJ2xDie_area
—ct
n..八…..八lDefectsperunitareaxDiearea、
Die_yield=Wafer_yieldx1+—4===
aJ
若a=3,晶模成本大致以晶模大小的四次方增長(zhǎng)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
其他成本
Diecost+Testingcost+Packagingcost
ICcost二
Finaltestyield
封裝成本:取決于管腳數(shù)量和散熱要求
ChipDiePackageTest&Total
costpinstypecostAssembly
386DX$4132QFP$1$4$9
486DX2$12168PGA$11$12$35
PowerPC601$53304QFP$3$21$77
HPPA7100$73504PGA$35$16$124
DECAlpha$149431PGA$30$23$202
SuperSPARC$272293PGA$20$34$326
Pentium$417273PGA$19$37$473
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
真實(shí)示例
ChipMetalLineWaferDefectAreaDies/YieldDieCost
1ayerswidthcost/cn?m席wafer
386DX20.90$9001.04336071%$4
486DX230.80$12001.08118154%$12
PowerPC60140.80$17001.312111528%$53
HPPA710030.80$13001.01966627%$73
DECAlpha30.70$15001.22345319%$149
SuperSPARC30.70$17001.62564813%$272
Pentium30.80$15001.5296409%$417
From''EstimatingICManufacturingCosts",byLinleyGwennap,
MicroprocessorReport,August2,1993,p.15
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
性能成本比Cost/Performance
WhatisRelationshipofCosttoPrice?
□ComponentCosts
口DirectCosts(add25%to40%)recurringcosts:labor,
purchasing,scrap,warranty
口GrOSSMargin(add82%to186%)nonrecurringcosts:
R&D,marketing,sales,equipmentmaintenance,rental,financing
cost,pretaxprofits,taxes
□AverageDiscounttogetListPrice(add33%to66%):
volumediscountsand/orretailermarkup
ListPrice—?
Average
Discount25%to40%
Avg.SellingPrice-?Gross
Margin34%to39%
DirectCost6%to8%
Component
Cost15%to33%
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@**?、w*??bn北京大享微處理器研究開發(fā)中心
小結(jié):價(jià)格與成本
計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
有窮狀態(tài)自動(dòng)機(jī)
°顯式描述出系統(tǒng)的狀態(tài)
。狀態(tài)間的遷移用”有向邊+輸入”描述
輸出可以表示為狀態(tài)的一部分也可以表現(xiàn)為輸出邊的
一部分1
"Mod3Machine"
Input(MSBfirst)]
1061101010
慟1001221
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
有穿狀態(tài)自幼機(jī)的實(shí)現(xiàn):組合避輯+鎖存器
1/0
▽
7Q
6
InputSta十6。修Out|
I:________n[1
000000
001102
010011
100011
101000
110102
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系北京大學(xué)微處鋰器研究開發(fā)中心
微程序控制器“
°Statemachineinwhichpartofstateisarmicro-pc”.
,ExplicitcircuitryforincrementingorchangingPC
°IncludesaROMwith"microinstructions”.
,Controlledlogicimplementsatleastbranchesandjumps
22
6
(
I0
n.IE
sP
TR
r--JD
uODW
AcMU
T0
d~
a.on-P
s43
e).-
sDO
UJ
~4
q.
uU
!O
20U
北京大學(xué)計(jì)算機(jī)科學(xué)m北京大學(xué)微處理器研究開發(fā)中心
微處理器的功耗
100
PentiumII(R)
PentiumPro
486
lQ
-u
:
(oD
-
386n
o
386s
15uu8u6u35N25uo8uou
..o..o..o.o....
飛Leadprocessorpowerincreaseseverygeneration
XCompactionsprovidehigherperformanceatlowerpower
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
微處理器的功率利用率與適應(yīng)性
(1000
A
lDedicated
u
vHW
s
c
n100
wReconfigurablePleiades
x
o10-80MOPS/mW
)Processor/Logic
M10
W^B2VDSPJ3MOPS/mW
SASIPs
dDSPs
O1
W
SA110
EmbeddedProcessors0.4MIPS/mW
0.1>
Flexibility(Coverage)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
復(fù)習(xí)
指令系統(tǒng)、流水線、Cache
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
計(jì)算機(jī)體系結(jié)構(gòu)定義是
theattributesofa[computing]systemasseen
bytheprogrammer,i.e.,theconceptual
structureandfunctionalbehavior,asdistinct
fromtheorganizationofthedataflowsand
controlsthelogicdesign,andthephysical
implementation.
Amdahl,Blaaw,andBrooks,1964
可編程存貯系統(tǒng)的組成
數(shù)據(jù)耀&簪結(jié)構(gòu):
指令格式
指令(或操作碼)集合
-對(duì)數(shù)據(jù)項(xiàng)和指令進(jìn)行尋址和訪問的模式
—夕卜'情
北京大學(xué)喬建機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
計(jì)算機(jī)體系結(jié)構(gòu)定義的演變
□1950s-1960s:計(jì)算機(jī)體系結(jié)構(gòu)課程
?:?計(jì)算機(jī)算術(shù)運(yùn)算ComputerArithmetic
□1970s-1980s中:計(jì)算機(jī)體系結(jié)構(gòu)課程
。指令系統(tǒng)設(shè)計(jì),特別是適合編譯器的ISA
□1990s:計(jì)算機(jī)體系結(jié)構(gòu)課程
CPU設(shè)計(jì)、存儲(chǔ)系統(tǒng)、I/Osystem系統(tǒng)、多處理器
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
指令系統(tǒng)體系結(jié)構(gòu)
InstructionSetArchitecture(ISA)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
InterfaceDesign
Agoodinterface:
?Laststhroughmanyimplementations(portability,
compatability)
?Isusedinmanydifferenyways(generality)
?Providesconvenientfunctionalitytohigherlevels
?Permitsanefficientimplementationatlowerlevels
time
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
指令系統(tǒng)的演變
SingleAccumulator(EDSAC1950)
Accumulator+IndexRegisters
(ManchesterMarkI,IBM700series1953)
SeparationofProgrammingModel
fromImplementation
High-levelLanguageBasedConceptofaFamily
(B50001963)^^/(IBM3601964)
GeneralPurposeRegisterMachines
ComplexInstructionSetsLoad/StoreArchitecture
(Vax,Intel4321977-80)(CDC6600,Cray11963-76)
RISC
(Mips,Sparc,HPfAJBMRS6000,...1987)
LIW/"EPIC”?(IA-64...2001?)
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
指令系統(tǒng)的演變(續(xù))
□大多數(shù)計(jì)算機(jī)體系結(jié)構(gòu)的進(jìn)步通常都與具有標(biāo)志性的指令系
統(tǒng)設(shè)計(jì)聯(lián)系在一起:
?:?例如:堆棧(B5500)與GPR(IBM360)
□必須考慮的設(shè)計(jì)抉擇:
?:?工藝技術(shù)
?:?機(jī)器組成
。編程語言
?:?編譯技術(shù)
。操作系統(tǒng)
...
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
典型RISC
口32位固定格式指令(3種格式)
口32個(gè)32位GPR(R0恒為0,雙精成對(duì)使用)
□3地址、reg-reg算術(shù)指令
□load/store使用單一尋址方式:
base+displacement
。無間接尋址
□簡(jiǎn)單的轉(zhuǎn)移條件(基于寄存器數(shù)值)
□延遲轉(zhuǎn)移
參見:SPARC,MIPS,HPPA-Risc,DECAlpha,IBMPowerPC,
CDC6600,CDC7600,Cray-1,Cray-2,Cray-3
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
例如:MIPS
Register-Register
312625212016151110650
OpRs1Rs2RdOpx
Register-Immediate
312625212016150
OpRs1Rdimmediate
Branch
312625212016150
OpRs1Fs2/Opximmediate
Jump/Call
3126250
Optarget
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
流水技術(shù)的思想非常自然!
洗衣房
張三、李四、王五、趙六每人有一包衣服需要
洗滌、烘干、熨整
S1O1
洗衣機(jī)需要30分鐘
烘干機(jī)需要30分鐘
熨斗需要30分鐘
O
洗衣工需要30分鐘將衣物放到抽屜里
[北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
串行洗衣店
6PM78910111212AM
30'30130'30130'30'30130130130'30130'30130'30130
任工作時(shí)間
務(wù)酶。A
次
序
□串行洗衣店需要8個(gè)小時(shí)完成4個(gè)工作量
口如果他們了解流水技術(shù),那么需要多長(zhǎng)時(shí)間完成上述工
作呢?
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
流水化的洗衣店:盡可能早地開始工作
61PM78910111212AM
一(=1=^1=/—/—/
30303030303030
任工作時(shí)間
務(wù)
次
序府A
A
口流水化洗衣店需要3.5個(gè)小時(shí)完成4個(gè)工作量
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
?流水技術(shù)無助于減少單個(gè)任務(wù)的
流水技術(shù)性質(zhì)處理延遲(latency),但有助于提
、高整體工作負(fù)載的吞吐率
6PM78
彖個(gè)不同任務(wù)同時(shí)操作,使用不同
任
-1=1=1=1I時(shí)導(dǎo)資源
務(wù)30303030303030
順詢。泳?潛在加速比二流水線級(jí)數(shù)
序,
酶給A.流水線的速率受限于最慢的流水段
酶。A.流水段的執(zhí)#時(shí)間如果不均衡,那
0^0A么加速比就會(huì)降低
?開始填充流水線的時(shí)間和最后排
放流水線的時(shí)間降低加速比
?相關(guān)將導(dǎo)致流水線暫停
北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心
計(jì)算機(jī)中的流水線
□由于程序總是執(zhí)行成千上萬條指令,因而吞吐率是關(guān)
鍵
□DLX有利特征:所有指令長(zhǎng)度相同,寄存器位于指
令格式大的固定場(chǎng)位,只肴l
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 木制容器設(shè)計(jì)與制造的綠色工藝考核試卷
- 服裝零售店鋪經(jīng)營(yíng)績(jī)效評(píng)估與改進(jìn)措施考核試卷
- 機(jī)器人智能識(shí)別與追蹤技術(shù)考核試卷
- 制糖業(yè)的市場(chǎng)滲透與渠道拓展考核試卷
- 期刊出版商業(yè)模式考核試卷
- 批發(fā)業(yè)務(wù)中的國(guó)際物流考核試卷
- 醫(yī)院護(hù)士就業(yè)合同范本
- 蘇州新版裝修合同范本
- 人工智能智能城市規(guī)劃與設(shè)計(jì)協(xié)議
- 餐廚廢棄物處理合同
- 人工智能對(duì)輿情管理的價(jià)值
- 地理-河南省部分重點(diǎn)高中九師聯(lián)盟2024-2025學(xué)年高三下學(xué)期2月開學(xué)考試試題和答案
- 老年護(hù)理相關(guān)法律法規(guī)
- 《陶瓷工藝技術(shù)》課件
- 變更強(qiáng)制措施的申請(qǐng)書
- 供電所安全演講
- 供應(yīng)鏈韌性提升與風(fēng)險(xiǎn)防范-深度研究
- 化工原理完整(天大版)課件
- 《淞滬會(huì)戰(zhàn)》課件
- 《智能制造技術(shù)基礎(chǔ)》課件-第4章 加工過程的智能監(jiān)測(cè)與控制
- 罪犯正常死亡報(bào)告范文
評(píng)論
0/150
提交評(píng)論