高等計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)_第1頁(yè)
高等計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)_第2頁(yè)
高等計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)_第3頁(yè)
高等計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)_第4頁(yè)
高等計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)_第5頁(yè)
已閱讀5頁(yè),還剩110頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

高等計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)

復(fù)習(xí)

(第二講)

福旭

2005年2月28日

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

計(jì)算機(jī)工程化方法論

Implementation

Complexity/

Benchmarks

Technology、

Trends

pinentNe

g而」\k

GenerLiJonS'/J

0河山溝維

Work

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

測(cè)量工具

?基準(zhǔn)程序(Benchmarks)、蹤跡(Traces)、頻度

(Mixes)

?成本(Cost)、延遲(delay)、大小(area)、功率(power)

?模擬(Simulation)(多個(gè)級(jí)別)

?ISA,RT,Gate,Circuit

?排隊(duì)論(QueuingTheory)

?經(jīng)驗(yàn)知識(shí)(RulesofThumb)

?基本原貝^FundamentalLaws)

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

性能■成本

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

性能和成本

吞吐率

飛機(jī)華盛頓-巴黎速度乘客數(shù)量

(pmph)

Boeing7476.5小時(shí)610mph470286,700

BAD/Sud

3小時(shí)1350mph132178,200

Concorde

?完成任務(wù)的時(shí)間(執(zhí)行時(shí)間)

?執(zhí)行時(shí)間(executiontime),響應(yīng)時(shí)間(responsetime),延遲

(latency)

?單位時(shí)間(每天、小時(shí)、星期、秒、納秒…等等)內(nèi)完成的任務(wù)數(shù)

量(性能)

?吞吐率(throughput),帶寬(bandwidth)

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

性能和成本(續(xù))

Performace(X)=

ExTime(X)

“X比Y快n倍”(“XisntimesfasterthanY")

是指

ExTime(Y)Performance(X)

ExTime(X)Performance(Y)

?速度:Concorde與Boeing747

?吞吐率:Boeing747與Concorde

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

Amdahl定律

通過增加E,獲得的加速比(Speedup):

加諫孤*=沒有E時(shí)的執(zhí)行時(shí)間二增加E后的性能

(廠增加E后的執(zhí)行時(shí)間一沒有E時(shí)的性能

假設(shè),增加E可以加速整個(gè)任務(wù)的F部分,加速因子為S;并且這個(gè)

任務(wù)的其他部分不受影響.

那么

執(zhí)行時(shí)間(增加E)=(J-F)+-乂執(zhí)行時(shí)間口殳有E)

\S)

力口速比I曾加E):7執(zhí)彳("有E)

。-方)+,x執(zhí)行時(shí)間版有E)

<S)

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

Amdahl定律(續(xù))

口浮點(diǎn)指令的性能改進(jìn)了兩倍;但是只有10%的實(shí)

際指令是浮點(diǎn)指令

ExTimenew=ExTime01dx(0.9+.1/2)=0.95xExTime0,d

SpeedUPoverall="—1.053

0.95

大規(guī)律事件原則

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

性能的計(jì)量

/每月的響應(yīng)

應(yīng)用程序/每秒的操作

\編程語言/

\編譯

(millions)ofInstructionspersecond-MIPS

1ISA1(millions)of(F.P.)operationspersecond-MFLOP/s

據(jù)通路\

/控制、-Megabytespersecond

/功能部件

/晶體管導(dǎo)線管月川Cyclespersecond(clockrate)

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

影響CPU性能的幾4、方面

秒數(shù)―Z號(hào)令數(shù)j時(shí)鐘數(shù)秒婁

CPU時(shí)間=:—x

一程序一程序八指令周其夕

指令總數(shù)CPI時(shí)鐘頻率

程序X

編譯器XX

指令系統(tǒng)體系結(jié)構(gòu)XX

組成XX

X

工藝技術(shù)

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

CPI

CPU時(shí)間X時(shí)鐘頻率每條指令的平均周期數(shù)

CPI

指令總數(shù)(Averagecyclesperinstruction)

時(shí)鐘周期數(shù)

指令總數(shù)

CPU時(shí)間=時(shí)鐘周期時(shí)間X2,X(—ionfrequency")

CPI=YCPIixFi這里F二___L—

仁JJj指令總數(shù)

哪里是瓶頸(時(shí)間不夠用),就對(duì)那里的資源

增加投資!

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

示例:計(jì)算CPI

BaseMachine(Reg/Reg)

OpFreqCPLCPI"(%Time)

ALU50%1.5(33%)

Load20%2,4(27%)

Store10%2.2(13%)

Branch20%2,4(27%)

/

/1.5

TypicalMix

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

選擇基準(zhǔn)程序集(BenchmarkSets)

Toybenchmarks

Kernels

Syntheticbenchmarks

?e.g.WhetstonesandDhrystones

Realprograms

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

SPEC:

SystemPerformanceEvaluationCooperative

第一版1989

10個(gè)程序(6Fp+4Int)產(chǎn)生單一數(shù)值(SPECmarks)

第二版1992

SPECInt92(6Int)和SPECfp92(14Fp)

不限制編譯器的開關(guān).DEC4000Model610在93年3月:

spice:unix.c:/def=(sysv,has_bcopy,掘copy(a,b,c)=memcpy(b,a,c)

wave5:/ali=(all,dcom=nat)/ag=a/ur=4/ur=200

nasa7:/norecu/ag=a/ur=4/ur2=200/lc=blas

第三版1995

一組新的程序:SPECint95(8Int)和SPECfp95(lOFp)

捷有效期三年?

對(duì)所有程序使用同一開關(guān)設(shè)置:SPECint_base95,SPECfp_base95

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

第一版SPEC

□1989年,第一版;10個(gè)程序,用單一數(shù)值來總結(jié)性能

(6Fp+4lnt),相對(duì)于VAX11/780

□其中有一個(gè)程序:99%的時(shí)間耗費(fèi)在該程序的單一一行代碼上

□新型前端編譯器可以非常顯著地改進(jìn)它的性能

8oo

7oo

6oo

5oo

00

3

00

00

00

T

-s+-

nld

pd>

ooOd

pwOdto5

bjE

①CXO2

,BS

E

Benchmark

北京大學(xué)計(jì)I_____________________________「.,_____________________________________________[開發(fā)中心

SPEC95

BenchmarkDescription

goArtificialintelligence;playsthegameofGo

m88ksimMotorola88kchipsimulator;runstestprogram

gccTheGnuCcompilergeneratingSPARCcode

compressCompressesanddecompressesfileinmemory

liLispinterpreter

ijpegGraphiccompressionanddecompression

perlManipulatesstringsandprimenumbersinthespecial-purposeprogramminglanguagePerl

vortexAdatabaseprogram

tomcatvAmeshgenerationprogram

swimShallowwatermodelwith513x513grid

su2corquantumphysics;MonteCarlosimulation

hydro2dAstrophysics;HydrodynamicNaiverStokesequations

mgridMultigridsolverin3-Dpotentialfield

appluParabolic/ellipticpartialdifferentialequations

trub3dSimulatesisotropic,homogeneousturbulenceinacube

apsiSolvesproblemsregardingtemperature,windvelocity,anddistributionofpollutant

fppppQuantumchemistry

wave5Plasmaphysics;electromagneticparticlesimulation

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

.

Ip

gzrpe

SourceDescriptionSPEC2KcpU

VpcTcy

gcdcCompressionusingtheLempel-Zivalgorithm

cocFPGAcircuitplacementandrouting

cfConsistsoftheGNUCcompilergeneratingoptimizedmachine

e

ITlc

cafcCombinatorialoptimizationofpublictransitscheduling

rcc

piarnsChess-playingprogram

eoNtyc

cSyntacticEngishlanguageparser

pe.Graphicsvisualizationusingprobabilisticraytracinc

nsemc++

spcPerl(aninterpretedstring-processinglanguage)withfourinput

g-a

cpt

vo.Agrouptheoryapplicationpackage

bIzpexAnobject-orienteddatabasesystem

wN

ol)2fAblock-sortingcompressionalgorithm

Timberwolf:asimulatedannealingalgorithmforVLSIplaceand

rcDulte

FpF77

,FpF77Latticegaugetheorymodelofquantumchromodynamics

sIn

zdFpF77Solvesshallowwaterequationsusingfinitedifferenceequations

Fp7Multigridsolveroverthree-dimensionalfield

rrayF7C

aFpParabolicandellipticpartialdifferentialequationsolver

FThree-dimensionalgraphicslibrary

Tlesepo

rrgFpF9CComputationalfluiddynamics

algF

a計(jì)pcImagerecognitionofathermalimageusingneuralnetworks

FpSimulationofseismicwavepropagation

Fc

pcFacerecognitionusingwaveletsandgraphmatching

FMoleculardynamicssimulationofaproteininwater

arFPo

學(xué)

計(jì)算FoPerformsprimalitytestingfor.Mersenneprimes”一?

-c舸拓苣告恪布宿&已由祜屣,cFfeff^Hulaitiori理器研無開發(fā)中心

-一-■■■■■>a■■■.■

EEMBC

BenchmarktypeNumberofExamplebenchmarks

kernels

Automotive/industria166microbenchmarks(arithmeticoperations,

1pointerchasing,memoryperformance,matrix

arithmetic,tablelookup,bitmanipulation),5

automobilecontrolbenchmarks,and5filteror

Consumer5E幫保Sfl的舊電監(jiān)chmarks(JPEG

compress/decompress,filtering,andRGB

Conversions)

Networking3Shortest-pathcalculation,IProuting,and

packetflowoperations

Officeautomation4Graphicsandtextbenchmarks(Beziercurve

calculation,dithering,imagerotation,text

processing)

Telecommunications6FilteringandDSPbenchmarks(autocorrelation,

FFT,decoder,encoder)

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

如何總結(jié)性能

口算術(shù)平均值(或者加權(quán)算術(shù)平均值)追蹤執(zhí)行時(shí)間:

SUM(Ti)/n或者SUM(Wi*Ti)

□比率(例如MFLOPS)的調(diào)和平均值(或者加權(quán)調(diào)和平均值)

追蹤執(zhí)行時(shí)間:

n/SUM(l/Ri)或者n/SUM(Wi/Ri)

□為了按比例伸縮性能,規(guī)格化執(zhí)行時(shí)間是非常便捷的!

例如,參照機(jī)器的時(shí)間4-被評(píng)測(cè)機(jī)器的時(shí)間

□注意,不可使用規(guī)格化的執(zhí)行時(shí)間的算術(shù)平均值,而應(yīng)該使用幾

彳可平均值!

□幾何平均值平等對(duì)待所有的改進(jìn)情況:

A程序的執(zhí)行從2秒減少到1秒

與B程序的執(zhí)行從2000秒減少到1000秒

同等重要!

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

為什么對(duì)規(guī)格化數(shù)值要進(jìn)行幾何平均?

1

Program11101100.11

Program2100010010.1101

Arithmeticmean500.55515.055.051

Geometricmean31.631.61111

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

性能評(píng)測(cè)

□orbetterorworse,benchmarksshapeafield

□Goodproductscreatedwhenhave:

?Goodbenchmarks

?Goodwaystosummarizeperformance

□Givensalesisafunctioninpartofperformance

relativetocompetition,investmentinimprovingproduct

asreportedbyperformancesummary

□Ifbenchmarks/summaryinadequate,thenchoosebetween

improvingproductforrealprogramsvs.improving

producttogetmoresales;

Salesalmostalwayswins!

□Executiontimeisthemeasureofcomputerperformance!

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

低成制作流程

Blankwafers

Slicer

20to30processingsteps

TestedIndividualdies

Patternedwafers

dies(onewafer)

Dieaa

QIoi.■IL■■■■

??,國(guó)國(guó)WDicer

■0”atester■廣■■J

吧薩3fl

Testedpackageddies

Part零

Shiptocustomers

tester

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

集成電路的成本

Wafer_cost

Diecost=

Dies_per_waferxDie_yield

7rx(Wafer_diameter/2)27ixWafer_diameter

Dies_per_wafer=

DieareaJ2xDie_area

—ct

n..八…..八lDefectsperunitareaxDiearea、

Die_yield=Wafer_yieldx1+—4===

aJ

若a=3,晶模成本大致以晶模大小的四次方增長(zhǎng)

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

其他成本

Diecost+Testingcost+Packagingcost

ICcost二

Finaltestyield

封裝成本:取決于管腳數(shù)量和散熱要求

ChipDiePackageTest&Total

costpinstypecostAssembly

386DX$4132QFP$1$4$9

486DX2$12168PGA$11$12$35

PowerPC601$53304QFP$3$21$77

HPPA7100$73504PGA$35$16$124

DECAlpha$149431PGA$30$23$202

SuperSPARC$272293PGA$20$34$326

Pentium$417273PGA$19$37$473

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

真實(shí)示例

ChipMetalLineWaferDefectAreaDies/YieldDieCost

1ayerswidthcost/cn?m席wafer

386DX20.90$9001.04336071%$4

486DX230.80$12001.08118154%$12

PowerPC60140.80$17001.312111528%$53

HPPA710030.80$13001.01966627%$73

DECAlpha30.70$15001.22345319%$149

SuperSPARC30.70$17001.62564813%$272

Pentium30.80$15001.5296409%$417

From''EstimatingICManufacturingCosts",byLinleyGwennap,

MicroprocessorReport,August2,1993,p.15

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

性能成本比Cost/Performance

WhatisRelationshipofCosttoPrice?

□ComponentCosts

口DirectCosts(add25%to40%)recurringcosts:labor,

purchasing,scrap,warranty

口GrOSSMargin(add82%to186%)nonrecurringcosts:

R&D,marketing,sales,equipmentmaintenance,rental,financing

cost,pretaxprofits,taxes

□AverageDiscounttogetListPrice(add33%to66%):

volumediscountsand/orretailermarkup

ListPrice—?

Average

Discount25%to40%

Avg.SellingPrice-?Gross

Margin34%to39%

DirectCost6%to8%

Component

Cost15%to33%

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@**?、w*??bn北京大享微處理器研究開發(fā)中心

小結(jié):價(jià)格與成本

計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

有窮狀態(tài)自動(dòng)機(jī)

°顯式描述出系統(tǒng)的狀態(tài)

。狀態(tài)間的遷移用”有向邊+輸入”描述

輸出可以表示為狀態(tài)的一部分也可以表現(xiàn)為輸出邊的

一部分1

"Mod3Machine"

Input(MSBfirst)]

1061101010

慟1001221

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

有穿狀態(tài)自幼機(jī)的實(shí)現(xiàn):組合避輯+鎖存器

1/0

7Q

6

InputSta十6。修Out|

I:________n[1

000000

001102

010011

100011

101000

110102

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系北京大學(xué)微處鋰器研究開發(fā)中心

微程序控制器“

°Statemachineinwhichpartofstateisarmicro-pc”.

,ExplicitcircuitryforincrementingorchangingPC

°IncludesaROMwith"microinstructions”.

,Controlledlogicimplementsatleastbranchesandjumps

22

6

(

I0

n.IE

sP

TR

r--JD

uODW

AcMU

T0

d~

a.on-P

s43

e).-

sDO

UJ

~4

q.

uU

!O

20U

北京大學(xué)計(jì)算機(jī)科學(xué)m北京大學(xué)微處理器研究開發(fā)中心

微處理器的功耗

100

PentiumII(R)

PentiumPro

486

lQ

-u

:

(oD

-

386n

o

386s

15uu8u6u35N25uo8uou

..o..o..o.o....

飛Leadprocessorpowerincreaseseverygeneration

XCompactionsprovidehigherperformanceatlowerpower

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

微處理器的功率利用率與適應(yīng)性

(1000

A

lDedicated

u

vHW

s

c

n100

wReconfigurablePleiades

x

o10-80MOPS/mW

)Processor/Logic

M10

W^B2VDSPJ3MOPS/mW

SASIPs

dDSPs

O1

W

SA110

EmbeddedProcessors0.4MIPS/mW

0.1>

Flexibility(Coverage)

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

復(fù)習(xí)

指令系統(tǒng)、流水線、Cache

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

計(jì)算機(jī)體系結(jié)構(gòu)定義是

theattributesofa[computing]systemasseen

bytheprogrammer,i.e.,theconceptual

structureandfunctionalbehavior,asdistinct

fromtheorganizationofthedataflowsand

controlsthelogicdesign,andthephysical

implementation.

Amdahl,Blaaw,andBrooks,1964

可編程存貯系統(tǒng)的組成

數(shù)據(jù)耀&簪結(jié)構(gòu):

指令格式

指令(或操作碼)集合

-對(duì)數(shù)據(jù)項(xiàng)和指令進(jìn)行尋址和訪問的模式

—夕卜'情

北京大學(xué)喬建機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

計(jì)算機(jī)體系結(jié)構(gòu)定義的演變

□1950s-1960s:計(jì)算機(jī)體系結(jié)構(gòu)課程

?:?計(jì)算機(jī)算術(shù)運(yùn)算ComputerArithmetic

□1970s-1980s中:計(jì)算機(jī)體系結(jié)構(gòu)課程

。指令系統(tǒng)設(shè)計(jì),特別是適合編譯器的ISA

□1990s:計(jì)算機(jī)體系結(jié)構(gòu)課程

CPU設(shè)計(jì)、存儲(chǔ)系統(tǒng)、I/Osystem系統(tǒng)、多處理器

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

指令系統(tǒng)體系結(jié)構(gòu)

InstructionSetArchitecture(ISA)

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

InterfaceDesign

Agoodinterface:

?Laststhroughmanyimplementations(portability,

compatability)

?Isusedinmanydifferenyways(generality)

?Providesconvenientfunctionalitytohigherlevels

?Permitsanefficientimplementationatlowerlevels

time

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

指令系統(tǒng)的演變

SingleAccumulator(EDSAC1950)

Accumulator+IndexRegisters

(ManchesterMarkI,IBM700series1953)

SeparationofProgrammingModel

fromImplementation

High-levelLanguageBasedConceptofaFamily

(B50001963)^^/(IBM3601964)

GeneralPurposeRegisterMachines

ComplexInstructionSetsLoad/StoreArchitecture

(Vax,Intel4321977-80)(CDC6600,Cray11963-76)

RISC

(Mips,Sparc,HPfAJBMRS6000,...1987)

LIW/"EPIC”?(IA-64...2001?)

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

指令系統(tǒng)的演變(續(xù))

□大多數(shù)計(jì)算機(jī)體系結(jié)構(gòu)的進(jìn)步通常都與具有標(biāo)志性的指令系

統(tǒng)設(shè)計(jì)聯(lián)系在一起:

?:?例如:堆棧(B5500)與GPR(IBM360)

□必須考慮的設(shè)計(jì)抉擇:

?:?工藝技術(shù)

?:?機(jī)器組成

。編程語言

?:?編譯技術(shù)

。操作系統(tǒng)

...

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

典型RISC

口32位固定格式指令(3種格式)

口32個(gè)32位GPR(R0恒為0,雙精成對(duì)使用)

□3地址、reg-reg算術(shù)指令

□load/store使用單一尋址方式:

base+displacement

。無間接尋址

□簡(jiǎn)單的轉(zhuǎn)移條件(基于寄存器數(shù)值)

□延遲轉(zhuǎn)移

參見:SPARC,MIPS,HPPA-Risc,DECAlpha,IBMPowerPC,

CDC6600,CDC7600,Cray-1,Cray-2,Cray-3

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

例如:MIPS

Register-Register

312625212016151110650

OpRs1Rs2RdOpx

Register-Immediate

312625212016150

OpRs1Rdimmediate

Branch

312625212016150

OpRs1Fs2/Opximmediate

Jump/Call

3126250

Optarget

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

流水技術(shù)的思想非常自然!

洗衣房

張三、李四、王五、趙六每人有一包衣服需要

洗滌、烘干、熨整

S1O1

洗衣機(jī)需要30分鐘

烘干機(jī)需要30分鐘

熨斗需要30分鐘

O

洗衣工需要30分鐘將衣物放到抽屜里

[北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

串行洗衣店

6PM78910111212AM

30'30130'30130'30'30130130130'30130'30130'30130

任工作時(shí)間

務(wù)酶。A

□串行洗衣店需要8個(gè)小時(shí)完成4個(gè)工作量

口如果他們了解流水技術(shù),那么需要多長(zhǎng)時(shí)間完成上述工

作呢?

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

流水化的洗衣店:盡可能早地開始工作

61PM78910111212AM

一(=1=^1=/—/—/

30303030303030

任工作時(shí)間

務(wù)

序府A

A

口流水化洗衣店需要3.5個(gè)小時(shí)完成4個(gè)工作量

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

?流水技術(shù)無助于減少單個(gè)任務(wù)的

流水技術(shù)性質(zhì)處理延遲(latency),但有助于提

、高整體工作負(fù)載的吞吐率

6PM78

彖個(gè)不同任務(wù)同時(shí)操作,使用不同

-1=1=1=1I時(shí)導(dǎo)資源

務(wù)30303030303030

順詢。泳?潛在加速比二流水線級(jí)數(shù)

序,

酶給A.流水線的速率受限于最慢的流水段

酶。A.流水段的執(zhí)#時(shí)間如果不均衡,那

0^0A么加速比就會(huì)降低

?開始填充流水線的時(shí)間和最后排

放流水線的時(shí)間降低加速比

?相關(guān)將導(dǎo)致流水線暫停

北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系chengxu@北京大學(xué)微處理器研究開發(fā)中心

計(jì)算機(jī)中的流水線

□由于程序總是執(zhí)行成千上萬條指令,因而吞吐率是關(guān)

□DLX有利特征:所有指令長(zhǎng)度相同,寄存器位于指

令格式大的固定場(chǎng)位,只肴l

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論