下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、-Hive Hive執(zhí)行的總體性能進(jìn)行了調(diào)研,下面以分條的形式列舉出來(lái)。hive.map.aggr=trueHiveQL 聚合的執(zhí)行性能。這個(gè)設(shè)置可以將頂層的聚合操作Map Reduce hiveSEThiveSELECT-Hive Hive執(zhí)行的總體性能進(jìn)行了調(diào)研,下面以分條的形式列舉出來(lái)。hive.map.aggr=trueHiveQL 聚合的執(zhí)行性能。這個(gè)設(shè)置可以將頂層的聚合操作Map Reduce hiveSEThiveSELECTcount(*),avg(salary)FROMemployeesgroupby*having MapReduce程序。而對(duì)于其它類型的查詢,比如指定字段或
2、者包含表關(guān)聯(lián)的查詢等,Hive MapReduce 查詢的MapReduce 執(zhí)行,可以設(shè)置hive.exec.m (陷阱)hiveSELECTname,salary,deductionsFederalFROMemployeesWHEREdeductionsFederalTaxes 查出的數(shù)據(jù)實(shí)際上是=0.2 。原因:IEEE 0.200000000001,0.2 cast函數(shù)。WHEREdeductionsFederalTaxescast(0.2ASHive Join Hive streaming反之,該表多次,特別是包含Join SELECT /*+ STREAMTABLE(s) */ s
3、.ymd, s.symbol, s.price_close, d.dividend FROMstockssJOINdividendsdONs.ymd=d.ymdANDs.symbol=d.symbol WHERE s.symbol = AAPL;STREAMTABLEHivewhere SELECTS*FROMstocksJOINdividendsON條件,Hive會(huì)對(duì)兩SELECT*FROMstocksJOINWHEREwhere SELECTS*FROMstocksJOINdividendsON條件,Hive會(huì)對(duì)兩SELECT*FROMstocksJOINWHEREstock.symbol
4、dividends.symbolandstock.symbol=AAPL;/ Hivewhere 條件之前執(zhí)行,所以這條語(yǔ)句與上一條語(yǔ)句執(zhí)行時(shí)間相當(dāng)!SELECT*FROMstocksJOINdividendsONstock.symboldividends.symbol;/InnerJoin ap Map-sideSELECT/*+MAPJOIN(d)*/s.ymd,s.symbol,s.price_close,FROMstockssJOINdividendsdONs.ymd=d.ymdANDs.symbol=d.symbol WHERE s.symbol = AAPL;Hivev0.7之前,
5、MAPJOIN()會(huì)將指定的表,一般是較小的表,加載到內(nèi)存中,這樣整 Reduce 操作,進(jìn)而提高整體性能。在Hive v0.7 之后,需要設(shè)置 hive.auto.convert.jorue,開(kāi)啟MapJoin功能。注:另外也可以進(jìn)行bucketMapJoin 的優(yōu)化,具體理解,待調(diào)研。Orderbyvs.Sortbyvs.DistributeByvs.ClusterOrderByreducer上執(zhí)行,得到的結(jié)果是整體有序的。但是由于 MapReduceHash SortBy reducer 失。DistributeBy reducerreducerreducer的SELECTs.ymd,s
6、.symbol,s.price_close FROM stocks sDISTRIBUTEBYSORTs.symbolASC,s.ymdClusterBy=DistributeBy+SortOrderBy 之外產(chǎn)生的所有排序結(jié)果默認(rèn)情況下(的值)Hive 支持抽樣查詢例一hiveSELECT*fromnumbers24UCKET3OUTOF10ONrand()hiveHive 支持抽樣查詢例一hiveSELECT*fromnumbers24UCKET3OUTOF10ONrand()hiveSELECT*fromnumbers2UCKET3OUTOF10ONnumber) 如果不用 Bucket
7、語(yǔ)句中,分母(eg10)。SELECT*FROMnumbersflatLE(0.1PERCENT)HDFSUNION ALL SELECTlog.ymd,log.level,FROMSELECT l1.ymd, l1.level, l1.message,Log1ASsourceFROMlog1l1 UNION ALLSELECT l2.ymd, l2.level, l2.message,Log2ASsourceFROMlog1)SORTBYlog.ymd注:要求兩個(gè)表查詢結(jié)果的字段的個(gè)數(shù)和類型必須一致(技巧)EXPLAIN/EXPLAINEXTENDEDLimit Whentryingasma
8、llersubsetofdataforsimplehowmuchsizeweneedtoguaranteeeachrowtoWhentryingasmallersubsetofdataforsimpleumnumberoffilesweWhentryingasmallersubsetofdataforsimpleumnumberoffileswecan本地模式localset mapred.job.tracker=local;setSELECT*frompeople set并行執(zhí)行 Hive query MapperReducer Hivereducer數(shù)量,但這個(gè)hive.exec.redu
9、cers.bytes.per.reducer1GB,也可以改變這edwardetl02$hadoopdfs-count/user/media6/fracture/ins/*|tail-4 1 8 2614608737 hdfs:/./user/media6/fracture/ins/hit_date=20120118172742992546 1172656878252 12362657644 Hadoop hadoop-mapper reducerreducer 0JVM JVM mapreduce jvm Howmanytaskstorunperjvm.Ifsetto-1,thereisno
10、limit. JVM Reuse | 139 Hadoop會(huì)啟動(dòng)同一個(gè)任務(wù)的多個(gè)副本在集群上執(zhí)行,但它會(huì)丟入If true, then multiple instanofsomemaptasks may be executed in parallel.If true, then multiple instanofsomereduce Hadoop會(huì)啟動(dòng)同一個(gè)任務(wù)的多個(gè)副本在集群上執(zhí)行,但它會(huì)丟入If true, then multiple instanofsomemaptasks may be executed in parallel.If true, then multiple instanofsomereducetasks may be executed in parallel.Hive 提供了三個(gè)虛擬列:INPUT FILE NAME, BLOCK OFFSET INSIDE FILE ROW OFFSET INSIDE BLOCKROW OFFSET INSIDE BLOCK hiveSELECTINPUT FILE NAME,BLOCK OFFSET INSIDE FI
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度農(nóng)業(yè)生態(tài)保護(hù)承包協(xié)議3篇
- 專項(xiàng)2024進(jìn)出口貿(mào)易合作勞動(dòng)協(xié)議版A版
- 專業(yè)防水服務(wù)協(xié)議規(guī)范版B版
- 專業(yè)土方買(mǎi)賣(mài)協(xié)議指導(dǎo)文本(2024版)版B版
- 專業(yè)方木買(mǎi)賣(mài):2024年協(xié)議范本一
- 2025年度歷史文化街區(qū)拆遷承包合同4篇
- 2025年度展覽館場(chǎng)地借用及展覽策劃服務(wù)合同4篇
- 二零二四商標(biāo)權(quán)轉(zhuǎn)讓與市場(chǎng)推廣服務(wù)合同范本3篇
- 二零二五年度文化產(chǎn)業(yè)園項(xiàng)目合作協(xié)議3篇
- 不動(dòng)產(chǎn)居間服務(wù)協(xié)議模板2024版B版
- 智慧財(cái)務(wù)綜合實(shí)訓(xùn)
- 安徽省合肥市2021-2022學(xué)年七年級(jí)上學(xué)期期末數(shù)學(xué)試題(含答案)3
- 教育專家報(bào)告合集:年度得到:沈祖蕓全球教育報(bào)告(2023-2024)
- 肝臟腫瘤護(hù)理查房
- 護(hù)士工作壓力管理護(hù)理工作中的壓力應(yīng)對(duì)策略
- 2023年日語(yǔ)考試:大學(xué)日語(yǔ)六級(jí)真題模擬匯編(共479題)
- 皮帶拆除安全技術(shù)措施
- ISO9001(2015版)質(zhì)量體系標(biāo)準(zhǔn)講解
- 《培訓(xùn)資料緊固》課件
- 黑龍江省政府采購(gòu)評(píng)標(biāo)專家考試題
- 成品煙道安裝施工方案
評(píng)論
0/150
提交評(píng)論