版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)與數(shù)據(jù)分析《統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)》01目錄/Contents1.11.21.3什么是統(tǒng)計(jì)認(rèn)識(shí)數(shù)據(jù)分析課堂實(shí)訓(xùn)——體驗(yàn)數(shù)據(jù)分析的過程1.1.1統(tǒng)計(jì)與統(tǒng)計(jì)學(xué)統(tǒng)計(jì)是對(duì)數(shù)據(jù)資料的獲取、整理、分析、描述和推斷等操作的總稱。從某種角度來看,統(tǒng)計(jì)實(shí)際上就是獲取和使用各種數(shù)據(jù)資料的行為。而統(tǒng)計(jì)學(xué)則是關(guān)于收集、整理、分析數(shù)據(jù)和從數(shù)據(jù)中得出結(jié)論的科學(xué)。AB描述統(tǒng)計(jì):描述統(tǒng)計(jì)是研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)方法,其內(nèi)容包括如何取得所需要的數(shù)據(jù),如何用圖表或數(shù)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行整理和展示,如何描述數(shù)據(jù)的一般性特征等。推斷統(tǒng)計(jì):推斷統(tǒng)計(jì)則是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)學(xué)方法,其內(nèi)容包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩大類。其中,參數(shù)估計(jì)是利用樣本信息推斷總體特征;假設(shè)檢驗(yàn)是利用樣本信息判斷對(duì)總體的假設(shè)是否成立。1.1.2統(tǒng)計(jì)學(xué)中的基本概念1.總體、樣本與個(gè)體總體、樣本與個(gè)體的關(guān)系1.1.2統(tǒng)計(jì)學(xué)中的基本概念01OPTION02OPTION03OPTION總體:總體是客觀存在的、性質(zhì)相同的大量個(gè)體構(gòu)成的整體,具有大量性、同質(zhì)性和變異性等特性。樣本:樣本是從總體中抽取出來的一部分個(gè)體組成的整體,其作用是通過樣本特征來推斷總體特征,能夠簡(jiǎn)化數(shù)據(jù)統(tǒng)計(jì)分析的工作量。個(gè)體:個(gè)體是組成總體的基本單位,是各項(xiàng)數(shù)據(jù)最原始的載體。1.總體、樣本與個(gè)體1.1.2統(tǒng)計(jì)學(xué)中的基本概念1.總體、樣本與個(gè)體銷售員性別銷售額(元)銷售員性別銷售額(元)趙紅女28551曾琦男29779孫立男28858魏曉芳女15964劉凱男26154陳倩女19605馬思思女22103王芳女26415張杰男20958詹小杰男23957郭奇?zhèn)ツ?5481張琪女18727白婷婷女19341李建男20262朱偉杰男27652殷建平男25788宋燕女24867鄭凱男29472某公司銷售員銷售額統(tǒng)計(jì)表1.1.2統(tǒng)計(jì)學(xué)中的基本概念2.統(tǒng)計(jì)標(biāo)志與統(tǒng)計(jì)指標(biāo)AB統(tǒng)計(jì)標(biāo)志:統(tǒng)計(jì)標(biāo)志反映的是總體的屬性或特征的名稱,按性質(zhì)不同可分為品質(zhì)標(biāo)志和數(shù)量標(biāo)志。其中,品質(zhì)標(biāo)志反映的是總體的屬性特征,如上表中不考慮個(gè)體因素,每位銷售員的性別屬性就是品質(zhì)標(biāo)志,其指標(biāo)內(nèi)容表現(xiàn)為文字,如“男”“女”;數(shù)量標(biāo)志反映的則是總體的數(shù)量特征,如上表中不考慮個(gè)體因素,每位銷售員的銷售額就是數(shù)量標(biāo)志,其指標(biāo)內(nèi)容表現(xiàn)為具體的數(shù)值。統(tǒng)計(jì)指標(biāo):統(tǒng)計(jì)指標(biāo)反映的是總體特征的概念和具體的數(shù)值。按反映內(nèi)容或數(shù)值表現(xiàn)形式的不同,統(tǒng)計(jì)指標(biāo)可分為總量指標(biāo)、相對(duì)指標(biāo)和平均指標(biāo);按反映數(shù)量特點(diǎn)與內(nèi)容的不同,統(tǒng)計(jì)指標(biāo)又可分為數(shù)量指標(biāo)和質(zhì)量指標(biāo)。1.1.2統(tǒng)計(jì)學(xué)中的基本概念2.統(tǒng)計(jì)標(biāo)志與統(tǒng)計(jì)指標(biāo)各類統(tǒng)計(jì)指標(biāo)的含義目錄/Contents1.11.21.3什么是統(tǒng)計(jì)認(rèn)識(shí)數(shù)據(jù)分析課堂實(shí)訓(xùn)——體驗(yàn)數(shù)據(jù)分析的過程1.2.1數(shù)據(jù)分析的目的數(shù)據(jù)分析的目的,實(shí)質(zhì)是利用數(shù)據(jù)分析的結(jié)果來解決遇到的問題,具體而言,根據(jù)解決問題的類型,可以將數(shù)據(jù)分析的目的分為分析現(xiàn)狀、分析原因和預(yù)測(cè)未來3類。分析現(xiàn)狀預(yù)測(cè)未來分析原因分析現(xiàn)狀是數(shù)據(jù)分析最顯而易見的目的,以電商為例,若需要明確當(dāng)前市場(chǎng)環(huán)境下的產(chǎn)品市場(chǎng)占有率、店鋪會(huì)員的來源、支付轉(zhuǎn)化率、主要競(jìng)爭(zhēng)對(duì)手和競(jìng)爭(zhēng)商品等,這些都屬于對(duì)現(xiàn)狀的分析。數(shù)據(jù)分析的第3個(gè)目的就是預(yù)測(cè)未來,如用數(shù)據(jù)分析的方法預(yù)測(cè)未來市場(chǎng)的變化趨勢(shì)、預(yù)測(cè)未來銷售情況等。通過預(yù)測(cè)結(jié)果可以更好地制定相應(yīng)的策略和計(jì)劃,進(jìn)而提高未來計(jì)劃的成功率。分析原因是在分析現(xiàn)狀的基礎(chǔ)上對(duì)數(shù)據(jù)的訴求,例如,某商店某天的訪客數(shù)量突然大量增加,或會(huì)員突然大量流失等,每一種變化都是有原因的,通過對(duì)數(shù)據(jù)的分析就要找出這個(gè)原因,便于繼續(xù)維持好的局面,或改善不好的局面。1.2.2數(shù)據(jù)分析的基本思維1.對(duì)比思維對(duì)比是比較常見、直接和容易的數(shù)據(jù)分析思維。數(shù)據(jù)對(duì)比分析1.2.2數(shù)據(jù)分析的基本思維2.追蹤思維經(jīng)過積累和沉淀后的數(shù)據(jù),往往更具分析價(jià)值。從這個(gè)角度來看,在數(shù)據(jù)積累和沉淀的后,對(duì)數(shù)據(jù)進(jìn)行追蹤分析也更能準(zhǔn)確地發(fā)現(xiàn)和解決問題。對(duì)于數(shù)據(jù)分析而言,積累的數(shù)據(jù)越多、內(nèi)容越詳盡,在后期進(jìn)行追蹤分析時(shí)得到的結(jié)果越可靠。因此對(duì)于需要進(jìn)行數(shù)據(jù)分析的用戶而言,應(yīng)當(dāng)在平時(shí)不斷地積累數(shù)據(jù),并通過建立不同的數(shù)據(jù)維度和追蹤機(jī)制來分析和處理數(shù)據(jù)。1.2.2數(shù)據(jù)分析的基本思維03OPTION04OPTION05OPTION分解思維:是指將所有數(shù)據(jù)逐次向下分解,找出更多子數(shù)據(jù),并通過對(duì)子數(shù)據(jù)的挖掘和優(yōu)化,找到問題方向,最終提升核心指標(biāo)的數(shù)據(jù)質(zhì)量。特別是當(dāng)無法發(fā)現(xiàn)問題的成因時(shí),更應(yīng)該通過分解思路將數(shù)據(jù)或指標(biāo)進(jìn)行拆分,而不應(yīng)該只著眼于某個(gè)現(xiàn)成的數(shù)據(jù)指標(biāo),而忽略與之相關(guān)的其他因素。錨點(diǎn)思維:行為經(jīng)濟(jì)學(xué)中有個(gè)術(shù)語(yǔ)稱為“錨”,簡(jiǎn)單來說是指如果遇到某個(gè)商品,則第一眼留下的印象將在此后對(duì)購(gòu)買這一商品的出價(jià)意愿中產(chǎn)生長(zhǎng)期影響價(jià)值,這個(gè)價(jià)值就是“錨”。錨點(diǎn)思維可以廣泛地應(yīng)用在數(shù)據(jù)分析中。結(jié)合思維:實(shí)際上就是多維度數(shù)據(jù)分析和處理,因?yàn)榇蠖鄶?shù)數(shù)據(jù)在一段時(shí)間內(nèi)兼具偶然性和關(guān)聯(lián)性,單獨(dú)利用一種維度來分析數(shù)據(jù)會(huì)顯得比較片面,嚴(yán)重時(shí)會(huì)導(dǎo)致分析結(jié)果錯(cuò)誤,所以應(yīng)該從多個(gè)維度出發(fā)來分析。1.2.3數(shù)據(jù)分析的常用方法描述性統(tǒng)計(jì):對(duì)總體數(shù)據(jù)進(jìn)行統(tǒng)計(jì)性描述,包括數(shù)據(jù)的頻數(shù)分析、集中趨勢(shì)分析、離散程度分析、分布等特征的情況。抽樣估計(jì):利用抽樣調(diào)查所得到的樣本數(shù)據(jù)特征來估計(jì)和推算總體的數(shù)據(jù)特征。假設(shè)檢驗(yàn):通過對(duì)總體的特征做出某種假設(shè),然后通過抽樣研究的統(tǒng)計(jì)推理,對(duì)此假設(shè)應(yīng)該被拒絕還是接受做出推斷。統(tǒng)計(jì)指數(shù):通過指數(shù)分析的方法對(duì)統(tǒng)計(jì)指標(biāo)的綜合情況和局部情況進(jìn)行分析。相關(guān)分析:通過分析兩個(gè)或兩個(gè)以上處于同等地位的隨機(jī)變量間的數(shù)據(jù)情況來解釋其相關(guān)關(guān)系,它側(cè)重于發(fā)現(xiàn)隨機(jī)變量間的各種相關(guān)特性?;貧w分析:通過分析兩個(gè)或兩個(gè)以上變量間的數(shù)據(jù)情況來解釋相互依賴的定量關(guān)系,它側(cè)重于研究隨機(jī)變量間的依賴關(guān)系,以便用一個(gè)變量去預(yù)測(cè)另一個(gè)變量。非參數(shù)檢驗(yàn):在總體方差未知或已知較少的情況下,利用樣本數(shù)據(jù)對(duì)總體分布形態(tài)等進(jìn)行推斷。時(shí)間序列:通過對(duì)數(shù)據(jù)在一個(gè)區(qū)域內(nèi)容進(jìn)行一定時(shí)間段的連續(xù)測(cè)試,分析其變化過程與發(fā)展規(guī)模。1.2.4數(shù)據(jù)分析的一般流程數(shù)據(jù)分析的流程1.2.4數(shù)據(jù)分析的一般流程01OPTION02OPTION03OPTION04OPTION確定目標(biāo):數(shù)據(jù)分析之前,首先就要明確分析的目標(biāo),根據(jù)目標(biāo)選擇需要的數(shù)據(jù),進(jìn)而明確數(shù)據(jù)分析想要達(dá)到的效果。數(shù)據(jù)采集:在這個(gè)階段,需要更多地注意數(shù)據(jù)生產(chǎn)和采集過程中的異常情況,從而更好地追本溯源,這也能在很大程度上避免因采集錯(cuò)誤而引起數(shù)據(jù)分析結(jié)果沒有價(jià)值的情況發(fā)生。數(shù)據(jù)處理:針對(duì)的是執(zhí)行采集操作后得到的數(shù)據(jù)不滿足分析要求的情況。數(shù)據(jù)分析:數(shù)據(jù)分析階段需要利用適當(dāng)?shù)姆椒ê凸ぞ撸瑢?duì)處理后的數(shù)據(jù)進(jìn)行分析,提取有價(jià)值的信息,并形成有效的結(jié)論。1.2.4數(shù)據(jù)分析的一般流程05OPTION06OPTION數(shù)據(jù)展現(xiàn):數(shù)據(jù)展現(xiàn)是指將數(shù)據(jù)可視化顯示,圖表是數(shù)據(jù)展現(xiàn)最有效的手段。在這個(gè)階段需要重點(diǎn)考慮所選的圖表類型能夠真實(shí)且完整地反映數(shù)據(jù)特性和分析結(jié)果,另外也需要保證圖表的美觀性,使數(shù)據(jù)特性和分析結(jié)果可以更加清晰地體現(xiàn)。撰寫報(bào)告:數(shù)據(jù)分析報(bào)告是對(duì)整個(gè)數(shù)據(jù)分析過程的總結(jié)與呈現(xiàn)。完成前面各個(gè)環(huán)節(jié)的工作后,就可以通過數(shù)據(jù)分析報(bào)告,將數(shù)據(jù)分析的思路、過程,以及得出的結(jié)果和結(jié)論完整地呈現(xiàn)出來,供報(bào)告使用者參考。目錄/Contents1.11.21.3什么是統(tǒng)計(jì)認(rèn)識(shí)數(shù)據(jù)分析課堂實(shí)訓(xùn)——體驗(yàn)數(shù)據(jù)分析的過程1.3.1實(shí)訓(xùn)目標(biāo)及思路1.印刷類傳播媒介AB報(bào)紙。報(bào)紙是一種以刊載新聞和時(shí)事評(píng)論為主的定期向公眾發(fā)行的印刷出版物,具有信息詳細(xì)且可以保存、內(nèi)容可以選擇、生產(chǎn)成本廉價(jià)等特點(diǎn),在一定程度上能夠反映和引導(dǎo)社會(huì)輿論,在很長(zhǎng)一段時(shí)間內(nèi)是信息傳播的重要載體。雜志。雜志是一種注重時(shí)效性的宣傳冊(cè)頁(yè),相對(duì)于報(bào)紙而言,雜志傳播的信息更加詳盡和明確,且有專業(yè)的人群定位分析,內(nèi)容針對(duì)的用戶更加專業(yè)和精確,因此,在發(fā)行量和用戶量上相對(duì)較少,其傳播和普及的范圍也小于報(bào)紙。1.3.1實(shí)訓(xùn)目標(biāo)及思路本次實(shí)訓(xùn)將利用Excel2016來分析某店鋪訪客數(shù)情況,重點(diǎn)體驗(yàn)數(shù)據(jù)分析的基本思路和Excel2016的操作方法,其中將涉及到簡(jiǎn)單的數(shù)據(jù)對(duì)比分析、趨勢(shì)分析和占比分析,具體思路如圖1-5所示。實(shí)訓(xùn)思路1.3.2操作方法TOP1:選擇數(shù)據(jù)并創(chuàng)建圖表3.單擊4.選擇2.加選1.選擇1.修改2.選擇TOP2:修改圖表標(biāo)題并應(yīng)用圖表樣式1.3.2操作方法TOP3:添加數(shù)據(jù)標(biāo)簽并放大圖表3.拖曳2.選擇TOP4:創(chuàng)建折線圖1.單擊1.3.2操作方法TOP5:分析訪客數(shù)趨勢(shì)TOP6:匯總各商品訪客數(shù)1.3.2操作方法TOP7:按商品類目排序1.3.2操作方法TOP8:分類匯總數(shù)據(jù)1.3.2操作方法TOP9:復(fù)制并移動(dòng)數(shù)據(jù)1.3.2操作方法TOP10:創(chuàng)建餅圖謝謝觀看《統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)》數(shù)據(jù)采集《統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)》02目錄/Contents2.12.22.32.4數(shù)據(jù)的類型與來源數(shù)據(jù)采集的流程與方法常用數(shù)據(jù)采集工具推薦課堂實(shí)訓(xùn)——使用八爪魚采集招聘數(shù)據(jù)2.1.1數(shù)據(jù)的類型圖數(shù)據(jù)的類型2.1.2數(shù)據(jù)的來源一手?jǐn)?shù)據(jù)也稱原始數(shù)據(jù),是指通過直接調(diào)查或科學(xué)實(shí)驗(yàn)等方式直接獲取的數(shù)據(jù)。具體而言,采取實(shí)驗(yàn)觀察、問卷調(diào)查、抽樣調(diào)查等方法可以獲取一手?jǐn)?shù)據(jù),如圖2-2所示。1.一手?jǐn)?shù)據(jù)圖一手?jǐn)?shù)據(jù)的獲取方法2.1.2數(shù)據(jù)的來源二手?jǐn)?shù)據(jù)即他人通過調(diào)查或?qū)嶒?yàn)取得的數(shù)據(jù),如從統(tǒng)計(jì)年鑒中獲取的居民消費(fèi)價(jià)格指數(shù)、從房地產(chǎn)管理部門數(shù)據(jù)庫(kù)獲取的房?jī)r(jià)數(shù)據(jù)等。2.二手?jǐn)?shù)據(jù)根據(jù)渠道的不同,數(shù)據(jù)的來源還有內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)之分。內(nèi)部數(shù)據(jù)主要包括組織或個(gè)人在生產(chǎn)或生活中形成的各種數(shù)據(jù);外部數(shù)據(jù)則是非組織或個(gè)人直接產(chǎn)生的數(shù)據(jù)。專家點(diǎn)撥目錄/Contents2.12.22.32.4數(shù)據(jù)的類型與來源數(shù)據(jù)采集的流程與方法常用數(shù)據(jù)采集工具推薦課堂實(shí)訓(xùn)——使用八爪魚采集招聘數(shù)據(jù)2.2.1數(shù)據(jù)采集的流程在采集數(shù)據(jù)之前,應(yīng)該清楚需要采集什么樣的數(shù)據(jù)和采集數(shù)據(jù)的目的,這樣才能根據(jù)需求和分析對(duì)象開展數(shù)據(jù)采集工作,其基本流程如圖2-3所示。圖數(shù)據(jù)采集的基本流程2.2.2數(shù)據(jù)采集的方法1.問卷調(diào)查(1)問卷內(nèi)容不能過多,題目應(yīng)當(dāng)簡(jiǎn)潔明了,讓受訪對(duì)象感覺可以不用花費(fèi)過多時(shí)間就能完成調(diào)查任務(wù)。(3)問題的答案選項(xiàng)不能過多,一般應(yīng)以多項(xiàng)式或等級(jí)式的方式顯示,方便受訪對(duì)象填寫。(2)問題設(shè)計(jì)應(yīng)緊扣受訪對(duì)象的行為、態(tài)度和基本信息等方面。一些敏感信息可以通過物質(zhì)刺激的方式獲取,如要求受訪對(duì)象填寫手機(jī)號(hào)碼一欄,可以不用強(qiáng)制填寫,但如果填寫,會(huì)將優(yōu)惠券以短信形式發(fā)送到手機(jī)上以供使用。2.2.2數(shù)據(jù)采集的方法就線上采集而言,首先應(yīng)充分利用線上平臺(tái)現(xiàn)有的下載功能直接下載數(shù)據(jù);如果不具備該功能,則可考慮通過復(fù)制粘貼的方式采集到需要的數(shù)據(jù)對(duì)象;如果復(fù)制操作也無法實(shí)現(xiàn),則考慮使用各種數(shù)據(jù)爬取工具爬取數(shù)據(jù)。就目前而言,由于互聯(lián)網(wǎng)科技的不斷發(fā)展,大數(shù)據(jù)應(yīng)用越來越廣泛,因此線上采集數(shù)據(jù)的方式顯得更加可行和高效。2.下載、復(fù)制與爬取目錄/Contents2.12.22.32.4數(shù)據(jù)的類型與來源數(shù)據(jù)采集的流程與方法常用數(shù)據(jù)采集工具推薦課堂實(shí)訓(xùn)——使用八爪魚采集招聘數(shù)據(jù)2.3.1生意參謀登錄到淘寶、天貓等阿里巴巴電商平臺(tái)后,單擊上方導(dǎo)航欄中的“千牛賣家中心”超鏈接,然后在顯示的頁(yè)面左側(cè)單擊“數(shù)據(jù)中心”欄中的“生意參謀”超鏈接,如圖2-5所示,即可進(jìn)入生意參謀數(shù)據(jù)分析與采集平臺(tái),單擊該平臺(tái)導(dǎo)航欄中的不同功能選項(xiàng)卡,則可進(jìn)入到對(duì)應(yīng)的功能板塊。1.基本功能概述圖生意參謀入口2.3.1生意參謀生意參謀中的數(shù)據(jù)可以通過復(fù)制粘貼的方式采集到Excel中,其操作非常簡(jiǎn)單,只需設(shè)置需要顯示的數(shù)據(jù)內(nèi)容,然后拖曳鼠標(biāo)復(fù)制數(shù)據(jù),然后在Excel中進(jìn)行粘貼即可。2.數(shù)據(jù)采集方法圖采集行業(yè)數(shù)據(jù)1TOP1:采集行業(yè)數(shù)據(jù)2.3.1生意參謀圖采集行業(yè)數(shù)據(jù)22.3.1生意參謀TOP2:粘貼數(shù)據(jù)2.3.2京東商智京東商智可以對(duì)店鋪的流量、商品、交易、服務(wù)、供應(yīng)鏈和客戶等數(shù)據(jù)進(jìn)行全方位分析。1.基本功能概述概覽實(shí)時(shí)圖
京東商智首頁(yè)的核心指標(biāo)區(qū)域2.3.2京東商智實(shí)時(shí)流量商品1.基本功能概述圖
京東商智的搜索關(guān)鍵詞分析界面2.3.2京東商智交易服務(wù)供應(yīng)鏈客戶行業(yè)1.基本功能概述圖
京東商智的交易分析界面2.3.2京東商智競(jìng)爭(zhēng)1.基本功能概述圖
京東商智的行業(yè)分析界面2.3.2京東商智2.數(shù)據(jù)采集方法圖
通過下載方式采集數(shù)據(jù)與生意參謀相比,京東商智在采集數(shù)據(jù)方面更加人性化,當(dāng)需要采集數(shù)據(jù)時(shí),只需在相應(yīng)的功能板塊中設(shè)置需要采集的日期后,單擊界面右上角的
按鈕,即可根據(jù)向?qū)崾緦?shù)據(jù)保存下來,如圖2-16所示。2.3.3店偵探1.基本功能概述監(jiān)控中心關(guān)鍵詞分析監(jiān)控店鋪分析此功能主要用于添加并管理監(jiān)控的店鋪和商品。例如,要添加監(jiān)控店鋪時(shí),首先需要注冊(cè)并登錄店偵探網(wǎng)站,單擊左側(cè)導(dǎo)航欄中的“監(jiān)控中心”功能下的“店鋪管理”超鏈接,然后單擊右側(cè)的”添加監(jiān)控店鋪”
按鈕,此時(shí)將打開添加監(jiān)控店鋪的對(duì)話框,在其中的文本框中輸入或復(fù)制競(jìng)爭(zhēng)店鋪的某一款商品的網(wǎng)址,然后依次單擊“預(yù)覽店鋪”和“添加監(jiān)控”按鈕即可添加該競(jìng)店單擊店偵探頂部導(dǎo)航欄中的“全網(wǎng)展示詞”超鏈接,在顯示的頁(yè)面中輸入需要分析的關(guān)鍵詞,如“新款”,單擊“搜索”按鈕即可顯示淘寶和天貓的關(guān)鍵詞綜合搜索排名情況單擊店偵探左側(cè)導(dǎo)航欄中的“監(jiān)控店鋪分析”功能,在展開的目錄中即可分析競(jìng)店的各種數(shù)據(jù),包括競(jìng)店整體狀況分析、銷售分析、流量來源分析、活動(dòng)分析、寶貝分析等。使用方法為:?jiǎn)螕裟硞€(gè)分析超鏈接,展開其下的子目錄,然后單擊對(duì)應(yīng)的超鏈接即可。2.3.3店偵探2.數(shù)據(jù)采集方法在店偵探中,可以利用“導(dǎo)出數(shù)據(jù)”按鈕或“導(dǎo)出”按鈕將當(dāng)前界面中的數(shù)據(jù)采集到計(jì)算機(jī)中,方法為:?jiǎn)螕簟皩?dǎo)出數(shù)據(jù)”按鈕或“導(dǎo)出”按鈕,自動(dòng)啟動(dòng)已有的下載軟件,設(shè)置文件下載后的保存名稱和保存位置即可。采集到的數(shù)據(jù)將保存在Excel表格中,需要時(shí)便可打開該表格進(jìn)行處理和分析。2.3.4八爪魚采集器八爪魚采集器內(nèi)置了大量的采集模板,模板中已經(jīng)設(shè)置好采集任務(wù)和采集內(nèi)容,啟用模板就能快速完成數(shù)據(jù)采集工作。1.模板采集【實(shí)驗(yàn)室】采集京東商品搜索數(shù)據(jù)TOP1:登錄八爪魚采集器TOP2:新建模板任務(wù)2.3.4八爪魚采集器TOP4:選擇采集模板TOP3:選擇網(wǎng)站模板2.3.4八爪魚采集器TOP5:所選模板詳情2.3.4八爪魚采集器TOP6:設(shè)置任務(wù)的基本信息和配置參數(shù)TOP7:選擇采集方式2.3.4八爪魚采集器TOP8:顯示采集過程TOP9:數(shù)據(jù)采集完成2.3.4八爪魚采集器TOP10:選擇導(dǎo)出方式TOP11:設(shè)置保存位置和名稱2.3.4八爪魚采集器TOP12:導(dǎo)出數(shù)據(jù)TOP13:采集到的數(shù)據(jù)2.3.4八爪魚采集器2.自動(dòng)識(shí)別【實(shí)驗(yàn)室】通過自動(dòng)識(shí)別采集租房數(shù)據(jù)TOP1:自定義采集任務(wù)2.3.4八爪魚采集器TOP2:新建任務(wù)TOP3:自動(dòng)識(shí)別網(wǎng)頁(yè)數(shù)據(jù)2.3.4八爪魚采集器TOP4:完成識(shí)別TOP5:頁(yè)面滾動(dòng)設(shè)置2.3.4八爪魚采集器TOP6:設(shè)置翻頁(yè)采集數(shù)據(jù)TOP7:刪除字段2.3.4八爪魚采集器TOP8:修改字段名稱TOP9:刪除數(shù)據(jù)2.3.4八爪魚采集器TOP10:調(diào)整字段排列順序TOP11:生成采集設(shè)置2.3.4八爪魚采集器TOP12:開始采集數(shù)據(jù)TOP13:本地采集2.3.4八爪魚采集器TOP14:停止采集TOP15:確認(rèn)停止采集數(shù)據(jù)2.3.4八爪魚采集器TOP16:導(dǎo)出數(shù)據(jù)TOP17:去掉重復(fù)數(shù)據(jù)TOP18:選擇導(dǎo)出方式TOP19:設(shè)置保存位置和名稱2.3.4八爪魚采集器TOP20:采集到的數(shù)據(jù)2.3.4八爪魚采集器3.手動(dòng)采集如果需要采集數(shù)據(jù)的網(wǎng)頁(yè)既沒有模板,也無法識(shí)別,則可以通過手動(dòng)采集的方式采集數(shù)據(jù)。其方法為:新建采集任務(wù),取消自動(dòng)識(shí)別數(shù)據(jù)的狀態(tài),手動(dòng)采集需要的各個(gè)字段,設(shè)置字段名稱和位置,然后采集數(shù)據(jù)并導(dǎo)出到Excel中即可,其流程如圖2-53所示。圖
手動(dòng)采集數(shù)據(jù)的流程2.3.5火車采集器1.普通網(wǎng)址采集【實(shí)驗(yàn)室】采集豆瓣圖書數(shù)據(jù)TOP1:登錄火車采集器TOP2:新建采集任務(wù)TOP3:復(fù)制網(wǎng)址2.3.5火車采集器TOP4:審查元素TOP5:查看代碼TOP6:繼續(xù)查看代碼TOP7:設(shè)置過濾條件TOP8:采集測(cè)試2.3.5火車采集器TOP9:繼續(xù)設(shè)置過濾條件TOP10:再次測(cè)試TOP11:修改字段名稱TOP12:繼續(xù)修改字段名稱2.3.5火車采集器TOP13:添加字段TOP14:復(fù)制代碼TOP15:粘貼代碼2.3.5火車采集器TOP16:設(shè)置前后字符串TOP17:設(shè)置代碼TOP18:繼續(xù)設(shè)置代碼2.3.5火車采集器TOP19:測(cè)試成功TOP20:設(shè)置保存參數(shù)TOP21:打開文本文件模板TOP22:設(shè)置模板內(nèi)容2.3.5火車采集器TOP23:設(shè)置文件保存位置TOP24:保存采集任務(wù)TOP26:查看采集到的數(shù)據(jù)TOP25:開始采集數(shù)據(jù)2.3.5火車采集器2.批量網(wǎng)址采集TOP1:批量網(wǎng)址設(shè)置向?qū)OP3:設(shè)置參數(shù)變化規(guī)則TOP2:復(fù)制網(wǎng)址TOP4:保存任務(wù)目錄/Contents2.12.22.32.4數(shù)據(jù)的類型與來源數(shù)據(jù)采集的流程與方法常用數(shù)據(jù)采集工具推薦課堂實(shí)訓(xùn)——使用八爪魚采集招聘數(shù)據(jù)2.4.1實(shí)訓(xùn)目標(biāo)及思路本次實(shí)訓(xùn)將在BOSS直聘網(wǎng)站中采集與“室內(nèi)設(shè)計(jì)師”相關(guān)的招聘信息,需要采集到公司名稱、成立時(shí)間、法人代表、招聘職位、月薪等數(shù)據(jù)。采集時(shí)將涉及到詳情頁(yè)內(nèi)容的采集,具體操作思路如圖2-84所示。2.4.2操作方法TOP1:復(fù)制網(wǎng)址TOP2:新建任務(wù)2.4.2操作方法TOP3:建立任務(wù)TOP4:取消自動(dòng)識(shí)別2.4.2操作方法TOP5:選擇網(wǎng)頁(yè)元素TOP6:創(chuàng)建循環(huán)采集規(guī)則2.4.2操作方法TOP7:采集網(wǎng)頁(yè)元素TOP8:設(shè)置字段2.4.2操作方法TOP9:修改字段名稱TOP10:?jiǎn)?dòng)本地采集功能2.4.2操作方法TOP11:采集完成TOP12:設(shè)置導(dǎo)出方式TOP13:設(shè)置保存位置和名稱2.4.2操作方法TOP14:數(shù)據(jù)導(dǎo)出完成TOP15:采集到的招聘數(shù)據(jù)謝謝觀看《統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)》數(shù)據(jù)處理《統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)》03目錄/Contents3.13.23.3數(shù)據(jù)清洗數(shù)據(jù)加工課堂實(shí)訓(xùn)——清洗并加工行業(yè)穩(wěn)定性數(shù)據(jù)3.1.1缺失值修復(fù)1.保留缺失數(shù)據(jù)保留缺失值,優(yōu)點(diǎn)是保證了樣本的完整性,但前提是該缺失值具備保留的意義,否則就應(yīng)該通過刪除或補(bǔ)全操作進(jìn)行清洗處理。2.刪除缺失數(shù)據(jù)AB篩選:在【數(shù)據(jù)】→【排序和篩選】組中單擊“篩選”按鈕,單擊缺失數(shù)據(jù)所在項(xiàng)目的下拉按鈕,在彈出的下拉列表中僅選中“(空白)”復(fù)選框,單擊“確認(rèn)”按鈕。定位:在【開始】→【編輯】組中單擊“查找和選擇”下拉按鈕,在彈出的下拉列表中選擇“定位條件”命令,打開“定位條件”對(duì)話框,選中“空值”單選項(xiàng),單擊“確認(rèn)”按鈕。3.1.1缺失值修復(fù)【實(shí)驗(yàn)室】修復(fù)招聘數(shù)據(jù)中缺失的學(xué)歷3.修補(bǔ)缺失數(shù)據(jù)TOP1:定位數(shù)據(jù)TOP2:設(shè)置定位條件3.1.1缺失值修復(fù)TOP3:快速輸入相同數(shù)據(jù)3.1.2錯(cuò)誤值修復(fù)1.IFERROR函數(shù)修復(fù)Excel中出現(xiàn)的錯(cuò)誤信息時(shí),一般可以利用IFERROR函數(shù)實(shí)現(xiàn),該函數(shù)的語(yǔ)法格式為“IFERROR(value,value_if_error)”,其中,參數(shù)“value”表示當(dāng)不存在錯(cuò)誤時(shí)的取值;參數(shù)“value_if_error”為存在錯(cuò)誤時(shí)的取值。符號(hào)產(chǎn)生原因解決方法#####!①單元格中的數(shù)字、日期或時(shí)間數(shù)據(jù)長(zhǎng)度大于單元格寬度②單元格中的日期或時(shí)間公式產(chǎn)生了負(fù)值拖曳列標(biāo)增加單元格寬度②更正公式或?qū)卧窀袷皆O(shè)置為非日期和時(shí)間型數(shù)據(jù)#VALUE!①需要數(shù)字或邏輯值時(shí)輸入了文本②將單元格引用、公式或函數(shù)作為數(shù)組常量輸入③賦予需要單一數(shù)值的運(yùn)算符或函數(shù)一個(gè)數(shù)值區(qū)域①確認(rèn)公式或函數(shù)所需的運(yùn)算符或參數(shù)正確,并且公式引用的單元格中包含有效的數(shù)值②確認(rèn)數(shù)組常量不是單元格引用、公式或函數(shù)③將數(shù)值區(qū)域改為單一數(shù)值#DIV/O!①公式中的除數(shù)使用了指向空白單元格或包含零值單元格的引用②輸入的公式中包含明顯的除數(shù)零①修改單元格引用,或在用作除數(shù)的單元格中輸入不為零的值②將零改為非零值2.Excel錯(cuò)誤信息的含義3.1.2錯(cuò)誤值修復(fù)符號(hào)產(chǎn)生原因解決方法符號(hào)產(chǎn)生原因解決方法#NAME?①刪除了公式中使用的名稱,或使用了不存在的名稱②名稱出現(xiàn)拼寫錯(cuò)誤③公式中輸入文本時(shí)未使用雙引號(hào)④單元格區(qū)域引用時(shí)缺少冒號(hào)①確認(rèn)使用的名稱確實(shí)存在②修改拼寫錯(cuò)誤的名稱③將公式中的文本括在英文狀態(tài)下的雙引號(hào)中④確認(rèn)公式中使用的所有單元格區(qū)域引用中都使用了英文狀態(tài)下的冒號(hào)#N/A單元格的函數(shù)或公式中沒有可用數(shù)值可以忽略或在這些單元格中輸入“#N/A”,公式在引用這些單元格時(shí),將不進(jìn)行數(shù)值計(jì)算,而是返回“#N/A”#REF!刪除了由其他公式引用的單元格或?qū)卧裾迟N到由其他公式引用的單元格中更改公式或在刪除或粘貼單元格之后,單擊快速訪問工具欄中的“撤銷”按鈕
#NULL!使用了不正確的區(qū)域運(yùn)算符或引用的單元格區(qū)域的交集為空更改區(qū)域運(yùn)算符使之正確,或更改引用使之相交#NUM!公式或函數(shù)中的某個(gè)數(shù)值出現(xiàn)問題更正錯(cuò)誤的數(shù)值3.1.2錯(cuò)誤值修復(fù)【實(shí)驗(yàn)室】修復(fù)庫(kù)存周轉(zhuǎn)率中的錯(cuò)誤值TOP1:選擇單元格區(qū)域TOP2:輸入公式TOP3:修復(fù)數(shù)據(jù)3.1.3邏輯錯(cuò)誤修復(fù)數(shù)據(jù)不合理:數(shù)據(jù)不符合規(guī)則:數(shù)據(jù)自相矛盾:如客戶年齡300歲、消費(fèi)金額-50元等,明顯不符合客觀情況的數(shù)據(jù)。如要求限購(gòu)1件的商品,但購(gòu)買數(shù)量卻顯示為5件。如客戶出生年份為1983年,但當(dāng)前年齡卻顯示為17歲。
3.1.3邏輯錯(cuò)誤修復(fù)TOP2:編輯公式TOP1:新建格式規(guī)則【實(shí)驗(yàn)室】標(biāo)記店鋪流量渠道中的錯(cuò)誤數(shù)據(jù)3.1.3邏輯錯(cuò)誤修復(fù)TOP3:設(shè)置格式TOP4:確認(rèn)設(shè)置3.1.3邏輯錯(cuò)誤修復(fù)TOP5:標(biāo)記其他邏輯錯(cuò)誤數(shù)據(jù)3.1.4統(tǒng)一數(shù)據(jù)格式1.設(shè)置數(shù)據(jù)類型2.查找和替換數(shù)據(jù)3.1.4統(tǒng)一數(shù)據(jù)格式【實(shí)驗(yàn)室】統(tǒng)一采集競(jìng)爭(zhēng)對(duì)手的數(shù)據(jù)格式2.查找和替換數(shù)據(jù)TOP1:輸入查找和替換的內(nèi)容TOP2:確認(rèn)替換3.1.4統(tǒng)一數(shù)據(jù)格式TOP3:查找和替換其他數(shù)據(jù)TOP4:繼續(xù)查找和替換其他數(shù)據(jù)TOP5:選擇多個(gè)單元格區(qū)域3.1.4統(tǒng)一數(shù)據(jù)格式TOP6:設(shè)置數(shù)據(jù)類型TOP7:統(tǒng)一數(shù)據(jù)類型后的效果3.1.5清理重復(fù)數(shù)據(jù)【實(shí)驗(yàn)室】去除重復(fù)測(cè)試商品的營(yíng)銷效果數(shù)據(jù)TOP1:設(shè)置檢查項(xiàng)目TOP2:確認(rèn)操作目錄/Contents3.13.23.3數(shù)據(jù)清洗數(shù)據(jù)加工課堂實(shí)訓(xùn)——清洗并加工行業(yè)穩(wěn)定性數(shù)據(jù)3.2.1數(shù)據(jù)分列【實(shí)驗(yàn)室】將“姓名”列分隔為“姓”和“名”兩列TOP1:插入列TOP2:執(zhí)行數(shù)據(jù)分列操作TOP3:選擇分隔方式3.2.1數(shù)據(jù)分列TOP4:建立分列線TOP5:設(shè)置數(shù)據(jù)格式TOP6:完成數(shù)據(jù)分列操作3.2.2數(shù)據(jù)排列與篩選快速排序:所謂快速排序,是指利用功能區(qū)的排序按鈕快速實(shí)現(xiàn)數(shù)據(jù)排序的目的。選擇需排序的數(shù)據(jù)區(qū)域后,單擊【數(shù)據(jù)】→【排序和篩選】組中的“升序”按鈕或“降序”按鈕即可。關(guān)鍵字排序:如果排序數(shù)據(jù)較復(fù)雜,需要以多種條件才能實(shí)現(xiàn)排列時(shí),可以使用關(guān)鍵字進(jìn)行排序。其方法為:選擇需排序的數(shù)據(jù)區(qū)域,單擊“排序和篩選”組中的“排序”按鈕,打開“排序”對(duì)話框,在其中設(shè)置關(guān)鍵字、排序依據(jù)和次序即可,如圖所示。1.數(shù)據(jù)排序3.2.2數(shù)據(jù)排列與篩選自動(dòng)篩選:選擇需要進(jìn)行篩選的數(shù)據(jù)區(qū)域,單擊【數(shù)據(jù)】→【排序和篩選】組中的“篩選”按鈕,進(jìn)入篩選狀態(tài),單擊某個(gè)項(xiàng)目數(shù)據(jù)右側(cè)的下拉按鈕,選擇“數(shù)字篩選”命令,并根據(jù)需要在彈出的子列表中選擇需要的篩選條件并進(jìn)行設(shè)置即可,如左圖所示。手動(dòng)篩選:方法為:手動(dòng)輸入篩選條件,然后單擊“排序和篩選”組中的“高級(jí)”按鈕,打開“高級(jí)篩選”對(duì)話框,指定數(shù)據(jù)區(qū)域和篩選條件區(qū)域,確認(rèn)操作即可,如右圖所示。2.數(shù)據(jù)篩選3.2.2數(shù)據(jù)排列與篩選TOP1:按排名排列數(shù)據(jù)TOP2:設(shè)置主要關(guān)鍵字【實(shí)驗(yàn)室】排列與篩選銷售數(shù)據(jù)TOP3:添加次要關(guān)鍵字3.2.2數(shù)據(jù)排列與篩選TOP4:選擇篩選條件TOP5:設(shè)置篩選條件【實(shí)驗(yàn)室】排列與篩選銷售數(shù)據(jù)TOP6:清除篩選結(jié)果3.2.2數(shù)據(jù)排列與篩選TOP7:輸入篩選條件TOP8:設(shè)置高級(jí)篩選參數(shù)【實(shí)驗(yàn)室】排列與篩選銷售數(shù)據(jù)TOP9:篩選結(jié)果3.2.3數(shù)據(jù)行列的轉(zhuǎn)換通過按鈕轉(zhuǎn)置:?jiǎn)螕簟鹃_始】→【剪貼板】組中的“粘貼”按鈕下方的下拉按鈕,在彈出的下拉列表中單擊“轉(zhuǎn)置”按鈕。通過對(duì)話框轉(zhuǎn)置:?jiǎn)螕簟鹃_始】→【剪貼板】組中的“粘貼”按鈕下方的下拉按鈕,在彈出的下拉列表中選擇“選擇性粘貼”命令,在打開的對(duì)話框中選中“轉(zhuǎn)置”復(fù)選框,單擊“確認(rèn)”按鈕。3.2.3數(shù)據(jù)行列的轉(zhuǎn)換TOP1:復(fù)制數(shù)據(jù)TOP2:刪除原有數(shù)據(jù)【實(shí)驗(yàn)室】轉(zhuǎn)置商品房銷售數(shù)據(jù)TOP3:調(diào)整行高與列寬3.2.4數(shù)據(jù)計(jì)算1.認(rèn)識(shí)Excel公式常量:不會(huì)變化的數(shù)據(jù),如數(shù)字和文本,文本需用英文狀態(tài)下的引號(hào)括起來。運(yùn)算符:公式進(jìn)行運(yùn)算的符號(hào),如加號(hào)“+”、乘號(hào)“*”、除號(hào)“/”等。單元格(區(qū)域)引用:即單元格地址,代表計(jì)算該地址所對(duì)應(yīng)的單元格(區(qū)域)中的數(shù)據(jù)。函數(shù):相當(dāng)于公式中的一個(gè)參數(shù),參與計(jì)算的數(shù)據(jù)為函數(shù)返回的結(jié)果。函數(shù)的語(yǔ)法結(jié)構(gòu)為“函數(shù)名(參數(shù)1,參數(shù)2,參數(shù)3,…)”,如求和函數(shù)SUM(A1:A3,B2:B4)就表示計(jì)算A1:A3單元格區(qū)域之和與B2:B4單元格區(qū)域之和,并匯總這兩個(gè)結(jié)果。當(dāng)該函數(shù)出現(xiàn)在某個(gè)公式中時(shí),則匯總的結(jié)果就是公式的參數(shù)。3.2.4數(shù)據(jù)計(jì)算2.公式的引用相對(duì)引用:指公式中引用的單元格地址會(huì)隨公式所在單元格的位置變化而相對(duì)改變。絕對(duì)引用:指無論公式所在單元格地址如何變化,公式中引用的單元格地址始終不變。混合引用:指公式的單元格引用中既有相對(duì)引用,又有絕對(duì)引用的情況。3.2.4數(shù)據(jù)計(jì)算TOP1:輸入函數(shù)TOP2:計(jì)算銷售總額【實(shí)驗(yàn)室】計(jì)算商品銷售及占比情況TOP3:輸入公式2.公式的引用3.2.4數(shù)據(jù)計(jì)算TOP4:計(jì)算禮品類銷售占比TOP5:計(jì)算工藝品類銷售占比TOP6:計(jì)算飾品類銷售占比3.2.5數(shù)據(jù)匯總TOP1:排序數(shù)據(jù)TOP2:設(shè)置分類匯總參數(shù)【實(shí)驗(yàn)室】匯總各部門的銷售總額與平均銷售額TOP3:分類匯總結(jié)果3.2.5數(shù)據(jù)匯總TOP4:設(shè)置分類匯總參數(shù)TOP5:分類匯總結(jié)果3.2.6數(shù)據(jù)提取LEFT函數(shù):其語(yǔ)法格式為“=LEFT(text,num_chars)”,表示從指定的單元格中返回左側(cè)的1個(gè)或多個(gè)字符。MID函數(shù):其語(yǔ)法格式為“=MID(text,start_num,num_chars)”,表示從指定的單元格中的指定位置返回1個(gè)或多個(gè)字符。RIGHT函數(shù):其語(yǔ)法格式為“=RIGHT(text,num_chars)”,表示從指定的單元格中返回右側(cè)的1個(gè)或多個(gè)字符。3.2.6數(shù)據(jù)提取【實(shí)驗(yàn)室】通過提取數(shù)據(jù)判斷庫(kù)存商品TOP1:輸入IF函數(shù)TOP2:選擇嵌套函數(shù)TOP3:選擇LEFT函數(shù)3.2.6數(shù)據(jù)提取TOP4:設(shè)置函數(shù)參數(shù)TOP5:關(guān)閉對(duì)話框TOP6:設(shè)置IF函數(shù)條件3.2.6數(shù)據(jù)提取TOP7:設(shè)置返回的真值TOP8:復(fù)制嵌套函數(shù)TOP9:修改函數(shù)內(nèi)容3.2.6數(shù)據(jù)提取TOP10:返回結(jié)果TOP11:判斷商品功能TOP12:判斷是否為新品目錄/Contents3.13.23.3數(shù)據(jù)清洗數(shù)據(jù)加工課堂實(shí)訓(xùn)——清洗并加工行業(yè)穩(wěn)定性數(shù)據(jù)3.3.1實(shí)訓(xùn)目標(biāo)及思路本次實(shí)訓(xùn)將對(duì)已經(jīng)采集到的行業(yè)數(shù)據(jù)進(jìn)行清洗,然后利用Excel的公式與函數(shù)計(jì)算出各行業(yè)的標(biāo)準(zhǔn)差、平均值、波動(dòng)系數(shù)和極差數(shù)據(jù),以便分析各市場(chǎng)的行業(yè)穩(wěn)定性。具體操作思路如圖3-73所示。3.3.2操作方法TOP1:調(diào)整錯(cuò)誤的日期數(shù)據(jù)TOP2:選擇數(shù)據(jù)類型TOP3:選擇數(shù)據(jù)對(duì)象3.3.2操作方法TOP4:添加千位分隔符TOP5:調(diào)整小數(shù)位數(shù)
TOP6:調(diào)整對(duì)齊方式3.3.2操作方法TOP7:調(diào)整字體字號(hào)
TOP8:輸入文本并插入函數(shù)TOP9:選擇函數(shù)3.3.2操作方法TOP10:設(shè)置函數(shù)參數(shù)TOP11:填充函數(shù)TOP12:計(jì)算平均值3.3.2操作方法TOP13:計(jì)算波動(dòng)系數(shù)
TOP14:計(jì)算極差謝謝觀看《統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)》描述性統(tǒng)計(jì)分析《統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)》04目錄/Contents4.14.24.34.4集中趨勢(shì)的統(tǒng)計(jì)分析離散程度的統(tǒng)計(jì)分析分布形態(tài)的統(tǒng)計(jì)分析課堂實(shí)訓(xùn)——生產(chǎn)資料市場(chǎng)價(jià)格分析4.1.1集中趨勢(shì)的含義集中趨勢(shì)反映了一組數(shù)據(jù)中心點(diǎn)所在的位置,統(tǒng)計(jì)分析集中趨勢(shì),不僅可以找到數(shù)據(jù)的中心值或一般水平的代表值,還可以發(fā)現(xiàn)數(shù)據(jù)向其中心值靠攏的傾向和程度。比如全國(guó)人均GDP(GrossDomesticProduct,國(guó)內(nèi)生產(chǎn)總值)就是一個(gè)集中趨勢(shì)指標(biāo),反映的是人均國(guó)內(nèi)生產(chǎn)總值的情況。雖然每個(gè)人對(duì)GDP的貢獻(xiàn)度不同,但人均GDP能夠反映一個(gè)國(guó)家的經(jīng)濟(jì)發(fā)展水平。4.1.2算術(shù)平均值算術(shù)平均值指的是一組數(shù)據(jù)相加后除以數(shù)據(jù)個(gè)數(shù)的結(jié)果,它可以反映出一組數(shù)據(jù)的平均水平,如上文所述的人均GDP。該指標(biāo)的優(yōu)點(diǎn)在于利用了所有數(shù)據(jù)的信息,缺點(diǎn)則是容易受極端值的影響,這樣會(huì)導(dǎo)致結(jié)果的代表性較差。1.簡(jiǎn)單算術(shù)平均值
在Excel中,可以直接使用AVERAGE函數(shù)計(jì)算某一組數(shù)據(jù)的簡(jiǎn)單算術(shù)平均值。4.1.2算術(shù)平均值2.加權(quán)算術(shù)平均值
在Excel中,可以使用SUMPRODUCT函數(shù)計(jì)算加權(quán)算術(shù)平均值公式中的分子部分。該函數(shù)可以返回對(duì)應(yīng)區(qū)域的乘積之和。4.1.2算術(shù)平均值【實(shí)驗(yàn)室】掌握西紅柿試驗(yàn)田的平均產(chǎn)量情況TOP1:計(jì)算A品種西紅柿平均產(chǎn)量TOP2:計(jì)算其他品種西紅柿的平均產(chǎn)量4.1.2算術(shù)平均值TOP3:計(jì)算A品種西紅柿的權(quán)數(shù)TOP4:計(jì)算其他品種西紅柿的權(quán)數(shù)4.1.2算術(shù)平均值TOP5:應(yīng)用SUMPRODUCT函數(shù)TOP6:應(yīng)用SUM函數(shù)4.1.2算術(shù)平均值TOP7:計(jì)算加權(quán)算術(shù)平均值TOP8:計(jì)算簡(jiǎn)單算術(shù)平均值4.1.3中位數(shù)AB中位數(shù):是指將一組數(shù)據(jù)按從小到大或從大到小的順序排列后,處于中間位置上的數(shù)據(jù)。當(dāng)一組數(shù)據(jù)中含有異?;驑O端的數(shù)據(jù)時(shí),通過算術(shù)平均值這個(gè)指標(biāo)就有可能得到代表性不高甚至錯(cuò)誤的結(jié)果,此時(shí)則可以使用中位數(shù)來作為該組數(shù)據(jù)的代表值。
4.1.3中位數(shù)【實(shí)驗(yàn)室】識(shí)破招聘啟事中的工資待遇陷阱TOP1:插入函數(shù)TOP2:選擇函數(shù)4.1.3中位數(shù)TOP3:設(shè)置函數(shù)參數(shù)TOP4:再次設(shè)置函數(shù)參數(shù)4.1.3中位數(shù)TOP6:返回計(jì)算結(jié)果TOP5:繼續(xù)設(shè)置函數(shù)參數(shù)4.1.4眾數(shù)眾數(shù)眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)頻率最高的數(shù)值,這個(gè)指標(biāo)對(duì)定類數(shù)據(jù)、定序數(shù)據(jù)、定距數(shù)據(jù)和定比數(shù)據(jù)都適用,能表示由它們組成的一組數(shù)據(jù)的集中趨勢(shì)。注意如果在一組數(shù)據(jù)中,只有一個(gè)數(shù)值出現(xiàn)的次數(shù)最多,就稱這個(gè)數(shù)值為該組數(shù)據(jù)的眾數(shù);如果有兩個(gè)或多個(gè)數(shù)值的出現(xiàn)次數(shù)并列最多,則稱這兩個(gè)或多個(gè)數(shù)值都是該組數(shù)據(jù)的眾數(shù);如果所有數(shù)值出現(xiàn)的次數(shù)都相同,則稱該組數(shù)據(jù)沒有眾數(shù)。4.1.4眾數(shù)【實(shí)驗(yàn)室】通過眾數(shù)票選出班級(jí)口號(hào)TOP1:插入函數(shù)TOP2:選擇函數(shù)4.1.4眾數(shù)TOP3:設(shè)置函數(shù)參數(shù)TOP4:繼續(xù)設(shè)置函數(shù)參數(shù)4.1.4眾數(shù)TOP5:返回計(jì)算結(jié)果目錄/Contents4.14.24.34.4集中趨勢(shì)的統(tǒng)計(jì)分析離散程度的統(tǒng)計(jì)分析分布形態(tài)的統(tǒng)計(jì)分析課堂實(shí)訓(xùn)——生產(chǎn)資料市場(chǎng)價(jià)格分析4.2.1離散程度的含義在統(tǒng)計(jì)學(xué)中,把反映總體中各個(gè)個(gè)體的變量值之間差異程度的指標(biāo)稱為離散程度,也稱為離中趨勢(shì)。在同類離散指標(biāo)的比較中,離散指標(biāo)的數(shù)值越小,說明該組數(shù)據(jù)的波動(dòng)(變異)程度越?。浑x散指標(biāo)的數(shù)值越大,則說明該組數(shù)據(jù)的波動(dòng)(變異)程度越大。描述一組數(shù)據(jù)離散程度的指標(biāo)有很多,常用的包括極差、四分位差、平均差、方差、標(biāo)準(zhǔn)差、變異系數(shù)等,使用這些指標(biāo),并結(jié)合集中趨勢(shì)的描述,就可以更好地發(fā)現(xiàn)數(shù)據(jù)的特性。4.2.2極差極差又稱范圍誤差或全距,通常以R表示,反映的是一組數(shù)據(jù)中最大值與最小值之間的差距,其計(jì)算公式如下:
由于極差是一組數(shù)據(jù)中最大值與最小值之差,因此該組數(shù)據(jù)中任何兩個(gè)變量之差自然都不會(huì)超過極差。這一特性,使得極差能夠刻畫出一組數(shù)據(jù)中變量分布的變異范圍和離散幅度,能體現(xiàn)出一組數(shù)據(jù)波動(dòng)的范圍。一組數(shù)據(jù)的極差越大,該組數(shù)據(jù)的離散程度越大;極差越小,離散程度則越小。注意:極差只能反映一組數(shù)據(jù)的最大離散范圍,未能利用該組數(shù)據(jù)的所有信息,不能細(xì)致地反映出變量彼此之間的離散,從而不能反映變量分布情況,同時(shí)極差也易受極端值的影響。4.2.2極差TOP2:繼續(xù)輸入函數(shù)TOP1:輸入函數(shù)【實(shí)驗(yàn)室】通過極差觀察氣溫變化4.2.2極差TOP4:填充公式TOP3:計(jì)算2019年的氣溫極差4.2.3四分位差如果將一組數(shù)據(jù)按從小到大或從大到小的順序排列后等分為4份,則處于該組數(shù)據(jù)25%位置上的數(shù)據(jù)稱為上四分位數(shù)QL,處于50%位置上的數(shù)據(jù)稱為中位數(shù),處于75%位置上的數(shù)據(jù)稱為下四分位數(shù)QU。四分位差Q_d則指的是上四分位數(shù)QU與下四分位數(shù)QL之差,即Q_d=Q_U-Q_L,如圖所示。
4.2.3四分位差TOP2:設(shè)置函數(shù)參數(shù)TOP1:選擇函數(shù)【實(shí)驗(yàn)室】利用四分位差分析全班的數(shù)學(xué)成績(jī)4.2.3四分位差TOP2:繼續(xù)輸入函數(shù)TOP3:繼續(xù)設(shè)置函數(shù)參數(shù)4.2.4平均差
例如,一組數(shù)據(jù)包含的數(shù)值有20、40、60、80、100,則該數(shù)據(jù)的平均差為:
4.2.4平均差【實(shí)驗(yàn)室】使用平均差分析銷售部門的銷量TOP1:輸入函數(shù)并引用單元格區(qū)域TOP2:返回銷售1部的平均差數(shù)據(jù)4.2.4平均差【實(shí)驗(yàn)室】使用平均差分析銷售部門的銷量TOP1:輸入函數(shù)并引用單元格區(qū)域TOP2:返回銷售1部的平均差數(shù)據(jù)4.2.4平均差TOP3:計(jì)算銷售2部的平均差數(shù)據(jù)TOP4:計(jì)算銷售3部的平均差數(shù)據(jù)4.2.4平均差TOP5:計(jì)算平均銷量4.2.5方差與標(biāo)準(zhǔn)差
總體標(biāo)準(zhǔn)差σ的計(jì)算公式則為:1.總體的方差和標(biāo)準(zhǔn)差
4.2.5方差與標(biāo)準(zhǔn)差
2.樣本的方差和標(biāo)準(zhǔn)差
4.2.5方差與標(biāo)準(zhǔn)差【實(shí)驗(yàn)室】分析籃球隊(duì)每一百回合得分?jǐn)?shù)據(jù)TOP1:選擇函數(shù)TOP2:設(shè)置函數(shù)參數(shù)4.2.5方差與標(biāo)準(zhǔn)差TOP3:計(jì)算總體方差TOP4:計(jì)算樣本標(biāo)準(zhǔn)差4.2.5方差與標(biāo)準(zhǔn)差TOP5:計(jì)算樣本方差4.2.6變異系數(shù)變異系數(shù)是用絕對(duì)值形式的離散指標(biāo)與平均值相除的結(jié)果,是用比率的形式反映離散程度大小的一種指標(biāo),通常用標(biāo)準(zhǔn)差除以算術(shù)平均值的百分?jǐn)?shù)來表示。總體的變異系數(shù)計(jì)算公式如下。
樣本的變異系數(shù)計(jì)算公式如下。
注意:變異系數(shù)是無單位指標(biāo),它不僅可以說明同類數(shù)據(jù)的相對(duì)離散程度,還可以說明不同類型數(shù)據(jù)的相對(duì)離散程度。3.1.3邏輯錯(cuò)誤修復(fù)TOP1:計(jì)算成品衣柜的樣本標(biāo)準(zhǔn)差【實(shí)驗(yàn)室】分析衣柜與五金件的價(jià)格波動(dòng)幅度TOP2:計(jì)算五金件的樣本標(biāo)準(zhǔn)差3.1.3邏輯錯(cuò)誤修復(fù)TOP3:計(jì)算算術(shù)平均值TOP4:計(jì)算成品衣柜的變異系數(shù)3.1.3邏輯錯(cuò)誤修復(fù)TOP5:計(jì)算五金件的變異系數(shù)目錄/Contents4.14.24.34.4集中趨勢(shì)的統(tǒng)計(jì)分析離散程度的統(tǒng)計(jì)分析分布形態(tài)的統(tǒng)計(jì)分析課堂實(shí)訓(xùn)——生產(chǎn)資料市場(chǎng)價(jià)格分析4.3.1偏度與峰度偏度描述的是樣本分布的偏斜方向和程度,偏度系數(shù)則是以正態(tài)分布為標(biāo)準(zhǔn)來描述數(shù)據(jù)對(duì)稱性的指標(biāo)。如果偏度系數(shù)大于0,則高峰向左偏移,長(zhǎng)尾向右側(cè)延伸,稱為正偏態(tài)分布;如果偏度系數(shù)等于0,則為正態(tài)分布;如果偏度系數(shù)小于0,則高峰向右偏移,長(zhǎng)尾向左延伸,稱為負(fù)偏態(tài)分布,如圖4-48所示。1.偏度4.3.1偏度與峰度峰度描述的是樣本分布曲線的尖峰程度,峰度系數(shù)則是以正態(tài)分布為標(biāo)準(zhǔn)來描述分布曲線峰頂尖峭程度的指標(biāo)。如果峰度系數(shù)大于0,則兩側(cè)極端數(shù)據(jù)較少,比正態(tài)分布更高更窄,呈尖峭峰分布;如果峰度系數(shù)等于0,則為正態(tài)分布;如果峰度系數(shù)小于0,則兩側(cè)極端數(shù)據(jù)較多,比正態(tài)分布更低更寬,呈平闊峰分布,如圖4-49所示。2.峰度4.3.2使用Excel的描述統(tǒng)計(jì)功能加載“數(shù)據(jù)分析”選項(xiàng)卡TOP1:Excel選項(xiàng)設(shè)置TOP2:管理Excel加載項(xiàng)4.3.2使用Excel的描述統(tǒng)計(jì)功能TOP3:加載分析工具庫(kù)TOP4:顯示數(shù)據(jù)分析工具4.3.2使用Excel的描述統(tǒng)計(jì)功能2.描述統(tǒng)計(jì)分析【實(shí)驗(yàn)室】分析農(nóng)產(chǎn)品銷售情況TOP1:選擇分析工具TOP2:設(shè)置描述統(tǒng)計(jì)參數(shù)4.3.2使用Excel的描述統(tǒng)計(jì)功能分析統(tǒng)計(jì)結(jié)果目錄/Contents4.14.24.34.4集中趨勢(shì)的統(tǒng)計(jì)分析離散程度的統(tǒng)計(jì)分析分布形態(tài)的統(tǒng)計(jì)分析課堂實(shí)訓(xùn)——生產(chǎn)資料市場(chǎng)價(jià)格分析4.4.1實(shí)訓(xùn)目標(biāo)及思路某企業(yè)專注于黑色金屬類生產(chǎn)資料的經(jīng)營(yíng)業(yè)務(wù),為了更好地調(diào)整經(jīng)營(yíng)策略,企業(yè)相關(guān)人員從國(guó)家統(tǒng)計(jì)局采集了相關(guān)黑色金屬類生產(chǎn)資料1月至5月的市場(chǎng)價(jià)格數(shù)據(jù)。下面需要通過描述性統(tǒng)計(jì)來分析這些生產(chǎn)資料的價(jià)格變動(dòng)情況,具體操作思路如圖4-58所示。4.4.2操作方法TOP1:設(shè)置描述統(tǒng)計(jì)參數(shù)TOP2:輸入文本4.4.2操作方法TOP3:計(jì)算極差TOP4:計(jì)算其他生產(chǎn)資料的極差4.4.2操作方法TOP5:繼續(xù)輸入文本TOP6:應(yīng)用QUARTILE.INC函數(shù)4.4.2操作方法TOP7:完善公式內(nèi)容TOP8:計(jì)算四分位差4.4.2操作方法TOP9:計(jì)算其他生產(chǎn)資料的四分位差TOP10:輸入文本和公式4.4.2操作方法TOP11:計(jì)算其他生產(chǎn)資料的平均差TOP12:繼續(xù)輸入文本和公式4.4.2操作方法TOP13:計(jì)算其他生產(chǎn)資料的變異系數(shù)TOP14:復(fù)制單元格格式4.4.2操作方法TOP15:設(shè)置數(shù)據(jù)類型TOP16:添加邊框4.4.2操作方法TOP17:合并單元格區(qū)域TOP18:合并加粗文本謝謝觀看《統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)》抽樣估計(jì)分析《統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)》05目錄/Contents5.15.25.3抽樣與抽樣估計(jì)概述參數(shù)估計(jì)與樣本量的確認(rèn)課堂實(shí)訓(xùn)——小區(qū)居民用電分析5.1.1抽樣的方法抽樣是指從需要分析的總體中抽取一部分作為樣本的行為,其目的是對(duì)樣本進(jìn)行分析、研究,通過抽樣估計(jì)來推斷總體的情況。抽樣的方法5.1.1抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣2.系統(tǒng)抽樣4.整群抽樣3.分層抽樣5.多階段抽樣(1)重復(fù)抽樣(2)不重復(fù)抽樣(1)等概率系統(tǒng)抽樣(2)不等概率系統(tǒng)抽樣(1)比例分層抽樣(2)加權(quán)比例抽樣整群抽樣是指將所有總體單位分割為若干群組,然后從中隨機(jī)抽取一部分群,對(duì)這些群中的所有單位進(jìn)行統(tǒng)計(jì)分析的方法。多階段抽樣又叫多級(jí)抽樣,是指在抽取樣本時(shí),分為兩個(gè)及兩個(gè)以上的階段從總體中抽取樣本的方法。5.1.2抽樣分布中涉及的基本概念1.樣本容量和樣本個(gè)數(shù)
5.1.2抽樣分布中涉及的基本概念總體參數(shù)主要用來描述總體的數(shù)量特征值,包括總體均值μ、總體比例π和總體標(biāo)準(zhǔn)差σ等,如圖5-2所示。2.總體參數(shù)與樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量主要用來描述樣本的數(shù)量特征值,包括樣本均值ˉx、樣本比例p和樣本標(biāo)準(zhǔn)差s等,如圖5-3所示。5.1.2抽樣分布中涉及的基本概念2.總體參數(shù)與樣本統(tǒng)計(jì)量參數(shù)總體樣本均值參數(shù)總體樣本均值的標(biāo)準(zhǔn)差比例比例的標(biāo)準(zhǔn)差5.1.3樣本統(tǒng)計(jì)量的抽樣分布1.樣本均值的抽樣分布將樣本平均數(shù)的全部可能取值與其出現(xiàn)的頻率依次排列,便形成樣本均值的抽樣分布。同樣假設(shè)總體包含5個(gè)單位,分別為1、2、3、4、5,如果采用重復(fù)抽樣的方法抽取容量為2的樣本,則采取重復(fù)抽樣和不重復(fù)抽樣的結(jié)果,如表5-4所示。項(xiàng)目重復(fù)抽樣不重復(fù)抽樣2510所有可能的樣本1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,51,22,33,44,51,32,43,50,01,42,50,00,01,50,00,00,01.01.52.02.53.01.52.02.53.03.52.02.53.03.54.02.53.03.54.04.53.03.54.04.55.01.52.53.54.52.03.04.00,02.53.50,00,03.00,00,00,05.1.3樣本統(tǒng)計(jì)量的抽樣分布對(duì)于樣本均值的抽樣分布而言,其特征主要取決于數(shù)學(xué)期望和方差這兩個(gè)變量。
5.1.3樣本統(tǒng)計(jì)量的抽樣分布2.樣本比例的抽樣分布【實(shí)驗(yàn)室】抽樣分析小區(qū)物業(yè)費(fèi)繳納情況某小區(qū)物業(yè)今年收到的物業(yè)費(fèi)繳納數(shù)量約占整個(gè)小區(qū)業(yè)主數(shù)量的70%,現(xiàn)從所有業(yè)務(wù)中隨機(jī)抽取100戶,試分析物業(yè)費(fèi)繳納的抽樣分布情況。首先分析樣本是否屬于大樣本。由于n=100,p=70%,所以n?p=100×0.7=70>5。同時(shí),n?(1-p)=100×(1-0.7)=30>5。所以可以認(rèn)為該樣本容量足夠大,屬于大樣本,從而其分布情況可以用正態(tài)分布來描述。此時(shí)可以分別計(jì)算出樣本比例的數(shù)學(xué)期望和抽樣方差。
因此可以說,該案例的樣本比例p服從均值為0.7、方差為0.0021的正態(tài)分布,記作p~N(0.7,0.0021)。目錄/Contents5.15.25.3抽樣與抽樣估計(jì)概述參數(shù)估計(jì)與樣本量的確認(rèn)課堂實(shí)訓(xùn)——小區(qū)居民用電分析5.2.1點(diǎn)估計(jì)點(diǎn)估計(jì)是用某一個(gè)樣本統(tǒng)計(jì)量的值作為總體參數(shù)的估計(jì)值。無偏性:無偏性是指用來估計(jì)總體參數(shù)的樣本統(tǒng)計(jì)量,其分布是以總體參數(shù)真值為中心的,在一次具體的抽樣估計(jì)中,估計(jì)值或大于或小于總體參數(shù),但在多次重復(fù)抽樣估計(jì)的過程中,所有估計(jì)值的平均數(shù)應(yīng)該等于待估計(jì)的總體參數(shù)。有效性:有效性是指在同一總體參數(shù)的兩個(gè)無偏估計(jì)量中,方差越小的估計(jì)量對(duì)總體參數(shù)的估計(jì)越準(zhǔn)確。一致性:一致性是指隨著樣本容量的增加,點(diǎn)估計(jì)值的值越來越接近總體參數(shù)的真值,即一個(gè)大樣本給出的估計(jì)量比一個(gè)小樣本給出的估計(jì)量更接近總體參數(shù)。5.2.2區(qū)間估計(jì)01OPTION02OPTION區(qū)間估計(jì)區(qū)間估計(jì)是指在給定置信水平(1-α)的條件下,以點(diǎn)估計(jì)值為中心構(gòu)建總體參數(shù)的一個(gè)估計(jì)區(qū)間(或置信區(qū)間)。它不同于點(diǎn)估計(jì),不能確定總體參數(shù)具體的值,但可以確定用多大概率(即置信水平)保證置信區(qū)間包含總體參數(shù)的問題。2.置信區(qū)間置信區(qū)間即在一定置信水平下總體參數(shù)的估計(jì)區(qū)間,區(qū)間中的最小值稱為置信下限,最大值稱為置信上限。置信區(qū)間可以表示為“點(diǎn)估計(jì)值±邊際誤差”,如圖5-5所示。5.2.2區(qū)間估計(jì)3.邊際誤差
(2)抽樣估計(jì)的置信水平(1-α)置信水平也叫置信系數(shù)、置信概率或置信度,是指在給定的置信區(qū)間包含未知總體參數(shù)的概率。其中,α是事先確定的一個(gè)風(fēng)險(xiǎn)值,即置信區(qū)間不包含總體真值的概率,(1-α)則是置信區(qū)間包含總體真值的概率。5.2.2區(qū)間估計(jì)4.臨界值與置信區(qū)間正態(tài)分布的臨界值為z_(α?2),在給定的置信水平下,z_(α?2)值可以通過查正態(tài)分布分位數(shù)表獲取(見本書附錄)。置信水平越高,臨界值越大;置信水平越低,臨界值越小??傮w均值的置信區(qū)間可表示為:
或表示為:
5.2.3總體均值的區(qū)間估計(jì)
90%0.11.64590%95%0.051.9695%99%0.012.5899%5.2.3總體均值的區(qū)間估計(jì)【實(shí)驗(yàn)室】估計(jì)學(xué)生方便面用量的置信區(qū)間某食品有限公司對(duì)當(dāng)?shù)卦谛4髮W(xué)生每月的方便面用量進(jìn)行了調(diào)查,100位學(xué)生的樣本調(diào)查結(jié)果為平均每位大學(xué)生的方便面用量為4.9包,標(biāo)準(zhǔn)差為3.5包,若置信水平為95%,估計(jì)當(dāng)?shù)卦谛4髮W(xué)生平均每月的方便面用量的置信區(qū)間。
5.2.4總體比例的區(qū)間估計(jì)
5.2.4總體比例的區(qū)間估計(jì)【實(shí)驗(yàn)室】估計(jì)愿意升級(jí)5G的用戶比例某通訊集團(tuán)對(duì)某市用戶進(jìn)行隨機(jī)調(diào)查,詢問是否有意愿將網(wǎng)絡(luò)升級(jí)為5G,隨機(jī)調(diào)查的50位用戶當(dāng)中,有30位用戶愿意對(duì)當(dāng)前網(wǎng)絡(luò)進(jìn)行升級(jí)。估計(jì)該市用戶中愿意升級(jí)為5G網(wǎng)絡(luò)的用戶占比,置信水平為95%。
5.2.5樣本量的確認(rèn)1.影響樣本量的主要因素總體變異程度概率保證程度抽樣方法允許誤差抽樣組織方式5.2.5樣本量的確認(rèn)2.均值估計(jì)時(shí)樣本量的確定AB
5.2.5樣本量的確認(rèn)【實(shí)驗(yàn)室】分析飛機(jī)延誤時(shí)間時(shí)需要抽樣的班次數(shù)量某航空公司想了解飛機(jī)延誤的時(shí)間,假設(shè)所有班次的飛機(jī)延誤時(shí)間的標(biāo)準(zhǔn)差為21分鐘,要求估計(jì)的誤差不超過5分鐘,置信水平為95%,試確定重復(fù)抽樣應(yīng)抽取的樣本量。若全年有4800次航班,在不重復(fù)抽樣的條件下,又應(yīng)該抽取多大的樣本量。
5.2.5樣本量的確認(rèn)3.比例估計(jì)時(shí)樣本量的確定AB
5.2.5樣本量的確認(rèn)【實(shí)驗(yàn)室】確定需要抽查的手機(jī)數(shù)量某品牌手機(jī)的合格率為92%,現(xiàn)需要對(duì)新進(jìn)的一批商品進(jìn)行檢查,若要求邊際誤差不超過5%,置信水平為99%,試確定重復(fù)抽樣應(yīng)該抽取的樣本量。若這批手機(jī)共有4000臺(tái),在不重復(fù)抽樣的條件下,又應(yīng)該抽取多大的樣本量。
目錄/Contents5.15.25.3抽樣與抽樣估計(jì)概述參數(shù)估計(jì)與樣本量的確認(rèn)課堂實(shí)訓(xùn)——小區(qū)居民用電分析5.3.1實(shí)訓(xùn)目標(biāo)及思路某市供電局對(duì)某小區(qū)居民每月用電量進(jìn)行抽樣估計(jì),隨機(jī)從該小區(qū)中抽取出100戶的每月電費(fèi)數(shù)據(jù),在置信水平為95%的條件下,希望估算出該小區(qū)所有居民每月的電費(fèi)支出情況以及電費(fèi)高于80元的居民比例。可見,本次實(shí)訓(xùn)屬于大樣本的抽樣估計(jì),可以認(rèn)為樣本服從正態(tài)分布,因此可以利用總體均值的區(qū)間估計(jì)和總體比例的區(qū)間估計(jì)方法進(jìn)行操作,具體操作思路如圖5-7所示。5.3.2操作方法TOP1:選擇分析工具TOP2:設(shè)置描述統(tǒng)計(jì)參數(shù)5.3.2操作方法TOP3:選擇函數(shù)TOP4:設(shè)置函數(shù)參數(shù)5.3.2操作方法TOP5:計(jì)算置信下限的值TOP6:計(jì)算置信上限的值5.3.2操作方法TOP7:選擇函數(shù)TOP8:設(shè)置函數(shù)參數(shù)
5.3.2操作方法TOP10:計(jì)算置信下限的值TOP11:計(jì)算置信上限的值謝謝觀看《統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)》統(tǒng)計(jì)指數(shù)分析《統(tǒng)計(jì)與數(shù)據(jù)分析基礎(chǔ)》06目錄/Contents6.16.26.3統(tǒng)計(jì)指數(shù)概述綜合指數(shù)平均指數(shù)6.4指數(shù)體系與因素分析6.5課堂實(shí)訓(xùn)——產(chǎn)品總成本變動(dòng)分析6.1.1統(tǒng)計(jì)指數(shù)的概念和作用1.統(tǒng)計(jì)指數(shù)的概念廣義上來看,凡是反映同類現(xiàn)象數(shù)量或質(zhì)量變動(dòng)的相對(duì)數(shù)都可以稱為統(tǒng)計(jì)指數(shù),其中包括單一現(xiàn)象或多種現(xiàn)象的變動(dòng)。狹義上來看,統(tǒng)計(jì)指數(shù)反映的只是不能直接加總的復(fù)雜現(xiàn)象綜合數(shù)量或質(zhì)量變動(dòng)的相對(duì)數(shù)。6.1.1統(tǒng)計(jì)指數(shù)的概念和作用2.統(tǒng)計(jì)指數(shù)的作用(1)綜合反映現(xiàn)象總體的變動(dòng)方向和變動(dòng)程度。(3)通過編制統(tǒng)計(jì)指數(shù)數(shù)列來反映現(xiàn)象總體的長(zhǎng)期趨勢(shì)。(2)結(jié)合建立的指數(shù)體系來分析現(xiàn)象總體中各種因素的影響方向和影響程度。6.1.2統(tǒng)計(jì)指數(shù)的種類統(tǒng)計(jì)指數(shù)的種類可以從現(xiàn)象范圍、指標(biāo)性質(zhì)、編制方法、對(duì)比性質(zhì)等多種不同的角度進(jìn)行劃分,如圖6-2所示。6.1.2統(tǒng)計(jì)指數(shù)的種類1.現(xiàn)象范圍2.指標(biāo)性質(zhì)3.對(duì)比性質(zhì)4.編制方法個(gè)體指數(shù):指反映單一現(xiàn)象變動(dòng)的相對(duì)數(shù)。總指數(shù):指反映兩種及兩種以上復(fù)雜現(xiàn)象總體綜合變動(dòng)的相對(duì)數(shù)。數(shù)量指數(shù):指反映數(shù)量指標(biāo)變動(dòng)的指數(shù)。質(zhì)量指數(shù):指反映質(zhì)量指標(biāo)變動(dòng)的指數(shù)。動(dòng)態(tài)指數(shù):指反映現(xiàn)象總體時(shí)間變動(dòng)的指數(shù),也稱時(shí)間性指數(shù),一般有定基指數(shù)和環(huán)比指數(shù)之分。靜態(tài)指數(shù):指反映現(xiàn)象總體相同時(shí)間內(nèi)不同空間變動(dòng)的指數(shù),也稱區(qū)域性指數(shù),一般有空間指數(shù)和計(jì)劃完成情況指數(shù)兩種。針對(duì)總指數(shù)的編制方法或表現(xiàn)形式的不同,可將總指數(shù)分為綜合指數(shù)和平均指數(shù)。目錄/Contents6.16.26.3統(tǒng)計(jì)指數(shù)概述綜合指數(shù)平均指數(shù)6.4指數(shù)體系與因素分析6.5課堂實(shí)訓(xùn)——產(chǎn)品總成本變動(dòng)分析6.2.1綜合指數(shù)的編制原理合指數(shù)的編制離不開同度量因素,原因在于,綜合指數(shù)針對(duì)的是復(fù)雜現(xiàn)象總體,這些總體的指數(shù)化指標(biāo)數(shù)值不能直接相加,因此必須尋找適當(dāng)?shù)拿浇?,將其轉(zhuǎn)化為可以直接相加的數(shù)值才能進(jìn)行對(duì)比,這個(gè)媒介就是同度量因素。商品計(jì)量單位銷售量?jī)r(jià)格(元)A商品件1201002025B商品支100090045C商品臺(tái)6050290300注意:在確定了同度量因素后,還必須將同度量因素所屬的時(shí)期固定,這樣計(jì)算出的指數(shù)反映的變動(dòng)情況才具有代表性。6.2.1綜合指數(shù)的編制原理總體來看,綜合指數(shù)的編制原理涉及3個(gè)重要環(huán)節(jié),即引入同度量因素、固定同度量因素、對(duì)比變動(dòng)指標(biāo),具體編制過程如圖6-3所示。6.2.2綜合指數(shù)的編制方法1.拉氏指數(shù)2.帕氏指數(shù)
6.2.2綜合指數(shù)的編制方法【實(shí)驗(yàn)室】分析多種商品的銷售量和價(jià)格變動(dòng)商品計(jì)量單位銷售量?jī)r(jià)格(元)銷售額(元)A商品件12010020252400300020002500B商品支1000900454000500036004500C商品臺(tái)605029030017400180001450015000合計(jì)—————238002600020100220006.2.2綜合指數(shù)的編制方法(1)銷售量指數(shù)
(2)價(jià)格指數(shù)
目錄/Contents6.16.26.3統(tǒng)計(jì)指數(shù)概述綜合指數(shù)平均指數(shù)6.4指數(shù)體系與因素分析6.5課堂實(shí)訓(xùn)——產(chǎn)品總成本變動(dòng)分析6.3.1綜合指數(shù)與平均指數(shù)的區(qū)別1.計(jì)算思想不同3.結(jié)果體現(xiàn)不同2.使用資料不同綜合指數(shù)的計(jì)算思想是“先綜合,后對(duì)比”,即先借助同度量因素對(duì)基期與報(bào)告期的數(shù)據(jù)進(jìn)行綜合,再用報(bào)告期的綜合量除以基期的綜合量得到指數(shù)結(jié)果;平均指數(shù)的計(jì)算思想則是“先對(duì)比,后平均”,即先計(jì)算個(gè)體指數(shù),然后以個(gè)體指數(shù)所對(duì)應(yīng)的權(quán)數(shù)進(jìn)行加權(quán)平均。綜合指數(shù)的計(jì)算結(jié)果可以體現(xiàn)為相對(duì)值,也可以體現(xiàn)為絕對(duì)值。比如,前面案例中使用拉式銷售量綜合指數(shù)計(jì)算出在維持基期價(jià)格水平不變的前提下,報(bào)告期3種商品的銷售量總體大約降低了15.55%,這就是相對(duì)值。綜合指數(shù)需要掌握計(jì)算總體的全面資料,包括總體中每一個(gè)個(gè)體在基期和報(bào)告期的各種數(shù)據(jù),當(dāng)需要計(jì)算的總體中包含的個(gè)體較多時(shí),收集數(shù)據(jù)和數(shù)據(jù)計(jì)算的工作量就變得很大;平均指數(shù)既可以根據(jù)全面的資料計(jì)算,也可以根據(jù)局部的資料計(jì)算,當(dāng)無法獲得全面的資料時(shí),平均指數(shù)就體現(xiàn)了它的優(yōu)越性。6.3.2平均指數(shù)的編制原理
6.3.3平均指數(shù)的編制方法1.加權(quán)算術(shù)平均指數(shù)
加權(quán)算術(shù)平均指數(shù)是以算術(shù)平均數(shù)的形式計(jì)算的總指數(shù),通常用基期總值數(shù)據(jù)作為權(quán)數(shù),其計(jì)算公式如下。
6.3.3平均指數(shù)的編制方法
【實(shí)驗(yàn)室】分析多種商品銷售量變動(dòng)的平均指數(shù)商品計(jì)量單位銷售量?jī)r(jià)格(元)銷售量個(gè)體指數(shù)(%)基期銷售額(元)A商品件1201002083.3324002000B商品支1000900490.0040003600C商品臺(tái)605029083.331740014500合計(jì)—————23800201006.3.3平均指數(shù)的編制方法2.加權(quán)調(diào)和平均指數(shù)
加權(quán)調(diào)和平均指數(shù)是以調(diào)和平均數(shù)的形式計(jì)算的總指數(shù),通常用報(bào)告期總值數(shù)據(jù)作為權(quán)數(shù),其計(jì)算公式如下。
6.3.3平均指數(shù)的編制方法
【實(shí)驗(yàn)室】分析多種商品價(jià)格變動(dòng)的平均指數(shù)商品計(jì)量單位價(jià)格(元)銷售量?jī)r(jià)格個(gè)體指數(shù)(%)報(bào)告期銷售額(元)A商品件2025100125.0025002000B商品支45900125.0045003600C商品臺(tái)29030050103.451500014500合計(jì)—————22000201006.3.3平均指數(shù)的編制方法3.固定權(quán)數(shù)的平均指數(shù)
固定權(quán)數(shù)的平均指數(shù)實(shí)際上指的是加權(quán)算術(shù)平均指數(shù)這種形式。當(dāng)權(quán)數(shù)不是基期總值數(shù)據(jù),而是固定權(quán)數(shù)(w)時(shí),計(jì)算的加權(quán)算術(shù)平均指數(shù)就是固定權(quán)數(shù)的加權(quán)算術(shù)平均指數(shù)。其計(jì)算公式如下。6.3.3平均指數(shù)的編制方法
【實(shí)驗(yàn)室】分析居民消費(fèi)價(jià)格指數(shù)的變動(dòng)情況項(xiàng)目食品煙酒類97.632.5衣著類100.211.3居住類99.89.6生活用品及服務(wù)類100.06.8交通和通信類99.816.2教育文化和娛樂類100.011.3醫(yī)療保健類100.08.9其他用品和服務(wù)類100.53.4目錄/Contents6.16.26.3統(tǒng)計(jì)指數(shù)概述綜合指數(shù)平均指數(shù)6.4指數(shù)體系與因素分析6.5課堂實(shí)訓(xùn)——產(chǎn)品總成本變動(dòng)分析6.4.1指數(shù)體系廣義上講,指數(shù)體系泛指由若干個(gè)經(jīng)濟(jì)上具有一定聯(lián)系的指數(shù)所構(gòu)成的整體,所構(gòu)成指數(shù)體系的指數(shù)數(shù)量可多可少,各指數(shù)之間相互聯(lián)系的形式具有多樣性表現(xiàn)。狹義上講,指數(shù)體系則是指若干個(gè)具有內(nèi)在經(jīng)濟(jì)聯(lián)系、存在數(shù)量對(duì)等關(guān)系的指數(shù)構(gòu)成的整體。例如,銷售額=銷售量×銷售價(jià)格、總成本=產(chǎn)量×單位成本、總產(chǎn)值=產(chǎn)量×產(chǎn)品價(jià)格等,將等式兩邊的變量分別進(jìn)行指數(shù)計(jì)算后,則這些指數(shù)之間也存在對(duì)等關(guān)系,即銷售額指數(shù)=銷售量指數(shù)×銷售價(jià)格指數(shù)、總成本指數(shù)=產(chǎn)量指數(shù)×單位成本指數(shù)、總產(chǎn)值指數(shù)=產(chǎn)量指數(shù)×產(chǎn)品價(jià)格指數(shù)等,此時(shí)便稱等式的左邊的指數(shù)為總變動(dòng)指數(shù),或總動(dòng)態(tài)指數(shù),等式右邊的指數(shù)則稱為因素指數(shù)。各種社會(huì)經(jīng)濟(jì)現(xiàn)象之間是相互聯(lián)系的,指數(shù)體系則直接反映了經(jīng)濟(jì)現(xiàn)象之間的這種動(dòng)態(tài)聯(lián)系。6.4.2因素分析的要點(diǎn)與種類1.因素分析的要點(diǎn)2.因素分析的類型01OPTION02OPTION03OPTION(1)分析任意一個(gè)因素時(shí),需假定指數(shù)體系中的其他因素不變。(2)因素分析中各因素指數(shù)的計(jì)算需使用綜合指數(shù)計(jì)算形式。(3)分析因素對(duì)現(xiàn)象變動(dòng)的影響時(shí),可以從相對(duì)量和絕對(duì)量?jī)蓚€(gè)方面著手。6.4.3總量指標(biāo)變動(dòng)的因素分析1.個(gè)體現(xiàn)象的兩因素分析商品計(jì)量單位銷售量?jī)r(jià)格(元)銷售額(元)A商品件12010020252400300020002500
6.4.3總量指標(biāo)變動(dòng)的因素分析【實(shí)驗(yàn)室】分析單一商品銷售量與價(jià)格對(duì)銷售額的影響(1)相對(duì)量變動(dòng)(2)絕對(duì)量變動(dòng)A商品銷售額指數(shù)=(q_1p_1)/(q_0p_0)=(100×25)/(120×20)
=(2500)/(2400)≈1.0417=104.17%A商品銷售量指數(shù)=q_1/q_0=100/120≈0.8333=83.33%A商品價(jià)格指數(shù)=p_1/p_0=25/20=1.25=125%相對(duì)量上:104.17%=83.33%×125%
6.4.3總量指標(biāo)變動(dòng)的因素分析2.復(fù)雜總體的兩因素分析
商品計(jì)量單位銷售量?jī)r(jià)格(元)銷售額(元)A商品件12010020252400300020002500B商品支1000900454000500036004500C商品臺(tái)605029030017400180001450015000合計(jì)—————238002600020100220006.4.3總量指標(biāo)變動(dòng)的因素分析【實(shí)驗(yàn)室】分析多個(gè)商品的銷售量與價(jià)格對(duì)銷售總額的影響(1)相對(duì)量變動(dòng)(2)絕對(duì)量變動(dòng)
6.4.3總量指標(biāo)變動(dòng)的因素分析3.總量指標(biāo)的多因素分析如果總量指受到的影響因素不止兩個(gè),同樣可以利用指數(shù)體系對(duì)該總量指標(biāo)進(jìn)行多因素影響分析。利潤(rùn)總額=銷售量×價(jià)格×利潤(rùn)率總量指標(biāo)的多因素分析方法與兩因素分析方法基本相同,需要注意的是,在多因素分析中,需要考慮各因素的排列順序,不僅要考慮任何相鄰因素的乘積都存在實(shí)際經(jīng)濟(jì)意義,還應(yīng)當(dāng)遵循數(shù)量指標(biāo)在前、質(zhì)量指標(biāo)在后的一般規(guī)律。6.4.3總量指標(biāo)變動(dòng)的因素分析【實(shí)驗(yàn)室】分析多個(gè)因素對(duì)商品利潤(rùn)總額造成的影響商品計(jì)量單位銷售量?jī)r(jià)格(萬元)利潤(rùn)率(%)A商品輛1501603.53.21116B商品臺(tái)2502501.81.763035C商品件500055000.0310.029876.4.3總量指標(biāo)變動(dòng)的因素分析(1)利潤(rùn)總額的變動(dòng)(2)利潤(rùn)總額受銷售量變動(dòng)的影響
(3)利潤(rùn)總額受價(jià)格變動(dòng)的影響
(4)利潤(rùn)總額受利潤(rùn)率變動(dòng)的影響
6.4.4平均指標(biāo)變動(dòng)的因素分析
6.4.4平均指標(biāo)變動(dòng)的因素分析【實(shí)驗(yàn)室】分析商場(chǎng)職工平均工資的變動(dòng)情況商品平均工資(元)職工人數(shù)(人)工資總額(萬元)A商場(chǎng)3100350015018046.56355.8B商場(chǎng)4400480012015052.87266C商場(chǎng)470053002001809495.484.6合計(jì)4066.674533.33470510193.3230.4206.4
6.4.4平均指標(biāo)變動(dòng)的因素分析
目錄/Contents6.16.26.3統(tǒng)計(jì)指數(shù)概述綜合指數(shù)平均指數(shù)6.4指數(shù)體系與因素分析6.5課堂實(shí)訓(xùn)——產(chǎn)品總成本變動(dòng)分析6.5.1實(shí)訓(xùn)目標(biāo)及思路某企業(yè)生產(chǎn)了3種產(chǎn)品,各產(chǎn)品的產(chǎn)量與單位成本在基期和報(bào)告期均發(fā)生了不同的變化,需要利用這些數(shù)據(jù)在Excel中進(jìn)行綜合指數(shù)與平均指數(shù)的計(jì)算與分析。其中,綜合指數(shù)需要完成拉氏指數(shù)與帕氏指數(shù)的計(jì)算、平均指數(shù)需要完成加權(quán)平均指數(shù)與調(diào)和平均指數(shù)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高考物理總復(fù)習(xí)專題三牛頓運(yùn)動(dòng)定律第1講牛頓第一定律、牛頓第三定律練習(xí)含答案
- 美容美發(fā)工具采購(gòu)協(xié)議
- 《大數(shù)據(jù)分析》課件
- 江西省萬載縣高中地理 第三章 生產(chǎn)活動(dòng)與地域聯(lián)系 3.1 農(nóng)業(yè)區(qū)位因素教案 中圖版必修2
- 2024-2025學(xué)年新教材高中地理 第2單元 不同類型區(qū)域的發(fā)展 單元活動(dòng) 開展小區(qū)域調(diào)查教案 魯教版選擇性必修2
- 2024秋四年級(jí)英語(yǔ)上冊(cè) Unit 6 Meet my family第3課時(shí)(Let's spell Lets sing)教案 人教PEP
- 2024-2025學(xué)年高中物理 第十二章 機(jī)械波 1 波的形成和傳播教案3 新人教版選修3-4
- 高考地理一輪復(fù)習(xí)第四章地球上的水及其運(yùn)動(dòng)第二節(jié)海水的性質(zhì)課件
- 包豪斯設(shè)計(jì)課件
- 租賃備案代辦委托合同
- 時(shí)代樂章-第2課 科技之光(課件)2024-2025學(xué)年人教版(2024)初中美術(shù)七年級(jí)上冊(cè) -
- 《8 課余生活真豐富》教學(xué)設(shè)計(jì)-2024-2025學(xué)年道德與法治一年級(jí)上冊(cè)統(tǒng)編版
- 2024年網(wǎng)絡(luò)安全知識(shí)競(jìng)賽考試題庫(kù)500題(含答案)
- 2024住房公積金借款合同范本
- 15八角樓上第一課時(shí)公開課一等獎(jiǎng)創(chuàng)新教學(xué)設(shè)計(jì)
- 小學(xué)數(shù)學(xué)教學(xué)中數(shù)學(xué)模型的構(gòu)建與應(yīng)用
- 經(jīng)導(dǎo)管主動(dòng)脈瓣置換術(shù)(TAVR)患者的麻醉管理
- 運(yùn)籌學(xué)智慧樹知到答案2024年哈爾濱工程大學(xué)
- 行政執(zhí)法證專業(yè)法律知識(shí)考試題庫(kù)含答案(公路路政)
- 《人行自動(dòng)門安全要求》標(biāo)準(zhǔn)
- 廣鐵集團(tuán)校園招聘機(jī)考題庫(kù)
評(píng)論
0/150
提交評(píng)論