手把手教你Tableau高級數(shù)據(jù)分析功能(附數(shù)據(jù)集)_第1頁
手把手教你Tableau高級數(shù)據(jù)分析功能(附數(shù)據(jù)集)_第2頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

PAGE5/NUMPAGES5手把手教你Tableau高級數(shù)據(jù)分析功能(附數(shù)據(jù)集)手把手教你Tableau高級數(shù)據(jù)分析功能(附數(shù)據(jù)集)

原文標題:AStep-by-StepGuidetolearnAdvancedTableau–forDataScienceandBusinessIntelligenceProfessionals:PavleenKaur翻譯:清揚校對:盧苗苗本文共4000字,建議閱讀8分鐘。

本文借助高級圖表創(chuàng)建計算深入研究數(shù)據(jù)以提取對數(shù)據(jù)的

分析,并了解R如何與Tableau相互集成和使用。

簡介

“查看數(shù)據(jù)。顯示圖表。講故事。吸引觀眾?!盩ableau是當今數(shù)據(jù)科學和商業(yè)智能專業(yè)人員使用的最流行的數(shù)據(jù)可視化工具之一。它使您能夠以交互和多彩的方式創(chuàng)建具有洞察力和影響力的可視化效果圖。它的用途不僅僅是創(chuàng)建傳統(tǒng)的圖表和圖表。您可以使用它來挖掘可操作的數(shù)據(jù)解析,這要歸功于它提供的大量功能和自定義。以其易用性和簡單的功能而聞名,制作如下所示的富有洞察力的儀表盤只需點擊幾下鼠標:在本文中,我們將看到一些超越拖放功能的高級圖表。我們將創(chuàng)建計算以深入研究數(shù)據(jù)以提取對數(shù)據(jù)的分析。我們還將看看R如何與Tableau相互集成和使用。本文假定您掌握豐富的使用Tableau的知識,例如基本圖表形成,計算,參數(shù)等。如果您不這樣做,我會建議先參考以下文章,然后再返回此處:

TableauforBeginners-簡化數(shù)據(jù)可視化

https://.analyticsvidhya./blog/2017/07/data-visualisation-made-easy/中級Tableau指南-適用于數(shù)據(jù)科學和商業(yè)智能專業(yè)人員

https://.analyticsvidhya./blog/2018/01/tableau-for-intermediate-data-science/目錄1.高級圖形-可視化超越“顯示我”運動圖凹凸圖甜甜圈圖表瀑布圖帕累托圖2.在Tableau中引入R編程1.高級圖形-可視化超越'ShowMe'幾乎所有的Tableau用戶都知道各種基本圖形,例如介紹儀表板中顯示的那些圖形。這些圖表可以使用Tableau的“ShowMe”功能輕松完成。但由于這是一篇面向高級用戶的文章,因此我們將超越“ShowMe”并探索需要額外計算的圖表。首先,讓我們快速瀏覽一下我們將在接下來的幾節(jié)中做什么。以下是我們超市的銷售額和利潤的一些基本分析。簡單的圖表可以達到與主板中的相同的目的,但我認為您會對這些圖表的宏偉感到興奮和激動。

(https://github./pavleenkaur/TableauTutorial-On-AnalyticsVidhya/blob/master/Sample-Superstore.xls/)1.1動態(tài)圖表在開始之前,先看看HansRosling的世界經(jīng)濟圖表展示

(https://http://./doc/94418494a7e9856a561252d380eb6294dc882263.html/tools/#_chart-type=bubbles)。點擊播放鍵,看到魔法在你面前展開。有興趣自己做一個類似的圖表展示嗎?不要擔心如何做這些動畫!你所看到的被稱為

動態(tài)圖表。使用此功能,您可以實時查看數(shù)據(jù)中的變化。因此,我們首先下載可在此處找到的Superstore數(shù)據(jù)集(https://github./pavleenkaur/TableauTutorial-On-AnalyticsVidhya/blob/master/Sample-Superstore.xls)。現(xiàn)在讓趨勢線如下圖所示對你來說應(yīng)該很容易:但是本節(jié)我們首先要學習的是如何使下面的趨勢線運動(gif動圖):

https://s3-ap-south-1.amazonaws./av-blog-media/wp-content/uploads/2017/08/23131759/2.gif

所以讓我們開始吧!

導(dǎo)入您的數(shù)據(jù)集,并創(chuàng)建上述趨勢圖。我們的X軸是訂單日期(月份格式),銷售額和利潤是度量值。您只需將“訂單日期”拖到“頁面”功能區(qū),然后再次更改格式以與X軸匹配。將標記類型從自動更改變更為圓形。轉(zhuǎn)到“顯示歷史記錄”,然后選擇“追蹤”以查看趨勢變化。瞧!您的動態(tài)圖表已準備好啟動。按箭頭按鈕查看動作,更改“顯示歷史”定制項,速度項等:

1.2凹凸圖假設(shè)你想探索Superstore各個部門的銷售額(整整一年)。其中一種方法是:然而備選方案如下:

雖然折線圖能夠顯示每個細分部門之間的銷售差異,但凹凸圖(上圖)給出了更清晰和簡明的相同結(jié)果圖。這些圖表通常用于了解多年來特定產(chǎn)品的受歡迎程度如何變化。

現(xiàn)在讓我們嘗試自己創(chuàng)建一個:

1)首先,我們需要考慮度量單位,根據(jù)這些度量單位我們對我們的測量維度進行排名。這里我們采取的度量單位是銷售量,測量維度是部門。

2)您需要計算模塊的幫助才能制作凹凸圖表。所以快速創(chuàng)建一個如下所示的計算。我們將對每個細分部門的銷售總額進行排名:3)現(xiàn)在將“訂單日期”拖到列中并將格式更改為月。在標記窗格中將“Segment”拖動到MarksPane里的顏色。最后將“Rank”拖到行。

4)在你現(xiàn)在可以看到的圖表中,排名是根據(jù)月份數(shù)量分配的。但是,我們需要他們在細分部門的基礎(chǔ)上。因此,右鍵單擊行中的排名,然后轉(zhuǎn)到編輯表格計算。

5)由于我們希望使用細分部門計算,請將配置更改為:

您將獲得的圖表看起來不像儀表板中的圖表,因為它缺少標簽。讓我們在雙軸(DualAxis)的幫助下快速修復(fù):6)再次將排名拖到行上并重復(fù)步驟4)和5)以得到:

您在MarksPane中看到了Rank和Rank(2)嗎?我們將使用這些來創(chuàng)建帶圓圈的標簽。

7)要將上述容轉(zhuǎn)換為雙軸圖表,請右鍵單擊第二個圖表的Rank軸并選擇雙軸。

8)在MarksPane中,Rank或Rank(2),然后將標記類型更改

為圓形而不是自動。

9)這里的排名按降序排列。要將其更改為升序,請右鍵單擊左側(cè)的Rank軸->編輯軸->反向比例。對右邊的Rank軸重復(fù)同樣的操作。

10)最后,將“銷售額”拖放到標簽->快速表計算->總計百分比上,以獲得我們期望的凹凸圖。1.3甜甜圈圖圓環(huán)圖是初級圖的另一種表現(xiàn)形式。坦率地說,它是一個中間有一個洞的餅圖,但它有助于更加強調(diào)各個細分市場,如下所示:讓我們了解這個區(qū)別的不同之處。

1)我們將從一個簡單的餅圖開始描繪每個細分部門的利潤:

2)要創(chuàng)建餅圖的雙軸,將measure的numberofrecords拖動到rows兩次。通過右鍵點擊它們并選擇最小值代替默認總和來更改每個綠色藥丸的度量:

3)選擇MarksPane中的第二個餅圖,并將其中的每個度量/維度拖出。減小圖表的大小,并將顏色更改為白色(盡管此處未顯示):

4)要創(chuàng)建雙軸,右鍵單擊第二個餅圖的Y軸,然后選擇雙軸,以獲得圖表。

現(xiàn)在你必須明白,以上所有圖表雖然在最終外觀上都不相

同,但都是從“顯示我”功能的核心圖表中獲得的。但是等一下,它還沒有結(jié)束。我有更多要展示給你。

1.4瀑布圖瀑布圖的名稱來自于其類似的方向和流動。在這里,我們繪制了Superstore多年來的運行銷售情況,您可以在2013年中和2014年初看到兩個小紅色區(qū)域,表明銷售額實際下降了,并且還有多少。

這意味著這些圖表被用來分析一個度量的累積效應(yīng),并且看它是如何作為一個整體增加和減少的。為了更好地理解這一點,讓我們想象它。

瀑布圖是折線圖的衍生物,因此我們將從該圖開始:

注意:這里的X軸是訂單日期(以月-年格式并轉(zhuǎn)換為離散型),Y軸是利潤

1)右鍵單擊綠色的ProfitPill,然后選擇QuickTableCalculation->RunningTotal。

2)將標記類型從自動更改為甘特條:

3)創(chuàng)建一個名為'NegProfit'的計算字段:

4)將這個NegProfit拖到Marks框架中的Size上,得到:

計算的字段用于填寫甘特圖中的空間。利潤中的負值將向下延伸,而正值則會向上延伸。

圖表中每個小條的長度表示利潤從一個月到下一個月的變化量。

5)最后,將利潤拖到顏色:

6)您可以繼續(xù)前進,將顏色更改為兩步變化,并清楚地查看上升和下降:您將獲得的圖表也可以非常容易地以條形圖的形式表示。請注意,我在這里將顏色分置,以使其凸顯出來:

但我相信你會同意使用瀑布圖是一種更直觀的表示數(shù)據(jù)的方式,特別是看看多年來度量的變化,例如銷售和利潤。1.5帕累托圖

下面我已經(jīng)將一個流行的80-20數(shù)據(jù)分析原理可視化出來。如果你還沒有聽說過它,讓我試著用例子來解釋它。我們會經(jīng)常觀察到超市的大部分銷售來自少數(shù)幾種產(chǎn)品。

人們不能指望面包和雞蛋與蛋糕有相同的銷售數(shù)字,對吧?這正式被稱為80-20原則,這意味著80%的銷售額來自20%的產(chǎn)品。在我們的超市里,這個原則可以在下面的圖表中看到,其部分銷售是由和椅子生成的:

這是一種相當流行的可視化,帕累托圖通常用于風險管理,以確定對項目造成最大負面影響的最常見問題;但正如我們將看到的,它也可以有其他應(yīng)用程序。

讓我們看看它是如何完成的:

1)我們將從下面的圖表開始。這具有作為X軸的子類別和作為Y軸的銷售。圖表按降序排列:

2)接下來,將銷售額拖放到圖表上,直到您看到綠色突出顯示的條形和最右邊的虛線軸:

3)在此處下降銷售以創(chuàng)建雙軸。將第一個圖表的標記類型更改為條形圖,將第二個圖表更改為直線,最終得到:

4)右鍵單擊第二個綠色銷售藥丸,并為其添加運行總計算:

5)剩下的只是改變配色方案,并且您的帕累托圖表已準備就緒!

2.在Tableau中引入R編程

我喜歡Tableau的一個原因是,它不僅僅是一個工具,而且意味著只需拖放操作即可創(chuàng)建漂亮的圖形。隨著2013年Tableau8.1的發(fā)布,出現(xiàn)了許多新的功能。

R編程的引入使得更豐富和動態(tài)的可視化得以實現(xiàn),這是主要特征之一。R編程可與Tableau一起用于聚類、預(yù)測等技術(shù)。

我想通過Clustering開始對R和Tableau的探索,所以我使用了超流行的IrisDataset

(https://github./pavleenkaur/TableauTutorial-On-AnalyticsVidhya/blob/master/iris.csv)。它包含不同的功能來區(qū)分3種類型的flowers,即Virginica,Setosa和Versicolor。正如你在下面的圖片中看到的那樣,R編程整合很容易創(chuàng)建這三種物種的集群:

如果你有興趣,可進行一下操作。首先,深入了解基礎(chǔ)知識和安裝過程,然后深入研究可視化問題!

以下描述了Tableau和R之間的控制流程,以實現(xiàn)此集成:

R腳本作為表計算寫入Tableau,并發(fā)送到R的R服務(wù)包。在此模塊執(zhí)行必要的計算并將結(jié)果返回給Tableau。

注意:為了正確理解并使用此功能,您必須具備R及其各種語法的一些知識。對于相同的你可以參考以下教程:LearnDataScienceinRfrom

scratch:https://.analyticsvidhya./blog/2016/02/complete-tutorial-learn-data-science-scratch/

現(xiàn)在讓我們看看這個集成的步驟:

1)安裝R(https://http://./doc/94418494a7e9856a561252d380eb6294dc882263.html)

2)安裝Rserve軟件包

在R命令行中運行以下命令:

3)配置Tableau以在R中運行

打開Tableau->幫助->設(shè)置和性能->管理R/外部連接。使用以下默認信息填寫字段并選擇測試連接:

所以,現(xiàn)在你已經(jīng)準備好了適當?shù)呐淞?,讓我們開始吧!如上圖所示,您可以使用Tableau的表計算與R進行通信:如果您向下滾動功能列表,您將遇到以下四種情況:

當計算區(qū)域中包含這些函數(shù)時,Tableau會自動理解該腳本適用于R.

我希望你最初興奮的制作集群仍然存在!我們繼續(xù)。

1)從這里下載Iris數(shù)據(jù)集。

https://github./pavleenkaur/TableauTutorial-On-AnalyticsVidhy

a/blob/master/iris.csv

2)在Tableau中導(dǎo)入數(shù)據(jù)集,并制作下圖:

3)在這里,您可以通過不同的度量獲得總和。要獲得離散值,請轉(zhuǎn)至分析,并取消選中聚合度量,以獲?。?/p>

4)最后,要形成群集,請在標記窗格中將類維度拖到顏色上:我們上面有一個散點圖,它顯示了分為3個不同群集的數(shù)據(jù)點群集。

現(xiàn)在讓我們嘗試與R一樣,并比較我們將得到的兩個可視化。我們將使用最常見的聚類算法K-Means:

1)從與上面第2點相同的散點圖開始。

2)創(chuàng)建一個新的計算字段并填寫以下容:

為了清楚起見,上述計算是:

3)最后,將新形成的FieldCluster拖放到MarksPane中的Color,以使您的集群準備就緒!

雖然有一些重疊,但這兩個可視化確實看起來相當準確。

這是將R與Tableau集成的潛力的一個小要點。它的應(yīng)用程序是無限的,我相信你一定已經(jīng)開始考慮可以與之交互的不同方式。

結(jié)束筆記

如果我說這就是Tableau的全部,這可能稍顯幼稚。隨著新版本的推出,新功能也將隨之推出。

/r/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論