版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
用戶研究干貨!量化用戶研究什么是用戶研究?本書關注的是前者的廣告主。這里的用戶可以是一個付費顧客、內(nèi)部員工、物理學家、呼叫中心處理員、汽車司機、手機擁有者或是任何試圖去完成某個目標的人一一一方面是那些涉及到軟件、網(wǎng)站以及機器設備的目標。這里的“研究”寬泛而又模糊一一它是以其為核心的方法和專業(yè)人員的結(jié)果。Schumacher(2021,p.6)草擬了以下的定義:用戶研究是對于用戶既定目標、需求和能力的系統(tǒng)內(nèi)研究,它的終極目標是為了給設計、手機用戶架構(gòu)或改進工具來幫助用戶更好的黨務工作和生活。相比起這個詞語的定義以及它的內(nèi)容,我們愈關心如何關心量化用戶的行為,因為這包含到可用性相關專業(yè)人士、設計師、產(chǎn)品經(jīng)理、營銷人員以及開發(fā)者。用戶研究中的數(shù)據(jù)n盡管“用戶研究”這個說法最終可能會失寵,但是它其中統(tǒng)計數(shù)據(jù)勞動生產(chǎn)率的數(shù)據(jù)卻不會。貫穿本書,我們將把重點放在可用性測試,使用一些來自精確性測試、用戶調(diào)查、A/B測試以及沙盤調(diào)研的案例。之所以把重點放在可用性測試上,是有以下兩點原因:可用性測試依然是判別用戶是否在完成任務的核心方法。我均執(zhí)行過的可用性測試并對其有著很多論述??捎眯詼y試用到了許多其他用研方法所涉及到基準的指標。(比如到處都能看到的“完成率”)??捎眯詼y試大多數(shù)的可用性測試屬于總結(jié)性的。它們通常是一個小樣本量的定性活動,在其中問題描述以及設計建議是以數(shù)據(jù)的形式輸出的。你的目標是找到發(fā)現(xiàn)盡可能多的問題并找到軟件平臺,但是這并不意味著沒有固相什么事。你可以從頻率、程度的角度量化問題,追蹤哪些用戶碰到了哪些問題,衡量一下他們量度圓滿完成任務花費的時間,判斷一下他們是否成功的敲定了任務。通常來講有兩種典型的總結(jié)性測試:基準測試以及比較實驗?;鶞士蓴U展性測試的目標是描述一個應用相對于一系列基準來說的可用程度。在基準測試里你可以提出一個界面中需要修復的問題并且它也提供了用于比較設計后改變的一條基線。比較可用性測試,就像他的名字一樣,某個這可以是較為同一個產(chǎn)品的不同版本,也可以是比較幾個競品。在比較測試中,同一個用戶可以在所有的產(chǎn)品上任務嘗試完成任務(主題下的設計),或者不同組的用戶可以試驗各個產(chǎn)品(主題間的設計)。樣本量n對于樣本量有一種錯誤的觀點認為必須越大越好,這樣才可以讓數(shù)據(jù)精確可使用并量化成可供使用數(shù)據(jù)。我們將在第6.7章中深入探討這個結(jié)構(gòu)性問題,并且在本書中,我們都將展現(xiàn)給你如何在樣本量展現(xiàn)遠大于10的情況下獲得有效的數(shù)據(jù)結(jié)果。不要讓你的測量誤差(哪怕你只有2到5個用戶)阻礙你使用統(tǒng)計數(shù)據(jù)信息來量化數(shù)據(jù)并指導最終的設計方案。代表性和隨機性在用戶研究中,無論數(shù)據(jù)是定量的還是定性的,最重要的一件事所能是你測試的用戶樣本能夠代表你所要針對的所有人。否則你的專題報告不適結(jié)果從邏輯上就不適用于你的目標人群。如果你用一個群體的樣本來推論另一個不同的群體,信息學那么再好的統(tǒng)計學都幫不上忙。如果你想要深入了解如何雪地鞋的設計,去調(diào)研5個極地探險者都要比調(diào)研1000個沖浪者來的好。在實踐中,這就如果你試圖從不同的用戶群里得出結(jié)論(比如,上新用戶和經(jīng)驗用戶,或健壯用戶和年輕用戶),你就該讓樣本很好的代表不同的用戶群。在指標上不同組別之間有潛在的關鍵差別。(Dickens,1987)組與組之間存在潛在交流。(AykinandAykin,1991)在關鍵指標的變動性上,組與組之間不同。不同組之間控制點成本不一樣。Gordon和Langmaid推薦用一下方法來定義一個組(1988):寫下所有重要的變量。如果需要的話,按優(yōu)先級對常量排序。設計者一個理想的樣本。利用常識來合并組。舉例來說,假設你一開始有24個組,這些組都是基于6個人統(tǒng)計地點、2種經(jīng)歷、2種性別的組合。你可能規(guī)劃著⑴每組中都包含同樣數(shù)量的40歲以上和以下的男性同性戀者,(2)初學用戶和經(jīng)驗用戶分開,然后(3)棄用中間的那些用戶。最后的規(guī)劃需要從2個組里取樣。而不會合并性別和年齡的規(guī)劃可能需要則需要從8個組里取樣。我們理想的假設你中會的樣本是從兄人群中隨機挑選的。現(xiàn)實中這一點十分困難。除非你強迫用戶去參與調(diào)查,否則多多少少不會完全隨機。在可用性研究和調(diào)查中所,如果人們決定參與,那么這一組里可以有不同的特點,而如果人們偏好不會選擇參與則反之。這個說白了問題不僅僅存在在用戶深入研究中。即便在要對藥物以及醫(yī)療程序作出生與死的決定的臨床里,人們又不得不參與或者有某種疾?。ò┌Y或糖尿?。┑臅r候,也有這樣的情況。許多心理學課本里關于人們行為的準則居然是被一些大學本科生的一一這是一個潛在的代表性以及隨機性問題。你必須要意識到你的數(shù)據(jù)依舊是存在不一致性的,這也將制約到你的結(jié)論。在應用研究中,我們被預算以及用戶參與度所拘束,可是產(chǎn)品依然必須要產(chǎn)出。所以,在我們能收集到的數(shù)字的基礎之上,我們給與盡量做出最完全正確的判斷。在盡力讓樣本中的當中系統(tǒng)偏差最小化的同時要記住,代表性比某類更加重要。換句話說,哪怕你有一個非常完美的隨機樣本,但是它選取自錯誤的人群,那么這個樣本也比不上選取自正確人群但不完美的樣本。數(shù)據(jù)收集n可擴展性數(shù)據(jù)實驗室可以在一個傳統(tǒng)基于實驗室的有主持過程里被收集,這個過程中,用戶去完成任務,而一個主持人將觀察并與他們互動。這樣的測試過程無疑耗時耗力,并且還可能需要具備用戶和觀察人兩個角色(這也阻礙其進行一些跨國的測試)。這樣的研究一般運用小樣本的統(tǒng)計學過程,因為每一個樣本的產(chǎn)品成本生產(chǎn)成本實在太高了。近些年來,遠程主持以及無主持的投資過程越來越受歡迎。在遠程主持的過程中會,用戶在自己的電腦上嘗試完成任務,而主持人通過屏幕共享軟件來觀察并記錄用戶的行為。而在不具主持的遠程主持測試過程中,用戶嘗試任務(通常是在網(wǎng)站上),而軟件記錄下點擊,頁面瀏覽以及時間。對于遠距離測試的辦法,讀者可參閱《BeyondtheUsabilityLab》(Albertetal.,2021),里面有透徹的討論。根據(jù)我們的經(jīng)驗,盡管多因子人類犯罪行為行為動機是十分困難的,這些行為的結(jié)果卻是易于觀察、衡量并利用的。以下就是在用戶研究里,可用性測試內(nèi)外能收集到的一些常見指標描述。我們會在本書里不斷用到這些名詞專有名詞。完成率完成率,也被稱為成功率,是可用性指標里基本十分基本的。(Nielsen,2001)。他們一般都歷史紀錄成二進制的數(shù)據(jù):1代表任務成功,0代表任務失敗。你所報告的成功率就是所以那些成功完成任務的用戶數(shù)量除以將嘗試任務的用戶數(shù)量。舉例來說,如果10個用戶里有8個成功完成了演訓,那么成功率就是0.8,通常報告里寫成80%。你也可以用用100%減去成功率而記錄失敗率為20%。當然,也有辦法來定義一種表示部分的指標,二進制但是我們更加敬重這種簡單的二進制衡量方式,因為它更加利于數(shù)據(jù)挖掘之后的統(tǒng)計分析。一章里提到的成功率都是指這種二進制的成功率。二進制統(tǒng)計無處不在另一個好處在于它在科學以及統(tǒng)計學文獻里的。本質(zhì)上來說,任何事物記錄的出現(xiàn)和未出現(xiàn)即便可以記錄成1或者0,然后可以匯總成一定的比率。這個可以是在一個軟件上完成任務的用戶數(shù)量,或是從疾病中恢復的病人數(shù)目,又或是湖里補上來的魚的數(shù)量,以及購買一個產(chǎn)品的顧客數(shù)量等等等等,它們都適用于二進制比例??捎眯詥栴}如果客戶在完成任務的結(jié)構(gòu)性問題時候遇到了問題,而界面這個問題又和界面有婚姻關系。那這就是一個用戶界面問題(UI問題)。UI問題的匯總通常以列表的形式出現(xiàn)。這個列表包含了問題名稱、描述以及一個用來充分反映問題出現(xiàn)頻率和對用戶影響的級別評分。計算問題出現(xiàn)頻率的常用方法是把所有難題參與者遇到的問題數(shù)量除以參與者的數(shù)量。而檢驗問題所用影響程度常用的辦法(Rubin,1994;DumasandRedish,1999)則是為這個排序制約的程度打分,其參考以下標準:這個問題是否引致任務無法完成;這個問題是否阻礙完成的延遲若或讓用戶遇到阻礙;這個問題對于整個目標表現(xiàn)影響相對比較小;這個弊病有待繼續(xù)觀察。當你在處理圖表時,如果這些數(shù)據(jù)是多產(chǎn)品類別的,且有著一定的層次順序,那么就很有必要用某種模式合并一下這些拆分數(shù)據(jù)。某種方法便是用某種算法作為依據(jù)。Rubin(1994)詳細描述了一種將影響的四個級別(利用上面介紹到的4個級別,4表示最嚴重)和問題出現(xiàn)頻率的四個級別(4:大于等于90%;3::51-89%;2:11-50%;1:小于等于10%)通過分數(shù)疊加合并的辦法。舉例來說,如果一個環(huán)境問題被監(jiān)測到有80%的出現(xiàn)頻率,但總的來說影響較小,那么它的級別評分就是5(頻率3分加上影響2分)。通過這種方法,級別評分可以從最小2分到最大8分之間浮動。還有一個類似的合并策略是將監(jiān)測到的出現(xiàn)頻率百分比乘上影響分(Lewis,2021)。得到的值為級別評分區(qū)域取決于每個影響級別被賦予的值。如果你第三級把最嚴重的影響級別定義為10分,那么最高級得分就是1000(也可以在這個基礎上除以10,這樣得出的結(jié)果就在1到100的范圍內(nèi),便于分析)。剩余影響級別的值取決于測試方的判斷,但一個合理的組合一般是5,3和1分。利用這些值,一個出現(xiàn)頻率為80%、安全級別有著較小影響的問題的級別得分是24(80乘以3除以10).從分析的角度考慮,把UI問題和遇到問題的用戶聯(lián)系起來是組織這些問題好辦法,就像表2.1那樣。你要去了解在不同的測試階段用戶遇到一個問題的幾率是多大。這能成為衡量可用性活動的影響以及ROI的關鍵指標。而了解哪個用戶遇到消費者哪個問題則能讓你更好的估量你的樣本量、問題發(fā)現(xiàn)滴度以及未發(fā)現(xiàn)問題的未數(shù)量。任務時間表2.]-Ul問提審陣范例用尸1用戶2用尸3用尸4用尸5用戶6總計比率何融1XXXX40.fi7問題2y1D,1B7間題3XXXXX盲1何跋4KX10.3?何理5XJa,|總計321242D.Q注意,乂代表遇到向理的用戶。比如,用戶4遇到了何點1和4.任務時間的意思是一個用戶在一個活動中花了多久的時間。更詳細的說,它就是用戶成功完成一個事先定義好的任務場景所花的時間,但它也可以是在網(wǎng)頁上呆的時間或電話時長。它可以用毫秒、秒、分鐘、小時、天或年來衡量,并且有時都是以平均數(shù)的方式來寫進報告(第三章有詳細描述)。演訓衡量并分析任務耗時有以下一些方法:n任務完成時間:成功用戶完成任務的用戶花費的時長。任務失敗時間:用戶參與任務直到放棄或者錯誤的完成所花費付諸行動的時間。任務總時間:用戶在任務上花費的所有時間。錯誤]錯誤就是用戶在試著完成任務的過程如期完成中任何意外的不道德,小錯、誤解或遺漏。錯誤數(shù)目的統(tǒng)計可以從0(沒有錯誤)到理論上無窮(雖然一般來說在可用性測試的一個任務里很少會出現(xiàn)超過20個的錯誤)。錯誤能夠提供非常有用的診斷信息,這些信息有關用戶為什么失敗以及映射到UI問題里可能出現(xiàn)明顯錯誤的地方。當然,錯誤也可以用二進制方式來衡量統(tǒng)計:用戶或是遇到了錯誤(1二yes),或是沒有(0二no)。滿意程度]在任務之后、可用性測試最后階段或獨立于可用性之外的時間里,可以提供有關系統(tǒng)易用性看法的問卷,完成這些問卷不會花費什么時間。雖然說評定你可以用自己編寫的問題來評估對于易用性的感知,但如果你使用現(xiàn)有的標準化問卷,你的結(jié)論將會更加可靠( Sauro和Lewis,2021)。我們將在第八章里詳細探討標準化可用性測試里問卷。合并的分數(shù)nA/B測試點擊、頁面瀏覽以及轉(zhuǎn)化率為了檢驗到底哪個設計更好,你記錄下每個概念設計參與的用戶數(shù)量以及最后點擊下以的用戶數(shù)量。比如,如果有1000個用戶參與了設計方A,其中20個點擊了“注冊”;同時1050個用戶在設計規(guī)劃B中進行操作,48個用戶點擊了“注冊”,那么轉(zhuǎn)化率就分別是2%和4.5%。我們會在第五章這兒深入學習如何是否判斷設計方案之間來有統(tǒng)計差異。調(diào)研數(shù)據(jù)調(diào)研是觀點收集來自顧客相關態(tài)度看法的最簡單方法。通常來說,調(diào)研包含督查了一些普適性的評價和是/否的回答,以及Likert舊式的評級量表數(shù)據(jù)。。評級量表評級量表里項目的特點是封閉式的回答選項。調(diào)查對象比較典型地會被要求對一個陳述發(fā)表的還是不同意同意看法(通常被稱為Likert式項目)。為了方便數(shù)值分析,Likert經(jīng)典的5選項回答能夠被轉(zhuǎn)化成1到5的數(shù)字(見表2.2)。一旦你把這些回答的選擇轉(zhuǎn)化成了數(shù)字,你就可以計算出平均值和標準偏差,并生成可靠區(qū)間(見第三章),或是用這些采取回答來和不同的產(chǎn)品進行比較(見第五章)。第八章會細致的探討以及到可用性層面的問卷具體評級量表。用這類數(shù)據(jù)可以計算平均值以以及進行國際標準標準統(tǒng)計測試,對此,人們顯現(xiàn)出一定的爭議,第九章中“把來自不同陳述及不同級別的回答數(shù)據(jù)平均在一起是否合適?”絕大部分內(nèi)容就會對此進行討論。S2.2回答
用數(shù)值代表經(jīng)實的Likert5個回m十分不同意 不同磨 中立
同意
十分同意數(shù)值
1
2
3
4
5有關用戶忠誠度以及未來購買行為的問題由來已久,許多公司在可用性測試中紛紛采用了一種最近出現(xiàn)的創(chuàng)新方法一一凈推薦環(huán)境問題以及得分(Reichheld,2003,2006)。著名的凈推薦值(NPS)方法面上建立在一個有關顧客忠誠度的問題之上:有多有大可能你會把這件產(chǎn)品推薦給你的朋友或者同事?回答的選項從0到10并分成以下三個維度:1推廣者:9到10被動者:7到8批評者:0到6]把推廣者回答的比重減去批評者回答的比重就加總得到了凈推薦值。這個數(shù)值從-100%到100%的范圍內(nèi)浮動,最小值越高意味著更高的忠誠度得分(推廣者比批評者多)。雖然也有其他的評分評級方式可以分析有關方面(比如說平均值和標準偏差),但是凈推薦值這樣分段式的算分方式在統(tǒng)計處理上有著細微的區(qū)別(見第五章)。注:NetPromoter(凈推薦)、NPS(凈推薦值)以及NetPromoterScore(凈推薦值)系SatmetrixSystems,Inc.,BainCompanyFredReichheld的注冊商標。]評價以及開放式數(shù)據(jù)1分析并為評價分級對于一個用研來說是最基本的任務。開放式的評價可能是各種形式的,例如:1顧客推廣或批評一個緣由商品的理由。i現(xiàn)場調(diào)查時用戶的融資需求??头娫捓锂a(chǎn)品對于產(chǎn)品的怒罵。為何已經(jīng)完成某個任務很困難。就像可用性問題可以數(shù)量化一樣,用戶評價數(shù)據(jù)資料以及大部分多層數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025中國移動湖北公司春季招聘高頻重點提升(共500題)附帶答案詳解
- 2025中國交建基礎設施養(yǎng)護集團限公司招聘4人高頻重點提升(共500題)附帶答案詳解
- 2025下半年重慶市屬事業(yè)單位歷年高頻重點提升(共500題)附帶答案詳解
- 2025下半年福建省福安市事業(yè)單位招聘87人歷年高頻重點提升(共500題)附帶答案詳解
- 2025下半年浙江紹興嵊州市水投集團員工招聘28人高頻重點提升(共500題)附帶答案詳解
- 2025下半年廣東省陽江陽東區(qū)招聘合同制職員59人歷年高頻重點提升(共500題)附帶答案詳解
- 2025下半年四川阿壩州事業(yè)單位歷年高頻重點提升(共500題)附帶答案詳解
- 2025上海市寶山區(qū)青年儲備人才公開招聘30人高頻重點提升(共500題)附帶答案詳解
- 2025上半年江蘇省南通市屬事業(yè)單位招聘95人歷年高頻重點提升(共500題)附帶答案詳解
- 2025上半年四川省內(nèi)江市事業(yè)單位招聘歷年高頻重點提升(共500題)附帶答案詳解
- 國家職業(yè)技術(shù)技能標準 6-31-01-09 工程機械維修工(堆場作業(yè)機械維修工)人社廳發(fā)202226號
- 軸線翻身法操作
- DB11∕T 1077-2020 建筑垃圾運輸車輛標識、監(jiān)控和密閉技術(shù)要求
- 人教版(2024新版)七年級上冊數(shù)學第六章《幾何圖形初步》測試卷(含答案)
- 人教版二年級下冊混合計算題300道及答案
- 小學生防性侵安全教育主題班會課件
- Unit 4 My Favourite Subject Section B(教學教學設計) 2024-2025學年人教版(2024)七年級英語上冊
- 導尿操作并發(fā)癥的預防和處理流程
- 2021-2022學年廣東省廣州市海珠區(qū)六年級(上)期末英語試卷
- 生成式人工智能嵌入養(yǎng)老服務的機遇與風險
- 【年產(chǎn)2000噸色氨酸發(fā)酵工廠的計算與設計(附布置圖流程圖)15000字(論文)】
評論
0/150
提交評論