此文是想梳理下,對于“數據”這個概念,到底意味著些什么,幫助大家從不同層次理解多面的數據。
先明確下獲取數據的目的:度量。
“文中示例相關數據都為假的模擬數據,而非真正的商業數據,以此聲明”
「度量 Measure」是一種測量評定對象的方式,它幫助我們結構化的獲取對象的狀態與變化,我們運用這些數據進行洞察,轉化為有用的信息,幫助決策和優化,這個過程也是分析診斷的過程。
那日常會有怎樣的一些信息獲取呢?(這里面包含了數據也包含了一些正負性的反饋)
我們對一個功能上線進行一組完整的項目結果質量數據模擬:
凈交易收入額比去年同期上升 2.0%,達到 2 千萬
訂單量為 222,比上周上升了 2.0%(對交易產生直接正向作用)
方案產出數共 222 件,比上周上升了 22.2% (對內容產出有直接的提升)
用戶的滿意度為 2.2,上升了 2% (之前是 2.0)
用戶使用表現出沉靜,輕松的情緒(比之前挫折,晦澀要好很多)
功能點擊,周活躍 2200,點擊率 22%,周留存 22.2%(0-1)
功能渲染和可交互時長為 0.2 秒加載完成。用戶在使用時交互順暢無卡頓(符合業界前端質量交付標準)
這段描述符合整個產品使用的過程,它似乎是一個多面體,幫助我們了解整個產品黑盒。這個描述越精細越多維,我們得到的信息就越清晰越客觀。(包含多元數據內容,并對數據已進行比對和使用,得到一定的有效信息)反之,假如哪個環節出現問題。我們能清晰看到問題出現的環節,并且通過其表征的信息進行問題的深挖(再細化相關數據或者關聯的層次)。
我們可以拆解到這幾個層次的數據:業務結果、用戶反饋(態度與情緒)、行為點擊、系統性能
可理解為:良好的產品運行-》用戶流暢使用-》良好的用戶反饋-》預期的產品轉化結果
從獲取方式來說,大致可以從兩個大角度(這里從廣義的范疇去分)
- 「qualitative research 定性研究」:快速從樣本中判斷問題的性質和方向
- 「quantitative research 定量研究」:數據的驗證性,全面性、追蹤性
系統承載業務內容的運作,可以記錄各種各樣的明細數據表,在海量數據中,進行科學的關聯與細分。以大數據驅動為最終目標,其特點是:數據的全面性和自動追蹤獲取。
1. 業務結果
追蹤問題:產品是否符合市場需求?產品是否良性發展?
業務型數據是圍繞著整個商業建設和運作階段而產生的數據。是最能體現產品、商業價值的部分。可以歸納為三類:內容建設->流量訪問->商業交易。是商業鏈路中產生的具有直接商業結果的數據。
內容建設是指經過人為輸入,系統流轉產生的比如商品、文章、方案等等具有實質內容價值的數據。是具有生產過程的(一般是經過一系列的操作完成的)。
流量訪問/分發則是針對商業內容的使用/運作,比如某個商品的瀏覽,某個內容的傳播等等。這些和營銷相關具備人群效應的數據也屬于業務數據。最常見的就是曝光量點擊量,而在中后臺系統中則是以訪問瀏覽為主。
商業交易則是最直接的商業結果型數據,最常見的就是網站的 GMV(成交金額:包括:付款金額和未付款。)
訂單交易額、注冊會員數等等。
以某平臺中相關的業務數據為示例
業務結果的分析,是根據不同業務發展,確定核心業務指標,以及建立對核心指標的拆解邏輯。
它或許是個計算公式。或者是個一級指標到二級關聯指標。例如以下,這里暫時不展開來講。
對于業務數據的獲取,我們大部分是直接通過后端的數據庫沉淀下來的。但如果涉及到商業數據的細分(按照商業目標進行階段性或者類別型的追蹤監測)。比如想知道會員的 vip 的分層情況。或者知道某行業商品的生產細分情況等等。這些雖然可以通過后端拉數據,讓數據分析師或者運營整理出來,但是每次都有加工成本,也沒有辦法看到實時數據,這時候就會要考慮去做細分埋點,下文會提及到埋點方式。
2. 行為點擊
追蹤問題:產品使用情況如何?用戶瀏覽習慣如何?
用戶行為數據,是圍繞用戶訪問某產品過程的用戶行為軌跡數據。其中大體包含了用戶量、曝光量、點擊量、瀏覽量、訪問時長、停留時長等等觀測用戶使用情況的表征數據。
這里是一組典型的平臺用戶使用行為的描述,而這些行為的最終,是產出了上面的業務數據(訂單與成交金額)
訪問首頁->點擊并瀏覽商品詳情->點擊客戶咨詢進行咨詢->點擊購買提交訂單->點擊支付,支付完成
由此我們可以解釋,行為數據與業務結果之間的關系,并且兩者的關注點也是有差異的,在行為鏈路中,我們更注重每一層的轉化關系以及用戶為什么沒有向下轉化的障礙點。
2. 再以 B 端管理系統為例
B 端的管理系統具有典型性,可以用點線面來歸納,點指的是諸如事件曝光點擊等。線指的是用戶使用路徑,面則是廣義的綜合性觀察,比如流量分布,比如區域熱圖等。通過觀察這些,可以觀察到用戶的使用率和使用路徑。并且得知用戶使用產品是否真的貼合需求,設計的是否合理高效。
行為數據要結合具體的場景或者維度去觀察,才能產生更有用的信息。
運用行為數據,我們可以去做很多分析:漏斗分析、留存分析、流量分布分析、路徑分析 、單頁熱力分析、點擊分析、 人群分析等等,這些都是分析方式,在后續關聯篇章中會去探討。
行為數據的獲取是依賴于埋點的,在業界有兩大類埋點方式:全埋點、手動埋點。
行為數據的三大事件類型基本可以歸類為:曝光事件、點擊事件、停留事件
對于 C 端側重于曝光、點擊。對于 B 端側重點擊、停留 (從流量轉化與訪問效能兩個角度來說)
以上介紹了業務結果和行為點擊兩種數據,而這兩種內容,都會涉及到埋點采集這件事,這里我們介紹下關于埋點采集數據這件事情。
3. 埋點采集
追蹤問題:如何根據人物、場景、動作制定精準的采集方案?
埋點,是對特定數據的采集,由前端埋點和上報、進行數據處理和數據分析。一般數據埋點分以下三種:
全埋點雖然是所有數據按需可查,但是因為它的數據量極大,且需要 2 次定義和清洗,所以只能對通用性質的數據進行采集。而針對性的內容,由數據采集定義后,由前端上報后,可能做到定點,定期精細具體的統計。
兩者大致能產出什么數據分析呢?主要以平臺/系統這個角度看:
- 整體分析-通用全埋點
用戶活躍、用戶留存、用戶跳出率、用戶停留時長、用戶流量分布...
- 局部與特定分析-手動埋點
關鍵事件點擊率、關鍵入口渠道流量總計與分布、關鍵鏈路漏斗、關鍵具體區域曝光與停留時長...
為了獲取更精準的業務/行為數據,我們一般會采用手動埋點的方式,所以前期第一階段會在場景中確定分析目標,然后梳理相應需要的指標,書寫明確的埋點需求是很重要的一個環節,書寫的足夠明確,才能和業務、前端、數據分析師進行準確的溝通,分析目標一致,接著上線后建立相應的數據看板。
注意點:采集方式|統計口徑|數據精準度校驗
那怎么定義數據分析時的埋點需求呢?可以用以下方式去描述:
- 什么用戶=用戶定義
- 什么時間=時間戳
- 什么環境=地理位置+網絡環境+硬件環境+軟件環境+哪個頁面(來源頁面)+什么位置
- 什么行為=事件 ID+命名
- 什么條件=可以以某個行為或者業務交易為條件
- 結果如何=用戶操作的結果
示例:
一個后臺系統懸浮幫助功能使用的情況需求
一個搜索使用的情況需求
這 2 個是比較細致的數據采集的描述。規則了統計的對象、范疇、以及條件,結果觀測等等的需求,大家可以在業務和行為數據相關采集中,試著撰寫下這樣明確的需求。這樣的數據采集才具有精準的分析價值。
4. 人群標簽
追蹤問題:用戶都是哪些人,誰使用了這些功能 ?
人群標簽可以理解為數據型用戶畫像。為什么在這里提及,因為大量數據(特別是具體的采集數據)都會涉及到人群這個角度。人群也是定量數據中最具有獨立觀察價值的數據。
人群標簽就是根據人群特點,進行描述分類,對人群打標簽。我們根據不同的獲取路徑,可以大致分兩類。
一類是利用基本數據進行定義,比較簡單直接
從不同的端,可以獲取用戶的基本來源,如訪問端的類型,或地理位置等,可以定義為“客戶端用戶”、“江浙滬用戶”等。
通過唯一用戶 ID 所匹配的一系列用戶注冊時的基本信息內容,如性別、職業、行業、興趣等。可以定義為“女性用戶”、“定制類用戶”等。
還有一類就是復合型自定義,一般是根據用戶的業務、行為數據或者類別屬性來定義的,它非常的靈活聚焦。
使用某類條件公式來定義某一波用戶
如我們將購買能力從高低來分層用戶:月購買小于 5000 的為中購買力用戶,大于 5000 的為高購買力用戶,周活躍大于 2 但無購買記錄為潛力用戶。
另外一種構建用戶范疇的方式:通過“時間、地點、事件”等一系列復雜描述來勾勒圈選用戶
如我們定義“第一次訪問站點時,在首頁有關注過每日推薦“的用戶。
這里的復合定義很多時候都會用到多指標多維度。是一種深度結合業務場景來圈選人群,定義用戶的方式。
人群標簽,不僅幫助我們細分數據,知道“到底是什么人做了什么事”,聚焦使用人群的各項指標健康情況。最終,還可以定位產品,定位人群,精細化運營產品:現在的用戶大致都集中在哪些人群中?哪些功能是頭部用戶需要的?哪些功能最受基礎版用戶的歡迎等等。在探索商業需求的時候,更容易找到抓鉤,去深挖商業價值。
常用畫像的場景:
- 定性用戶畫像:通過調研,熟悉角色日常生活或者工作場景環境,定義基本用戶畫像。如:用戶訪談、用戶旅程圖
- 定量用戶畫像:用定量的數據做某些值的規則,來圈定用戶人群。如: 用戶生命周期、問卷分發、運營活動
某產品生命周期使用示例:
5. 系統性能
追蹤問題:產品使用起來流暢嗎 ?
性能數據一般指由產品進行頁面渲染及前后端交互時,監測到的時長數據。觀測系統性能,是因為系統數據量很大時,在產品渲染交互環節中,容易產生卡頓,造成用戶體驗的下降,導致流失率。而系統性能,一般是由性能監控等產品產出質量報告。在一些瀏覽器中,也有嵌入的插件統計報告。
這里大致介紹下業界 google 最新的關于 7 大性能指標的定義
這其中,最重要的 3 大核心指標是:
- LCP:頁面的速度指標
- FID:頁面的交互體驗指標
- CLS:頁面的穩定指標
可以通過官方出品,安裝 web-vitals-extension 插件來獲取三大核心指標,也可以通過安裝 Lighthouse 插件來獲取如下指標,現在已經內置在瀏覽器中
定性數據,是由用戶那里獲取信息,直接判斷問題的性質和方向,快速展開挖掘和收集。
它的獲取方式主要是 面對面研究:
即選擇典型用戶角色,針對問題或者內容進行集中測試或者訪談:用戶訪談、焦點問題調研、可用性測試等。
「ps:另外一種自動化研究:圈人群進行在線問卷調研投放,聚合大量樣本進行交叉或者聚類等等分析,是一種樣本量的統計方式。具備一定程度的樣本數量,可歸為定量統計分析。」
比較常用的是:系統可用性量表(SUS)、有效性、滿意度和易用性的問卷(USE)
不管哪種方式,我們都是圍繞“可用性”這個角度去進行評估和研究的。業內可用性這個詞稱為:“Usability”「ISO9241/11」中有明確的相關定義:一個產品可以被特定的用戶在特定的境況中,有效、高效并且滿意地達成特定目標的程度。可用性關注的是用戶與對象在互動過程中的有效性(effectiveness)、效率(efficiency)和滿意度(satisfaction)。
用戶反饋中我們獲取到什么樣的信息,我們第一:明確用戶對此內容的態度,觀察用戶行徑中的順暢度,感受用戶認知反饋。第二:詢問其嚴重程度和影響程度,正面負面情緒。這兩層是由表及里的,互相關聯。但側重有所不一樣。
1. 用戶態度
追蹤問題:用戶使用后,滿意度如何?通常用到以下幾種度量
而這些內容中一般包含數據是
- 觀察與記錄實驗性數據(描述性狀態情況)
- 主觀數據和偏好數據(出自于自身的想法)
- 情感層面數據(使用系統后最終的感受或者過程中的心情)
- 結果性數據(比對/選擇內容,得出結論)
而從場景分我們如何使用這幾種度量呢?
引用自:Tom Tullis Bill Albert {Measuring the user Experience} 用戶體驗度量
不難發現,我們最常用到的是「自我報告式的度量」
它比較寬泛的反應了產品綜合情況。這里舉一個自我報告度量涵蓋的范疇
追蹤問題:用戶使用后,在情感上反應如何?
初步知曉用戶反饋情況后,可以深入用戶情緒感受,進行點狀問題的挖掘。進而對問題進行定性分析追蹤和程度評級。用戶在一定嚴重情緒影響下,是對產品會產生排斥的,所以有時候對情緒的收集,能讓我們對內容具備敏感度。且在設計過程中,充分建立共情和同理心。
情感描述模型是指對情感狀態進行定義,并描述其表達性特征的方法,主要可分為離散描述模型和連續描述模型。
連續型描述模型往往認為人類的情感狀態是分布在若干個維度組成的某一個空間中,不同情感狀態之間不是獨立的,而是連續的,可以轉化的。
這里我們介紹一個連續描述模型: 喚醒度(Va-lence-Arousal)模型
「Va-lence-Arousal」:用兩大象限歸納了人們的情緒:正面與負面情緒的變化。激動和平緩情緒的變化。構建了一個立體的情感空間。
當度量情緒變化階梯時,可以試著使用連續情緒。比如:挫折——》生氣、沮喪——》厭煩等。而有些程度詞是和時間長度有直接關系的,比如說疲憊。我們需要關注場景特點,用戶可能會長時間沉浸式體驗時,它是否能接受打擾,是否會因為一些內容受挫。這些都會導致他最終直觀感受的好與壞。
舉例子來陳述:
- 產品設計過程中,串聯用戶使用流程時,流程的長短和任務路徑會產生直接用戶感受-》是否足夠輕松
- 運營產品過程中,在哪些環節中穿插特定內容可以打造用戶峰值體驗。—》這個推薦不錯,好貼心,驚喜當這些生動的情感詞匯,被考慮進產品設計中時,很容易讓我們得到一個具有溫度感,具有更良好接受度的產品。在度量實施方式上,我們可以在用戶旅程圖中,在問卷或可用性測試部分,考量使用卡片分類法,或表情評分板對用戶的情感進行收集。(基于情緒感知更為直接有共情性)。
情緒評分卡:
在各種用戶態度反饋中,我們也可以直接去獲取針對性的情緒化度量表進行 5 分表計量評分。
具體方式:
- 第一步:卡片分類法,預設 10-20 組情緒關鍵詞,讓用戶選 2-3 個關鍵詞,確定影響面。
- 第二步:確定程度:1-5 評分機制確定程度。
以下為目標設定的取詞示例:
追蹤問題:什么問題是至關緊要的,需要馬上解決的?
定性內容的收集完成后,一個比較重要的事情就是針對問題去做 2 次整理和評級。
嚴重性評估有助于集中精力解決關鍵的問題,清晰說明每個一個嚴重等級的意義。對每個等級都盡可能用實例說明。
常用評估:
高中低評估
- 低-會讓參加者心煩或沮喪,但不會導致任務失敗的問題。
- 中-這類問題會顯著提高任務的難度,但不會直接導致任務的失敗。
- 高-所有直接導致任務失敗的問題。遇到這類問題后基本沒有可能再完成任務。
綜合因素評估
- 多維度的評估
前兩個較常用,后兩個看產品及技術配合
- 對用戶體驗的影響
- 預期的發生頻率
- 對商業目標的影響
- 技術/實現成本評分(0=低,1=中,2=高)
以上是我們對分層數據獲取的一些整理,希望大家對于數據涉及到的概念有一個粗略的認知。當然如何運用數據做好度量這件事情,本身還需要一些串聯的方法,比如使用度量框架(Heart 模型),運用合理的分析流程(GSM),搭建追蹤式看板,基于問題的度量報告或者自我評估報告等。都是靈活運用到以上數據立體的分析產品質量的過程。
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
AI輔助海報設計101例
已累計誕生 737 位幸運星
發表評論 為下方 1 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓