《解讀數據的技術》: 讀出數據背後的含金量

by Myrna
解讀數據的技術

《解讀數據的技術》這本書作者車賢那,是韓國星巴克第一數據科學家。以「消費者心態」思考,以「物以類聚」進行分析。企業在檢視數據上,需同時考量供給者和消費者的面向,從雙向的數據進行思考,才能避免僅僅看到片面的數據觀點,錯失了許多的機會。

一般在分析顧客資料,從人口統計數字出發,如從性別、年齡的分佈,已逐漸不具代表性,而是應以顧客行為為基準,推薦符合個人取向的產品,或是將消費行為群體化。「現在我們不再花錢讓一萬個人看見廣告,而是將錢花在可能會購買這項產品的一百個人身上。」

3個好奇問題

書中帶出三個令人好奇的問題,讓我們一一來探討。

問題1、資料不就是資料嗎?它會說謊嗎?

書中將數據資料分為:主動式資料(active data)、被動式資料(passive data)。主動式資料像是我們使用信用卡的行為,搭捷運或公車使用悠遊卡時,使用ETC支付高速公路通行費,上班時使用打卡機也是一種行為數據。被動式資料則是透過問卷調查,由消費者回饋問題,而獲得的結果。

  1. 主動式資料:在不同的情境下也可能有不同的解釋,理解資料的上下文(context)是至關重要的。例如,信用卡的消費行為可能會受到季節、節日、生活事件的影響。因此,數據分析師應該結合資料的時間、地點和情境,才能更準確地解讀數據背後的行為模式。
  2. 被動式資料:雖然可能蘊藏謊言,但能從中找出價值。在消費者經過主觀判斷、有意識或無意識回答問題、當下的環境情況,而與現實不完全匹配。但這並不意味著被動式數據就不具參考性,找出有用的訊息,並排除干擾進行數據清洗(data cleaning)提高數據質量,讀懂其中隱藏的消費者行為原理。

問題2、在什麼情況之下,我們的花費會比往常來得高嗎?

在「渴望追求多樣性」的情境下,人們會做出與往常不同的消費行為。

  1. 從週五晚間一直持續到週日下午,是否會更容易有較高的花費呢?尤其在經歷了一週五天的工作後,有了犒賞自己的心理,進而增加了花費。
  2. 當我們去到旅遊地,許多的花費被視為理所當然,因為我們到了度假的地方,會有極高的機率想要感受一些和平時不同的事物,在花費的容許度就會提高。
  3. 心理因素如情緒、壓力和社交影響也會大大影響消費行為。例如人在心情愉快或沮喪時更容易進行衝動消費;經由社交媒體、網紅、親友推薦下,也會提升消費機率。
  4. 經濟環境(如經濟繁榮或衰退)也會影響消費者的花費模式,宏觀經濟因素應該被納入分析,以理解消費行為的變化。

問題3、當消費者回答「會購買」,就一定會真的花錢嗎?

消費者身上都有著像「黑盒子」一樣難以解析的心理,如何運用「延遲時間」透析消費者身上的黑盒子?

從被動式資料得到了消費者有想構買產品的意願,但是最後實際的購買行為卻沒有發生時,我們該怎麼得知消費者是否為真實的潛在客戶呢?

從各種足跡來顯示:他們搜尋過官網、點擊與消費的紀錄。將記錄串聯起來,觀察這些不經意的行為、延遲的時間、搜尋、點擊,就可以推斷出消費者內心的想法。

透過未經造假的搜尋結果或相關詞彙,就可以排序出消費者目前關心的事情。進而將資源投放在具有潛在消費機會的顧客身上。

5個工作要點

當然身為資料分析師,書中也提出了許多工作中一定要留意的五要點:

要點1、用全面性的結構來思考資料建構,是對日後運用鋪好道路

在進行資料建構時,需先進行全盤的思考,資料結構、屬性、欄位定義、分類,是否具有應因變化的彈性,是否保留修改的空間。

這讓我想到,近兩年在工作中推行重組日常我們解析資料的專案時,來來回回討論資料組合、分類,除了有保留彈性變化空間外,其中最重要的一塊是「中心準則」,在資料欄位、屬性規劃上,需要時常回頭思考「中心的準則」是什麼,在未來面對新的變化,要不時拉來中心思考,才不會應因變化而不斷的修改重來,亦或是疊床架屋,最後長出難以管控的資料怪獸。

要點2、BI只是一個工具,但不是用了BI就代表公司有好好利用數據。

在實際使用BI工具這幾年,在設計儀表板主要是初階資料的呈現,的確是有其便利之處。若需要更進階的鑽研,則除了需在設計上,有自身對於資料脈落的解讀要有一定的深度,且仍需搭配BI工具的功能需有一階、二階、三階往下看,由上到下,再由下到時間拉長遠來看,這都需要經驗的累積。

再回頭來看,要發揮BI工具的功效,書中所提的一位能夠正確掌握數據結構與使用目的的使用者,才能真正將這工具的效能發揮到淋漓盡致。

這是我認同的,一是數據結構,若一開始沒有全盤了解最終的目的,再來思考資料結構的建構,不同的資料結構與最終的目的可能完全背離,那打掉重來的機率就很高,這也是在使用BI工具中,要完成結果,最重要也最花費時程的反而是資料結構的設計。

要點3、永遠要了解問題的核心在哪?

做數據分析,從來都不是為了分析而分析,更重要的,其實是問題本身有沒有針對核心提問,所提問的對象是否合宜。

「為什麼高層要問這個問題?」、「他們真正想聽的是什麼?」、「這問題是真正的問題嗎?背後真正的問題是什麼?」爬梳完千頭萬緒後,來再展開計劃,否則一開始就弄錯方向,倒頭來只會花費更多的力氣和時間。

 

要點4、用數據證明常識,本身是一件有意義的事

要以數據證明某件事情,有時候就必須經歷從無到有的創造過程。以過往沒有的方式收集無數資料的階段,以及將分析結果透過人類語言表述時,很可能會出現一個眾所皆知的常識。

而常識恰好就是檢驗數據是否合理、正確最好的方式。試想,當我們的數據結果一開始就不符合常識,我們該如何自信的使用這份資料延伸其他的應用。

 

要點5、歷史不一定會重演,但我們需要知曉歷史發生了什麼事

在我的工作中,老闆總笑稱歷史資料不就是「驗屍報告」。

雖然歷史不一定會重演,但我們往未來前進的路線,也許會有雷同之處,亦或是「當年」曾經犯的錯誤,我們怎麼會知道不會再來一次。

利用數據創造出更好的現在與未來,比單純將數據看成過去的情況,來得更為常見。為了計畫將來,我們就有必要回顧過去,所謂的「新」,也必須要回顧過去沒有什麼,才能產出所謂的「新」東西。

2個實用叮嚀

叮嚀1、「現場」是驗證數值分析是否正確的最佳之處

「愚問賢答」,我們問題的答案就在現場。我們可以透過數據來確認我們在現場發現的現象與問題,及需要改善的地方。現場是產品與消費者相遇之地,而數據分析師的真正價值,就在於未來是否能為現場帶來變化。只產生數據,但對「真實」情況一知半解,那也不算是真正的理解。數據分析能夠告訴我們「什麼」正在發生,但現場觀察能夠告訴我們「為什麼」會發生。

叮嚀2、「數據素養」的形成,是我們成長茁壯的養分

我們常說,試著回頭看,一路走來,那些跌倒的過程,都是日後成長茁壯的養分。回顧過去不是要我們陷入在失敗的泥沼之中,而是要從中檢討,「如果重來的話我們可以怎麼做會更好?」和「下一次,我怎麼避免這些錯誤?」

「數據素養」的養成,有時候遠比熟悉新技術更加的重要。而該如何養成,就是從日常有沒有養成這些習慣而來。

結語

對公司而言,直白地說,研究數據的目的是「為了提升獲利」。我們得要試圖了解購買公司產品的消費者,釐清消費者的需求與心理是非常重要的。

擁有數據的公司,就像是掌握了一台邁向未來的推進器。未來不需要數據就能生存的公司,比重將會下降,或者說:「數據扮演的角色,將會變得更重要」。數據分析不應該是孤立的過程。

與不同部門和團隊合作,可以帶來更全面的視角和更豐富的背景知識,從而提升數據分析的效果。數據可以幫助我們在經營決策上,進行更「有所本」的決定,在這瞬息萬變的商業環境中不再盲目前進,幫助公司找到獲利的契機。

《解讀數據的技術》這本書,推薦給資料分析工作者,從書中的觀念反思在工作中遇到的問題,重新認識數據帶給我們的幫助與視野。

相關文章

4 留言

麥菈 2024-07-25 - 3:37 下午

覺得這篇好讚,最喜歡「歷史不一定會重演,但是我們需要知曉歷史發生甚麼事」!超級有感!如果不知道歷史會發生甚麼事,很容易造成重工現象,降低效率!

Myrna 2024-07-26 - 11:34 上午

謝謝~ 我也很喜歡這句話。歷史雖然是過去式,但是我們可以從中學習很多,減少重工也是非常重要的!

John 2024-07-25 - 9:36 下午

認同在數據分析之前要先釐清核心問題,不然一頭熱栽進去分析,很容易做白工

Myrna 2024-07-26 - 11:38 上午

沒錯!過往的我也很常一頭栽進去,原來一開始沒有先弄清楚核心問題在哪? 所以時時要先提醒自己。

留言