• Location
    咨詢電話

    400 6890 958

    做數據分析的正確方法!

    2023-07-08 08:39:14

    瀏覽量

    要想分析有價值,需要注意這幾點

    1、提前做假設會遇到陷阱 

         某餐飲店會議室。面對堆滿數字的工作表,數名職員胳膊抱在胸前面露難色。“近三個月來,咱們店夜間的銷售業績總是上不去。大家有什么解決的對策?” “還是廣告的影響比較大吧。我覺得,不斷在電視或雜志上做廣告應該會取得不錯的效果。通過廣告提高店的知名度,客人應該會增加吧。” “也許吧。不過,廣告真的有效嗎?” “剛巧最近進行的顧客調查問卷結果出來了。這個問卷就咱們的廣告形象以 及光顧的頻率也進行了調查。” “是嗎?那就研究一下廣告形象與光顧的頻率是否有關聯性吧。” ……

    image.png

          做出假設并對此進行驗證。你所在的公司,是否也是如此呢? 

          公司里甚至可能還會有這樣一種人,他們所做出的假設頻頻中的,被人看作 極有分析感覺。眾多統計學教科書中也寫道:“做出假設,驗證假設。”因此,應該有很多人相信那就是正確的做法。 

          如果回到十年前,這些或許是對的。在沒有可用于分析的數據,調查成本也極大的情況下,不分主次胡亂收集數據并非良策。首先做出假設,在此基礎上收集必要數據進行分析是比較合理的。 

          然而,由于科學技術的進步,“依靠感覺做出假設,再予以驗證”的做法已經無法適用于現代商業。通過互聯網,我們甚至能夠以數百、數千人為單位進行迅速、廉價的市場調查,而且,現在幾乎所有的企業都使用電腦記錄庫存及銷售情況。即便是廉價的電腦,也可以使用 Excel 處理數以萬計的數據。 

          我們手中掌握著龐大的數據。只是不知道該如何使用罷了。在之前的時代,做出假設進而予以分析也可以說是“只看到了大數據的冰山一角”。

    2、做開放式提問(open question) 

          做出假設進而驗證的方式會讓我們漏掉意想不到的重要發現。比如,你的部下這段期間的業績很差。你先入為主地認為“他業績差是因為沒有干勁”,要對此進行驗證。“你業績差是因為沒有干勁嗎?” 如果你這樣去詢問部下,是不可能獲得有用信息的:若對方做出肯定的回答,你會覺得“果不其然”;即便是對方否認,你也會覺得他在說謊吧。

    image.png

    能夠用“是”或“不是”來回答的問題稱為“封閉式問題”,這經常會讓提問者不由自主地將自己的想法強加給對方。

    那么,怎樣才能在不把自己的想法強加于人的前提下,從對方身上得到想要的信息呢? 

    只要做開放式提問即可。要讓對方主動思 考 5W1H,即“何時”(When)、“何地”(Where)、“何人”(Who)、“何事”(What)、“為何”(Why) 和“如何”(How)。 

    在上述事例中,提出的問題—“你覺得業績差是什么原因”就是一個開放式 問題。或許可以借此發現能夠解決的某些原因,而非干勁、能力等誰都可以想到的抽象原因。 

    數據分析也幾乎如此。 

    “對廣告有深刻印象的人光顧頻率高 ?”這 是個能夠以“是”或“不是”回答的封閉式問題,不過,我們可以將它改為開放式問題。留下后半部分的“光顧頻率高”,將 前半部分轉換為 5W1H,就得出了下面的開放式問題。

    光顧頻率變高是哪個時期?(When)

    光顧頻率高的店鋪位于哪里?(Where) 

    光顧頻率高的顧客是什么類型的客人?(Who)

    提高光顧頻率的因素是什么?(What)

    為什么光顧頻率會高?(Why)

    怎樣才能提高客人的光顧頻率?(How)

    實際上,在上述問題中,最困難的是找出“為何”的答案,這需要將“何 人”“何處”“何事”的分析結果綜合起來考慮。 

    我們為什么要進行數據分析呢?其實就是為了從數據中得到“事前根本想象 不到的商業上的啟發”。因此,我們應該做開放式提問,將數據中能夠得到的所有信息作為答案的候選。這樣一來,就很有可能獲得有價值的發現。 

    反言之,真正有價值的發現,多是那些結果出來前誰也料想不到或者是跟直覺相悖的內容。而如果在會議室里提出跟大家直覺相悖的假設,則恐怕很難被認為是“有分析感覺”。

    3、關聯性并非答案 

    隨著電腦的迅速升級換代,進行數據分析所耗費的精力及演算時間基本上不 再成為問題。 

    只要利用恰當的工具,就算要從 10 萬份包含 100 個項目的顧客數據中調查 得出“光顧頻率高的顧客是什么類型的客人”的結果,也不過是一瞬間的事。不過,并不是說不顧章法地總體評估數據就夠了。這種做法并不一定能夠 找出我們真正想要知道的東西(本書分享多更索搜@雅書)。 

    20 世紀 90 年代,數據挖掘(data mining)這一名詞盛行,有人提出了“考 慮假設的并非人類,計算機自會為人類發現一切”的主張。這無疑是主張事無巨細對各項目進行調查的方法論。數據挖掘將有悖于人類直覺的各種關聯性明確表現了出來。例如,通過數據挖掘,我們也許會發現“周末超市的紙尿褲購買率與啤酒的購買率有很高的關聯性”。 

    那么,這一分析結果是否有價值呢? 

    當然,紙尿褲與啤酒,這兩樣商品的銷售量 增加,多少會帶來一些收益。不過,所得收益是否 與用于分析的工具或人員成本投入相稱,就是另一 個問題了。數學層面上的關聯性高,并不能保證其在商業層面上有價值,或者分析結果為人所樂見。

    image.png

    確定分析方針的三要點 

    有人也許覺得糾結:不能事先做出假設,而總體評估數據也得不出有意義的 結果,那到底該怎么做才好呢? 

    沒有必要為此煩惱。若計算機沒辦法思考分析結果的價值,那么我們可以從這個角度整理數據及確定分析方針:“何事如何變化會是我們所期望的?”

    其中的要點即下述三個: 

    輸出結果; 

    分析單位;

    解釋變量。 

    確定好這三個要點,接下來只要遵循常規操作就能夠做有價值的數據分析了。雖然這里突然出現了大家不甚熟悉的用詞,但是理解它們并不需要具備專業知識。

          “輸出結果”,是指通過數據分析得到的最讓人高興的變量。何事如何變化是 眾望所歸的—也可以看作是成果指標。 

    image.png

          “分析單位”是構成上述輸出結果的單位。如“合乎期望”的顧客、商品、 員工等,分析單位是進行數據比較的基礎單位。 

          “解釋變量”可以讓分析單位出現不同的特征。假設分析單位是“顧客”,那 么左右年齡、性別、之前是否來過等“期望值”的要素是什么?這個“什么”就 是解釋變量。 

    按照順序逐一考慮這三點,誰都可以提出分析方針。如果用一句話來概括這一過程,那就是在分析數據前要明確定義“何事如何變化會皆大歡喜”和“這到底被何種要素所左右”。

    樱花视频