《深入淺出數據分析》通過模擬業務案例,結合統計知識,介紹了數據分析的分析過程,是壹個很有幫助的數據分析入門指導書籍。
案例:結合Acome公司貌潔保濕霜的銷量數據,提升保濕霜銷量
知識點1:分析模型:確定——分解——評估——決策
分析過程如下:
1.確定問題
首先在明確本次數據分析的目標後,需要確定目標存在的問題。也可以說解決了這些問題,就能實現目標。如:
目標:提升保濕霜銷量
問題:目前保濕霜銷售存在什麽問題?哪些地方可以提升銷量?
方法:通常通過與客戶的溝通,來明確這些問題。
2.分解
需要對目前掌握的數據和問題進行分解分析,將大問題化為小問題,從數據中尋找相關因子。
分解問題:將大問題分解為小問題
3.評估
評估方法—— “比較” ,比較因果之間,因子之間,時間維度的比較,通常能發現壹些數據規律。
下表“匯總數據”分析可以得出的結論:
1).12月/1月/2月,總銷量與目標銷量之間的差距較大
2).12月/1月/2月,降價對於目前銷量的提升沒有太大的作用
3).廣告費的降低,可能帶來了銷量的下降;社會網絡費增加並沒有帶來直觀的銷量增長。
下表持續對銷量明細數據分析發現:
1.泛美批發商的銷量可觀,但它與其他經銷商的性質不同,詳細分析發現它的市場客戶群體與目前廣告營銷的客戶群體不同,是男性客戶群體。
通過數據分析,提升銷量的方法可能有兩種:1.擴大對目前客戶群體的廣告投入 2.增大對男性客戶群體的影響,可以是廣告宣傳或其他途徑的宣傳等。
4.決策
結合實際的業務情況,進行清晰明了的決策。
案例:解決星巴仕公司銷量下降的危機
知識點1:觀察法——比較觀察,排除混雜因素
知識點2:實驗法——控制組,對比驗證
1).通過用觀察法,對比各區域及匯總數據,能發現:咖啡價值在非富人區明顯下降,而在富人區不變
知識點:最優化問題,最大值
方法:
1找到決策變量(即妳可以控制的因素)
2找到變量的約束條件(即決策變量受約束的條件)
3找到目標及目標函數
4羅列約束條件組合,求解目標函數(實際上運用Excel 的solver最優規劃來實現計算)
案例:浴盆寶12月的橡皮鴨和橡皮魚的生產計劃,使企業的利潤最大
求解過程如下:
已知約束條件:每只鴨利潤$5,每只魚利潤$4,下個月最多生產400只鴨或300條魚,橡皮的總供應量為50000g,每只鴨需要100g橡皮,每只魚需要125g橡皮
決策變量為:橡皮鴨的數量,橡皮魚的數量
目標:利潤最大
方法:利用solver工具,如圖所示(需要列出目標的計算公式,需求量大計算公式),得出結論
註意:上述的約束條件中未考慮橡皮鴨和橡皮魚的市場銷量情況,可以結合往年的歷史銷量數據預測橡皮鴨的銷量,如果增加這個條件,則在solver 的約束條件中增加壹行條件,如橡皮鴨小於50等
案例:新軍隊優化網站的需求:如何從紛繁雜亂的數據中讓信息脫穎而出
知識點1:散點圖——利用散點圖探索原因,分析因果關系
方法:
1.解決雜亂的數據的方法是:進行正確的比較。如本例中將影響目標的因素都進行清晰的對比
2.利用散點圖,表達1個因素與目標之間的關系
3.當影響目標的因素較多時,這個時候可以運用多元散點圖來表達。如下圖:橫軸表示因素影響,縱軸表示單壹元素對頁面間的影響
案例:預測podphone公司新手機的上市時間,為電膚公司的生產計劃做準備
知識點1:相關關系網絡圖:分析多個因子之間及因子與結果之間的關系圖
知識點2:假設檢驗法:核心是證偽(證明假設錯誤),若假設無法直接排除,則可借助診斷性找出否定最小的假設
方法:
1.可以利用外界的文字信息進行歸納整理,分析因子之間,因果之間的關系圖,如下圖。因果關系通常不是線性的,用這種網絡正負關系圖,能幫我們較快的梳理思路,
2.壹般預測某壹個結論,會先預設幾個假設,結合目前掌握的證據,證明假設錯誤,就可以排除錯誤的假設。若假設無法排除,可基於證據的證明強弱對假設進行排序,選擇最可能的假設條件作為預測結論,如下圖所示。當然,若有新的證據進入,再次對假設條件作判斷。
3.假設檢驗的思路:
A:整理證據,分析證據鏈關系
B:假設條件
C:根據證據證偽,排除假設
D:無法直接排除,根據證據對假設的否定順序排列,選擇最可能發生的假設;或者尋找新的證件,做出新的判斷。