概率模型（三）大數定律：偶然中的必然

查理芒格說：“壹個人只要掌握80到90個思維模型，就能夠解決90%的問題。”

這是老錦關於思維模型的第8篇文章（No. 3 概率模型）。

在上壹篇文章《概率模型（二）福利彩票的那些坑，妳也中招了嗎？》末尾，我給大家留壹個思考題。

小明和小東研究了最近100期的雙色球藍球的走勢圖，發現號碼5出現的了20次，號碼1只出現了2次。

小明說：從過去100期的5號球的表現，他判斷接下來5號球出現的概率應該比別的號碼更大。

小東說：從理論上講，每個數字出現的概率都是1/16。號碼1在過去100期出現的頻次更少，因此，接下來號碼1出現的概率將更高。

小明和小東說得都挺有道理的，妳覺得到底誰說得對呢？

妳get到了嗎？

正確的答案是：小明和小東都錯了。

根據上壹篇文章所學的知識，我們知道小明和小東，都犯了同壹個錯誤：把獨立隨機事件錯誤地理解成關聯事件。

16選1的雙色球藍色球的號碼，每壹次搖獎都是獨立的隨機事件。

每壹次搖獎結果每個數字出現的概率總是1/16，不因為前面幾期（無論是5期還是1萬期）的開獎結果而改變。

然而，妳可能不知道，這裏小東還犯了另壹個賭徒繆誤：誤用大數定律。

什麽是誤用大數定律？

別急，這就是我們今天要學習的新知識：

大數定律及大數定律誤用。

1.大數定律是什麽？

大數定律：當隨機事件發生的次數足夠多時，隨機事件發生的頻率趨近於預期的概率。

以拋硬幣為例。

壹枚理想對稱的硬幣，拋擲的結果，正面朝上，記為1；反面朝上，記為0。我們知道，每壹次拋擲，1和0出現的概率均為1/2。

當我們進行n次拋擲實驗後，得到1的次數為n（1），比值P（1）=n（1）/n，叫作1出現的頻率。

1出現的頻率並不壹定等於概率（1/2）。但是，當n逐漸增大時，頻率就會逐漸趨近於1/2。

也就是說，

隨著實驗次數增大，頻率趨近於概率，這就是大數定律。

2.大數定律誤用

那麽，大數定律誤用是什麽呢？

我們就以思考題中的小東為案例進行分析吧！

案例：

小明和小東研究了最近100期的雙色球藍球的走勢圖，發現號碼5出現的了20次，號碼1只出現了2次。

小東說：從理論上講，每個數字出現的概率都是1/16。號碼1在過去100期出現的頻次更少，因此，接下來號碼1出現的概率將更高。

根據大數定律，隨著實驗次數增大，號碼1出現的頻率會最終趨近於它的預期概率1/16。

小東說的不就是這麽回事嗎？

錯！

小東這裏犯的錯誤是：

a.把短期頻率當成長期概率；

頻率V.S.概率

頻率不壹定等於概率。

頻率取決於多次實驗後的結果；而概率是壹個極限值。

案例中，小東錯把最近100-200期號碼的短期頻率當成了長期的概率。

b.把無限的情況當成有限的情況來分析。

大樣本區間V.S.小樣本區間

大數定律能夠適用的是大樣本區間。

問題在於，多少次實驗才算“足夠多”。

答案是：實驗的次數是理論上的無窮大，實際中難以定論。

對於雙色球藍色球而言，100期乃至10000期的走勢圖都只是小樣本區間。

小樣本區間的頻率分布不能等同於大樣本區間的概率分布。

事實上，任何壹段有限次的試驗得到的頻率對於足夠多次試驗的頻率幾乎沒有什麽影響。

大數定律說的是總頻率趨近於概率值，如上圖所示，小樣本區間實驗的結果並不影響最後趨近的概率。

3.總結

a.大數定律：當隨機事件發生的次數足夠多時，發生的頻率趨近於預期的概率。

b.頻率不壹定等於概率。

當實驗次數足夠多時，事件發生的頻率終究會趨向於它的概率。

c.大數定律能夠適用的是大樣本區間。

實驗的次數是理論上的無窮大，實際中難以定論。

d. 看壹百期的彩票走勢圖，其實是對小樣本區間歷史數據的歸納，不適用大數定律，不足以對未來作出正確的判斷。

4.思考題

妳知道墨菲定律嗎？

墨菲定律：凡事有可能會出錯，就壹定會出錯。

換言之，如果暫時沒有出錯，也只是時間的問題。

這個跟大數定律有沒有關系呢？

快來用今天學到的知識來分析壹下吧！