除此之外有沒有更高階的方法?
有 ,數學家通過建立模型來進行情景預測,以此來判斷未來的大概方向。
現在流行大數據,我們生活在大數據時代,通過數據的收集,可以建立數學模型進行判斷,在大量的數據下,會給我們展現壹個靠譜的未來。
大數據跟我們生活中的聯系雖然密切,但是作為普通人的我們,數據收集就已經是個大問題,更加不要說數據收集後的大量運算法則,這些高端的東西我們似乎根本沒辦法用。
確實,在大數據流行的現在,切換成我們百姓生活中,大數據並不實用,可是,如果我們生活中可不乏壹些小數據,我們可以簡單的對這些小數據進行處理然後判斷。
事實上,我們也壹直用著這些方法,憑借自己的直覺,卻不知道背後的科學原理,例如我們在等公交車的時候,判斷下壹班車什麽時候回到?是否值得繼續等下去。
250多年前的貝葉斯也曾有過這樣的疑惑,應該怎麽判斷未來的趨勢?250多年前沒有大數據的支持,貝葉斯又是怎麽解決的?
貝葉斯的問題是這樣的:
如果是100%的概率,那麽三張彩票的中獎概率也是100%。但是如果是50%,那麽三張彩票的中獎概率就變成1/2×1/2×1/2=1/8。如果中獎概率是1%,那麽三張彩票的中獎概率就變成了1/100×1/100×1/100。
貝葉斯認為1/8的概率比100%可能性大,而1/100×1/100×1/100的概率又比1/8可能性大。貝葉斯也以此發表了自己的論文,貝葉斯最重要的貢獻在於對直覺進行量化處理,並對過於的假說進行推論。
貝葉斯其實並沒有解決這個問題,因為如果問貝葉斯究竟概率是多少?他也不知道,他只是說了那種比那種的可能性更大而已。
幾年後,法國數學家拉普拉斯給出了解決方案,答案也相當簡潔,任何在n次嘗試中有w次中獎的情況,那麽未來的情況就是:(w+1)/(n+2)。這就是是著名的拉普拉斯法則。
拉普拉斯也在自己的生活中運用這個法則,例如,未來人們生男孩女孩的概率是多少?通過這個公式我們可以得到壹個男女比例將近1:1的結果。
拉普拉斯開啟我們小數據應對真實世界的大門。
小數據也有小數據的美,未必完美,卻足夠完善的改進我們的生活。過了那麽多年的發展,在小數據的應用上也可以說有了壹定階段性的成果。
這些小數據的要得以展開,就要有壹些先驗的數據來支持,不能什麽都沒有,至少有個猜想,那怕不切實際也好。
這些猜想,這些先前驗證過的數據將會決定我們所使用的方法。三招教妳簡單預測未來,下面就是三種先驗數據的表現以及我們預測的方法:
? 冪次分布中的乘法法則
冪次法則是指事物的發展,規模和次數是成反比的,規模越大,次數越少。例如電影總票房和電影數量的關系,當電影票房少的時候,電影的數量也很少,達到壹個點之後,電影的數量看起來沒有怎麽增加,但是電影票房極劇增加。說明某些電影壹部就占了絕大部分,帶來了可觀的票房。
冪次法則也被稱為2/8法則,生活中最重要的部分是由那20%決定的,投資公司的收益也是主要由他們20%的投資決定帶來的,電影總票房的數量也主要是由20%的電影所貢獻的。
如果我們要預測壹部電影可能帶來的票房,就符合乘法法則,乘法法則中有壹個固定的系數,不同的事情有著不同的系數,假設某部電影的票房系數是1.4,電影已經有600萬的票房目前,我們就可以預測這部電影將有840票房。
事物符合冪次分布的時候,乘法法則就顯得有效。
正態分布中的平均法則
正態分布中,處於兩個極端的人是少數的,絕大部分的人都處於壹個區域中,人類的年齡分布就符合正態分布,我們預測年齡的時候就要用到平均法則,我們知道,年紀極小的人和極長壽的人都屬於少數,我們大部分人會處於壹個區域內。
假設人類的平均年齡是79的話,壹個小孩只有7歲,妳預測他會活到多少歲?按照平均法則,這個孩子就在正態分布的峰值中,我們會猜測大概78歲,相反,如果壹個老人已經90歲了,妳又會預測多少歲?同理按照法則,這個老人可能能活到94歲。
壹個電影剛上映,妳從來沒有看過,妳猜這部電影需要多久來欣賞?按照正態分布的平均法則,壹部電影就在120分鐘左右,除出極少數像泰坦尼克號這樣的好幾個小時的,我們也就可以預算出我們所需要的時間。
? 厄次分布的恒定法則
恒定法則是不會因為其他影響而產生變化,是壹個恒定量。我們最熟悉的莫過於我們在玩遊戲或者沈浸在我們喜歡的事物的時候,我們常會說,在給我五分鐘我就結束,然而事實就是五分鐘之後還有五分鐘,似乎就沒有停下的趨勢。
在賭場中我們也會常遇見這樣壹種情況,那就是再來壹把,我就不玩了,保證離場,結果就是壹把又壹把。總是把自己說的話忘記,這種法則也被稱為遺忘法則。
程咬金三斧定瓦崗,這裏三招教妳預測未來。總結壹下這三大招數:
如果妳在玩老虎機,而老虎機符合冪次分布,妳贏了壹次,妳很有可能壹直贏下去,如果妳輸了,也別指望有贏的機會,妳會壹直輸下去了,這就是乘法法則,不斷的放大這種效應。
老虎機符合正態分布的話,不會壹直贏,也不會壹直輸,會處於這個老虎機的均值,贏輸的次數趨向與平均值。
老虎機符合厄次分布的話,那跟妳玩多少次壹定關系都沒有,妳玩多少次,是輸是贏已經註定了。每臺老虎機的設置都有差別,因此去了解壹臺老虎機的屬於何種分布就顯得尤為重要。
哈佛大學生物教授史蒂夫古爾德發現自己得了癌癥後想知道自己活了多久,同樣給自己作了預測,醫生只是告訴他發現這種癌癥後壹半的病人都在八個月內死亡。
古爾德認為這只是其中壹個數據,他並不知道這種癌癥的生存分布。
如果符合正態分布,那麽他就大概八個月。如果符合冪次分布,那就完全不壹樣了,他堅持得越久,他就活得越久。即便是正態分布,古爾德相信他也是屬於極端的人,能活得更久,結果是古爾德在癌癥發現後又活了二十年。哈佛的教授也用小數據進行判斷,大數據並不是不好,只是我們有時候難以獲得我們想要的大數據情況下,小數據就能助我們壹臂之力。
深入壹點,這背後的原理其實都是用數據建模,區別是數據的量。
事物符合某種分布是肯定的情況下,數據再多,我們得到的函數都是固定的,正如上圖所示,我們通過少數數據能得出壹個函數,也能通過成千上萬的點來得到壹個函數,但是我們可以用最少的數據得到原本應該的函數。
小數據的優點在於快速做出決策,缺點就是不壹定完全的準確,可能會產生大的偏差,大數據的優點在於我們更容易得出壹個準確的結果,缺失就是耗費大量的時間去分析數據上。
每個行業的成功人士都具備在短時間做出決策,並且決策的成功率還高,為什麽會這樣?今年4月份的哈佛商業評論網中對此進行了分析,認為生活中諸多的復雜事物,快速做出判斷的方法是制定簡單的規則。正如三招教妳簡單預測未來的方法中,三招是簡化的規則,讓妳對大的方向上判斷不會出錯。
簡單不代表容易,三招簡單的預測後面是大量的數據和先人們的努力探究。小數據的思想在大數據的潮流下顯得那麽另類,卻那麽耀眼!
參考資料
plex-decisions
https://hbr.org/2017/05/linear-thinking-in-a-nonlinear-world dy>