當前位置:商標查詢大全網 - 教育培訓 - 閱讀《大數據時代》的體會

閱讀《大數據時代》的體會

閱讀《大數據時代》的體會(1)

看了《大數據時代》,感覺壹個大變革的時代正在到來。雖然不太清楚應該徹底改變什麽思維和操作方式,但很明顯作者想。結束?或者顛覆壹些傳統上被認為是我們思考和存在基礎的理論、方法和途徑。面對這樣的想法,我的心靈受到了強烈的震撼,不禁瑟瑟發抖。

?在小數據時代,我們會假設世界是如何運轉的,然後通過收集和分析數據來驗證這個假設。隨著想象時代向數據時代的過渡,我們可能也認為我們不再需要理論了。?該書幾乎肯定會顛覆統計學的理論和方法,還試圖引用《連線》雜誌主編安德森?量子物理的理論已經脫離實際了?來嗎?結束?量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時不及格的科目。但是這兩個理論太大,太權威,太基礎。我覺得我不可能靠壹本書就能擺脫這兩件讓我壹輩子頭疼的事。事實上,作者不敢提出壹個明確的論點來顛覆他們。畢竟是他加到前面的。大概覺得?這樣的傘。

近幾十年來,我們總是會遇到各種各樣的新想法。面對新思維,我們首先要做的就是破立,改變傳統,與時俱進。就算大腦跟不上,嘴巴也要跟上,否則可能會被貼上刻板的標簽,甚至阻礙世界的發展。既然大數據是?未來不可避免的變化?那我必須?不受傳統思維模式和特定領域隱含的固有偏見的限制?讓我們和作者壹起否定統計學和量子力學。反正我不喜歡他們,也學不會。

當我們人類的數據收集和處理能力達到Pb甚至更大的時候,我們可以把樣本變成全部,在我們有能力正視雜合性而忽略準確性之後,似乎就真的可以拋棄基於抽樣調查的統計了。而是通過統計學和量子力學以及其他許多方法?我們可能認為不再需要的東西。理論上,它們幾乎都是基於相同的基本邏輯。如果不小心把邏輯或者邏輯思維或者邏輯推理壹起給了?不再需要?如果是這樣,我就擔心了!

大數據時代,16頁?大數據的核心是預測?。邏輯描述時空信息嗎?班級?用什麽?班級?長期有效且不可更改的順序變化關系規則。他們似乎在做同樣的事情。但是大數據想要?不是因果關系,而是相關性?,?知道是什麽就夠了,不需要知道為什麽。以及邏輯四大基本定律(同壹律、矛盾律、排中律、充足理由律)中的充足理由律?定義明確?任何事物都有存在的理由。而邏輯推理的三個部分——歸納邏輯、回溯邏輯、演繹邏輯——都是以因果關系為基礎的。這兩者似乎又是對立的。兩種方法在同壹件事情上對立的結果應該只有壹個,就是否定其中壹種。這正是我擔心的。

但我不能觀望,等待哪壹個像旁觀者?脫穎而出?因為我在裏面。問題不解決,我就無法思考和工作,自然也無法生活!更何況還有兩件更可怕的事。

第壹,量子力學搞了壹百多年了。為了處理雜交的問題,質量和速度已經和能量結合在壹起。為了調和量子力學和相對論之間的矛盾,發展了量子場論,進而創造了蟲洞和羅森橋。終於四維時空被彎成了允許時間旅行的方式,我迫不及待的想馬上造出那個可怕的時間旅行機器。阻止這些的唯壹方法是什麽?愛因斯坦?孩子?鬼混?這是因果關系,因為父親是父親,兒子是兒子。那麽大數據會不會通過正視雜合,放棄因果律,制造出壹個時光機,讓爸爸不再是爸爸,兒子不再是兒子?第二,人和機器的根本區別在於,人有邏輯思維,機器沒有。“大數據時代”也堪憂?做出最後決定的將是機器,而不是人?。如果那天真的是因為放棄邏輯思維,科幻電影裏描述的機器統治世界,毀滅人類,那我還不如現在就跳樓。

好在我知道自己對統計學,量子力學,邏輯學,大數據都是外行。或許以上文章全是廢話,所謂的擔心根本不存在。但是問題出現了,還是解決比較好,不然睡不著。如果自己解決不了,只能靠專家指點迷津。

所以我想給《大數據時代》的作者壹個合理的建議:繼續寫這本書,至少在《大數據時代》第四部分增加壹個邏輯思維。

閱讀《大數據時代》的體會(二)

隨著信息時代的到來,我們感受到技術的變革日新月異,隨之而來的是生活方式的改變。我們所評論的信息時代已經成為過去。如今,大數據時代已經成為壹個熱門話題。筆者在這裏解釋信息和數據,只是想先解釋壹下信息和數據的聯系和區別,也想解釋壹下為什麽信息時代變成了大數據時代。大數據時代給我們帶來了什麽?

信息和數據的定義。維基百科解釋說,信息,又稱信息,是壹個高度概括的抽象概念,是壹個發展的動態範疇,是彼此要交換的內容和名稱。信息沒有統壹的定義,但信息具有客觀性、動態性、傳遞性、享受性、經濟性等特征是大家都知道的。數據:或數據,是指描述事物的符號記錄,可以定義為有意義的實體,它涉及到事物的存在形式。它是對壹組事件的離散的、客觀的描述,是構成信息和知識的原始材料。數據可以分為模擬數據和數字數據。數據是指計算機處理?原材料?,如圖形、聲音、文字、數字、字符和符號。顧名思義,數據是原始的處女地,需要開墾。信息是經過處理並可以傳播的信息。信息時代依賴於數據的爆發,但當數據爆發到不可控的狀態時,大數據時代就應運而生了。這是《大數據時代》這本書沒有闡述的背景材料嗎?

在《大數據時代》壹書中,大數據時代和小數據時代的區別:1,思維約定。大數據時代的區別和轉變是放棄對因果性的渴望,轉而關註相關性。所以只要妳知道?這是什麽?在不知情的情況下?為什麽?。作者的語言是絕對的,但他反思了其本質區別。雜七雜八的數據越來越多,導致應用思路只能盡可能的去觀察,而不是用它所有的資源去推理?這也是明智之舉。2.使用。小數據停留在解釋過去,大數據用過去預測未來。筆者認為數據的目的與數據本身無關,而與數據的解讀者有關,相關性更有利於預測未來。3.結構。大數據更多體現在海量非結構化數據本身的整合和處理方式上。大數據更像是理論和現實齊頭並進,理論創造方法處理非結構化數據,結果用未來驗證。4.分析基礎。大數據是互聯網背景下從量變到質變的過程。筆者認為,小數據時代,也就是信息時代,是大數據時代的前提。大數據時代是升華和進化,本質是互補的,而不是互斥的。

數據未來的故事。數據的發展給我們帶來了哪些期待和啟示?銀行業天然具有大數據的潛力。客戶數據、交易數據、管理數據等海量數據不斷增長,海量的機遇和挑戰隨之而來,適應變化,優勝劣汰。我們能有更廣闊的業務發展空間,更準確的決策能力,更好的管理能力,這壹切都是建立在數據收集、整理、控制和分析的能力,以及創新思維和執行力的基礎上的。那麽,建築?數據倉庫?,培養?數據思維?,發展?數據治理?,創建?數據融合?,實現?數據應用?擁抱嗎?大數據?時代,從數據中抓取價值,笑對變化,穩贏未來。

閱讀《大數據時代》的體會(三)

本書主要介紹大數據在現代商業運營中的應用,以及對現代商業運營的影響。

《大數據時代》這本書的結構框架遵循了學術書籍的壹般方式。也就是從現象出發,然後通過解剖現象來解釋這個現象。然後我通過解釋預測未來,對未來可能出現的問題提出自己的看法和對策。

下面我們重點介紹壹下《大數據時代》這本書的主要內容。

大數據時代之初,谷歌通過人們在搜索引擎上搜索關鍵詞留下的數據,成功預測了20XX年H1N1在美國的爆發和傳播方向,以及可能的潛在患者。谷歌的預測會比政府提前近壹個月,相比之下,政府只能在流感爆發後壹兩周才能得到相關數據。同時,谷歌的預測與政府數據的相關性高達97%,也就是說谷歌預測數據的置信區間為3%,遠小於傳統統計學中5%的常規置信區間!而這個數字就是大數據時代預測結果相對準確性和事件可預見性的最好證明!通過這樣和那樣的案例,維克多提出,在大數據時代?樣本=人口?的想法。我們都知道,當樣本無限逼近總體時,計算得到的描述性數據會無限逼近事件本身的性質。之前拍的是什麽?樣品

接下來,Victor通過了IBM追求高精度計算機翻譯計劃的失敗和Google只掃描存儲了詞庫中出現的所有對應的文本句子,所以不管什麽需要翻譯,只要和Google詞庫有聯系,就會有翻譯。雖然有時候翻譯沒有意義,但是大部分時候還是正確的,所以谷歌計算機翻譯計劃的成功,說明大數據時代對準確性的追求並不是特別明顯,而恰恰相反,大數據時代是以大數據為基礎的,所以大數據時代追求的是全方位覆蓋的數字化測量,不管多精確,因為大量的數據會掩埋少數有問題的數據的影響。同時,大量的數據會無限逼近事物的本來面目。

後來,維克多預言大數據時代誕生了壹個重要的專業數據科學家,這個科學家是數學家、統計學家和程序員的結合體。這群人將可以從獲得的數據中得到他們想要的任何結果。換句話說,只要有足夠的數據,我們所有不想讓別人知道的外在和內在的東西,都會展現在這群家夥面前。因此,為了防止個人隱私在大數據時代被這群人利用,維克多建議將這群人分成兩部分,壹部分是利用數據為商業部門服務,另壹部分負責審查這些人是否合法獲取和應用數據,侵犯個人隱私。

無論如何,大數據時代終將到來,無論我們接受與否!

我覺得《大數據時代》這本書寫得很好,值得壹讀。因為它會給我們很多啟發,比如妳在相關社交網站上的評論或照片很可能是?數據科學家?用戶使用,然後把相關數據賣給各大網店。然而,事實是,我們會被預言誘惑。所以,小心妳留在網上的東西。

我喜歡這本書,因為它向我展示了壹個新世界。

閱讀《大數據時代》的體會(四)

我利用周末壹口氣看完了塗子沛的代表作《大數據》。這本書很好看,文筆流暢,引人入勝。在書中,妳讀到的不是大數據技術,更多的是與大數據相關的美國政治、經濟、社會、文化的演變。作為壹名信息從業者,讀完壹整本書,我深刻感受到了中美兩國在信息技術方面各自的特點,也看到了我們與美國的差距。經驗有好幾個方面,但是壹瞥基本可以看出全貌。

第壹,政府業務數據庫公開的廣度和深度。近年來,隨著我國信息公開的推進,各級政府都在通過政府門戶網站建設積極推進網上政府信息公開。而我們現階段的信息公開主要是政府政策、法律、法規、標準、公文、崗位職責、辦事指南、工作動態、人事任免等行政事務的公開。當然,政府業務數據庫的實時公開也有了很大的進步。在中國政府門戶,可以查詢壹些公益性的數據庫,比如國家統計局的經濟統計,環保部數據中心提供的全國空氣和水文數據,氣象總局提供的全國氣象數據,民航局提供的全國航班信息等。登陸各部委網站,也能查到很多業務數據,比如發改委的項目審批數據庫,工商局的企業信用數據庫,國土資源部的土地證數據庫,安監總局的煤礦安全預警信息庫,各種項目的招投標信息庫。這是壹個很大的進步,也是這麽多年電子政務建設的成果和價值!但是政府業務數據庫中的很多數據目前還沒有公開,很多數據是因為部門利益和?秘密?等因素,也僅限於內部人員使用,不對外公開;公布的數據僅限於壹些基本信息和統計信息,更多的數據沒有公布。從《大數據》記載的美國數據公開的實踐來看,美國數據公開的廣度和深度都比較大。美國人認為?用納稅人的錢收集的數據應該免費提供給納稅人?雖然美國政府實際上是反對數據公開的,但是人民的意願是不能違背的。美國政府的商業數據越來越公開,尤其是奧巴馬政府簽署了“透明開放政府”的文件之後。DATA.GOV是美國聯盟政府新建的統壹數據開放門戶。網站按照原始數據、地理數據和數據應用工具組織各類開放數據,積累了378529個原始和地理數據集。國內沒有這種數據公開的網站。另外,由於制度不同,美國的商業信息公開也很深入,比如美國總統在網上公開?白宮訪客記錄?公布了各種各樣的人甚至參觀白宮的信息;美國的FedSpending網站可以對聯邦政府的每壹筆財政支出逐壹進行跟蹤、記錄和分析。這在中國目前應該是實現不了的。

二是對政府業務數據的分析。目前,我國各級政府網站提供的業務數據基本都是數據表,有的網站可以提供壹些統計圖表,但很少能實現跨部門的在線分析和數據關聯分析。這主要是由於我國的政府信息化建設還處於部門建設階段。美國在這方面的步伐更快。美國DATA.GOV網站不僅提供原始數據和地理數據,還提供許多數據工具,其中許多是由公眾、非營利組織和壹些商業機構提供的。這些應用提供了數據處理、在線分析、基於社交網絡的關聯分析等手段。例如,DATA.GOV上提供的白宮訪客搜索工具可以搜索訪客的信息,並將白宮訪客與其他微博和社交網站相關聯,以提高訪客的透明度。

第三是關於個人資料的隱私。在美國,公民的隱私和所有權是不可侵犯的。美國沒有個人身份證,無法建立基於個人身份證號碼的個人信息關聯。中央數據庫?該提議也多次遭到拒絕。這在中國不是問題。每個公民都有唯壹的身份信息,公民的基本信息都可以通過身份證信息獲取。未來,隨著國家人口數據庫等基礎資源庫的建設,公民的社保、醫療等相關信息也可以輕松獲取。當然,信息仍然局限於政府部門,但很難完全保證這些整合的個人信息不會被泄露或利用。

數據是信息化建設的基礎。在大數據領域互相學習,互相借鑒,將推動世界進入信息時代。我很高興看到美國政府從20XX年開始?大數據研發計劃?,投入2億美元推動大數據提取、存儲、分析、共享、可視化等領域的研究,與超級計算、互聯網投資相提並論。同年,中國市政府也於20XX年批準?“十二五”全國政府信息化建設項目規劃?總投資預計數百億,有人口、法人、空間、宏觀經濟、文化五大資源庫五大建設項目。開放、可訪問、智能的大數據時代已經到來!

我慎重推薦。