大數(shù)據(jù)讀書心得800字
《大數(shù)據(jù)》不是一本純技術(shù)的書籍,作者用美國多年來豐富而詳細的案例說明了大數(shù)據(jù)的趨勢和發(fā)展歷程,大數(shù)據(jù)的初衷就是將一個公開、高效的政府呈現(xiàn)在人民眼前。讀了《大數(shù)據(jù)》這本書,談?wù)剛€人的心得體會。下文是大數(shù)據(jù)讀書心得體會,歡迎閱讀。
大數(shù)據(jù)讀書心得篇一
利用周末,一口氣讀完了涂子沛的大作《大數(shù)據(jù)》。這本書很好看,行文如流水,引人入勝。書中,你讀到的不是大數(shù)據(jù)技術(shù),更多是與大數(shù)據(jù)相關(guān)的美國政治、經(jīng)濟、社會和文化的演進。作為一名信息化從業(yè)者,讀完全書,我深刻感受到了在信息化方面中國與美國的各自特色,也看到了我們與美國的差距。有幾個方面的體會,但窺一斑基本能見全貌。
一是政府業(yè)務(wù)數(shù)據(jù)庫公開的廣度和深度。近年來,隨著我國信息公開工作的推進,各級政府都在通過政府門戶網(wǎng)站建設(shè)積極推進網(wǎng)上政務(wù)信息公開,但我們的信息公開,現(xiàn)階段還主要是政府的政策、法律法規(guī)、標(biāo)準(zhǔn)、公文通告、工作職責(zé)、辦事指南、工作動態(tài)、人事任免等行政事務(wù)性信息的公開。當(dāng)然,實時的政府業(yè)務(wù)數(shù)據(jù)庫公開也已經(jīng)取得很大進步。在中國政府門戶網(wǎng),可以查詢一些公益數(shù)據(jù)庫,如國家統(tǒng)計局的經(jīng)濟統(tǒng)計數(shù)據(jù)、環(huán)保部數(shù)據(jù)中心提供的全國空氣、水文等數(shù)據(jù),氣象總局提供的全國氣象數(shù)據(jù),民航總局提供的全國航班信息等;訪問各個部委的網(wǎng)站,也能查到很多業(yè)務(wù)數(shù)據(jù),如發(fā)改委的項目立項庫、工商局的企業(yè)信用庫、國土資源部的土地證庫、國家安監(jiān)總局的煤礦安全預(yù)警信息庫、各類工程招標(biāo)信息庫等等。這是一個非常大的進步,也是這么多年電子政務(wù)建設(shè)所取得的成效和價值!但是,政務(wù)業(yè)務(wù)數(shù)據(jù)庫中的很多數(shù)據(jù)目前還沒有實現(xiàn)公開,很多數(shù)據(jù)因為部門利益和“保密”等因素,還僅限于部門內(nèi)部人員使用,沒有公開給公眾;已經(jīng)公開的數(shù)據(jù)也僅限于一部分基本信息和統(tǒng)計信息,更多數(shù)據(jù)還沒有被公開。從《大數(shù)據(jù)》一書中記錄的美國數(shù)據(jù)公開的實踐來看,美國在數(shù)據(jù)公開的廣度和深度都比較大。
美國人認為“用納稅人的錢收集的數(shù)據(jù)應(yīng)該免費提供給納稅人使用”,盡管美國政府事實上對數(shù)據(jù)的公開也有抵觸,但民愿不可違,美國政府的業(yè)務(wù)數(shù)據(jù)越來越公開,尤其是在奧巴馬政府簽署《透明和開放的政府》文件后,開放力度更加大。DATA.GOV是美國聯(lián)盟政府新建設(shè)的統(tǒng)一的數(shù)據(jù)開放門戶網(wǎng)站,網(wǎng)站按照原始數(shù)據(jù)、地理數(shù)據(jù)和數(shù)據(jù)應(yīng)用工具來組織開放的各類數(shù)據(jù),累積開放378529個原始和地理數(shù)據(jù)集。在中國尚沒有這樣的數(shù)據(jù)開放的網(wǎng)站。另外,由于制度的不同,美國業(yè)務(wù)信息公開的深度也很大,例如,網(wǎng)上公布的美國總統(tǒng)“白宮訪客記錄”公布的甚至是造訪白宮的各類人員的相關(guān)信息;美國的網(wǎng)站,能夠逐條跟蹤、記錄、分析聯(lián)邦政府每一筆財政支出。這在中國,目前應(yīng)該還沒有實現(xiàn)。
二是對政府對業(yè)務(wù)數(shù)據(jù)的分析。目前,中國各級政府網(wǎng)站所提供的業(yè)務(wù)數(shù)據(jù)基本上還是數(shù)據(jù)表,部分網(wǎng)站能提供一些統(tǒng)計圖,但很少能實現(xiàn)數(shù)據(jù)的跨部門聯(lián)機分析、數(shù)據(jù)關(guān)聯(lián)分析。這主要是由于以往中國政務(wù)信息化的建設(shè)還處于部門建設(shè)階段。美國在這方面的步伐要快一些,美國的DATA.GOV網(wǎng)站,不僅提供原始數(shù)據(jù)和地理數(shù)據(jù),還提供很多數(shù)據(jù)工具,這些工具很多都是公眾、公益組織和一些商業(yè)機構(gòu)提供的,這些應(yīng)用為數(shù)據(jù)處理、聯(lián)機分析、基于社交網(wǎng)絡(luò)的關(guān)聯(lián)分析等方面提供手段。如DATA.GOV上提供的白宮訪客搜索工具,可以搜尋到訪客信息,并將白宮訪客與其他微博、社交網(wǎng)站等進行關(guān)聯(lián),提高訪客的透明度。
三是關(guān)于個人數(shù)據(jù)的隱私。在美國,公民的隱私和自有不可侵犯,美國沒有個人身份證,也不能建立基于個人身份證號碼的個人信息的關(guān)聯(lián),建立“中央數(shù)據(jù)銀行”的提案也一再被否決。這一點,在中國不是問題,每個公民有唯一的身份信息,通過身份證信息,可以獲取公民的基本信息。今后,隨著國家人口基礎(chǔ)數(shù)據(jù)庫等基礎(chǔ)資源庫的建設(shè),公民的社保、醫(yī)療等其他相關(guān)信息也能方便獲取,當(dāng)然信息還是限于政府部門使用,但很難完全保證整合起來的這些個人信息不被泄露或者利用。
數(shù)據(jù)是信息化建設(shè)的基礎(chǔ),兩個大國在大數(shù)據(jù)領(lǐng)域的互相學(xué)習(xí)和借鑒,取長補短,將推進世界進入信息時代。我欣喜地看到,美國政府20XX年啟動了“大數(shù)據(jù)研發(fā)計劃”,投資2億美元,推動大數(shù)據(jù)提取、存儲、分析、共享、可視化等領(lǐng)域的研究,并將其與超級計算和互聯(lián)網(wǎng)投資相提并論。同年,中國政府20XX年也批復(fù)了“十二五國家政務(wù)信息化建設(shè)工程規(guī)劃”,總投資額估計在幾百億,專門有人口、法人、空間、宏觀經(jīng)濟和文化等五大資源庫的五大建設(shè)工程。開放、共享和智能的大數(shù)據(jù)的時代已經(jīng)來臨!
大數(shù)據(jù)讀書心得篇二
《大數(shù)據(jù)》不是一本純技術(shù)的書籍,作者用美國多年來豐富而詳細的案例說明了大數(shù)據(jù)的趨勢和發(fā)展歷程,大數(shù)據(jù)的初衷就是將一個公開、高效的政府呈現(xiàn)在人民眼前。書中從美國《信息自由法》說起,其發(fā)展歷程充滿了坎坷,經(jīng)過各個時期信息自由倡議者的努力,終于出現(xiàn)端倪,并迅速成長,充分體現(xiàn)出美國政府的信息必須被公開,以及個人的隱私必須被保護。人類可以“分析和使用”的數(shù)據(jù)在大量增加,通過這些數(shù)據(jù)的交換、整合和分析,人類可以發(fā)現(xiàn)新的知識,創(chuàng)造新的價值,帶來“大知識”、“大科技”、“大利潤”和“大發(fā)展”。
《大數(shù)據(jù)》開篇講述美國《信息自由法》歷經(jīng)多任總統(tǒng),其中有支持者,也有反對者,最后終于簽發(fā),標(biāo)志都美國進入信息公開及隱私保護的大數(shù)據(jù)時代?,F(xiàn)如今全世界現(xiàn)有60多個國家制定、實施《信息自由法》。
隨著《信息自由法》的頒布,以及現(xiàn)代科技的發(fā)展,會產(chǎn)生越來越多的數(shù)據(jù)。數(shù)據(jù)主要來源是:1.各行各業(yè)通過計算機產(chǎn)生了大量的數(shù)據(jù);2. 業(yè)務(wù)數(shù)據(jù)3. 民意數(shù)據(jù)4. 環(huán)境數(shù)據(jù)。并且數(shù)據(jù)在數(shù)量、速度、多樣性三個維度迅速增長,促使數(shù)據(jù)帝國逐漸興起。
有了這么多數(shù)據(jù),應(yīng)該如何利用?
首先,在治國方面。1.循“數(shù)”管理,減少交通事故死亡人數(shù)。2.用數(shù)據(jù)進行醫(yī)療福利打假,可為政府節(jié)省開支。3.警方通過CompStat系統(tǒng),分析犯罪數(shù)據(jù),預(yù)知犯罪地點。
其次,商務(wù)智能方面。1.數(shù)據(jù)倉庫,2.聯(lián)機分析(OLAP),3. 數(shù)據(jù)挖掘,4. 數(shù)據(jù)可視化。
當(dāng)然隨著數(shù)據(jù)的增多,如何收集和使用這些數(shù)據(jù),就需要制訂一系列的法則。1.收集法則:減負;2.使用法則:隱私;3.發(fā)布法則:免費,4.管理法則:質(zhì)量。其中數(shù)據(jù)質(zhì)量最為重要,為了保證數(shù)據(jù)質(zhì)量頒布了《數(shù)據(jù)質(zhì)量法》,同時也帶來了困惑,即給商業(yè)組織帶來了質(zhì)疑政府公布數(shù)據(jù)質(zhì)量的手段,對于這一手段,滿足其商業(yè)利益,是民主與商業(yè)組織之間的對抗和沖突。
同時,統(tǒng)一分析和使用大數(shù)據(jù)與個人隱私產(chǎn)生的沖突。通過中央數(shù)據(jù)銀行和全國統(tǒng)一ID就獲得某個人一生的行動,違反了個人隱私法,
奧巴馬的上任加速了政府?dāng)?shù)據(jù)開放的進程,奧巴馬上任后立即任命首席信息官,由首席信息官在4個月內(nèi)推出政府大數(shù)據(jù)網(wǎng)站data.gov,在互聯(lián)網(wǎng)上為民眾提供開放的政府?dāng)?shù)據(jù)。陽光基金會和個人利用開放數(shù)據(jù)開發(fā)出各種分析工具,充分體現(xiàn)出數(shù)據(jù)價值。
但公益組織并不滿足開放數(shù)據(jù)的數(shù)量,為了讓民眾監(jiān)督一個更為公正透明的政府,公益組織要求公開白宮訪客記錄,但這并不是一個簡單的要求。經(jīng)過公益組織不懈的努力,白宮終于公開了訪客記錄,但公益組織發(fā)現(xiàn)了更多的問題,白宮也提出將繼續(xù)修改訪客記錄的方式。
大數(shù)據(jù)有效的監(jiān)督了政府的公正與民主。民主不是一個結(jié)果,而是參與的過程,人民要不斷的爭取才能實現(xiàn)民主。
本書結(jié)尾也較詳細的描述除美國外,其它各國通過大數(shù)據(jù)走向民主的進程,充分說明了這一進程是一個大趨勢。首先,英國緊隨美國后面實施數(shù)據(jù)開放,雖然晚于美國,但發(fā)展飛快,開放的數(shù)據(jù)量已超過美國。其次,即美、英兩國開放數(shù)據(jù)之后,更多的國家也加入到其中。2011年9月20日,8個國家宣布成立“開放政府聯(lián)盟”,要想加入需具備4個條件:1.財政透明,2.信息自由,3.財產(chǎn)公開,4.公民參與。截止2012年4月25日已有50個國家加入。
在大數(shù)據(jù)時代,數(shù)據(jù)就是直接的財富,數(shù)據(jù)分析和挖掘能力就是國家、企業(yè)的核心競爭力。中國應(yīng)該摘下千百年來差不多先生的標(biāo)簽,盡快趕上西方國家大數(shù)據(jù)的步伐。
大數(shù)據(jù)讀書心得篇三
有人說生活像一團亂麻,剪不斷理還亂;我說生活像一團亂碼,盡管云山霧罩惝恍迷離,最后卻總會撥云見日雨過天晴。維克托邁爾舍恩伯格就把這團亂碼叫做大數(shù)據(jù),在他的這本書里,試圖給出的就是撥開云霧見青天的玄機。
這玄機說來也簡單,就是放棄千百年來人們孜孜追求的因果關(guān)系轉(zhuǎn)而投奔相關(guān)關(guān)系。說來簡單,其實卻顛覆了多少代人對真理探求的夢想。我覺得作者是個典型的實用主義者,在美帝國主義萬惡的壓迫和洗腦下,始終追逐性價比和利益最大化,居然放棄了追求共產(chǎn)主義真理最基本的要求!不像我們在天朝光芒的籠罩下,從小就開始學(xué)習(xí)和追求純粹的共產(chǎn)主義唯心科學(xué)歷史文化知識啦!這或許就是我們永遠無法獲得諾貝爾獎、永遠無法站在科技最前沿的根本原因吧。其實小學(xué)時候,我就想過這個問題,相信所有的人都問過類似的問題,例如現(xiàn)在仍然很多人在問,媽的從來沒人知道我每天擺攤賺多少錢,你們他媽的那人均收入四五千是怎么算出來的。中國是抽樣的代表,因為中國人最喜歡用代表來表現(xiàn)整體,最典型的例子莫過于公布的幸福指數(shù)滿意指數(shù)各種指數(shù)永遠都高于你的預(yù)期,你完全不清楚他是怎么來的,一直到最后匯總成三個代表,真心不清楚它到底能代表了啥。說這么多顯得自己是個憤青,其實只是想表達“樣本=總體”這個概念在科技飛速發(fā)展的今天,在世界的不同角落,還是會體現(xiàn)出不同的價值,受到不同程度的對待及關(guān)注。在大數(shù)據(jù)觀念的沖擊下,我們是不是真的需要將平時關(guān)注的重點從事物內(nèi)在的發(fā)展規(guī)律轉(zhuǎn)移到事物客觀的發(fā)生情況上。
大數(shù)據(jù)的出現(xiàn),必然對諸多領(lǐng)域產(chǎn)生極大的沖擊,某些行業(yè)在未來十年必將會得到突飛猛進的發(fā)展,而其他一些行業(yè)則可能會消失。典型的三十年河?xùn)|三十年河西的道理,就像三十年前的數(shù)理化王子們,現(xiàn)在可能蜷縮在某工廠的小角落里顫顫巍巍的修理機器;就像三十年前職業(yè)高中的學(xué)生才學(xué)財會學(xué)銀行,如今這幫孫子一個個都開大奔養(yǎng)小三攢的樓房夠給自己做墓群的了;當(dāng)然也不乏像生物這種專業(yè),三十年前人們不知道是干啥的,三十年后人們都知道沒事別去干,唯一可惜的是我在這三十年之間的歷史長河中卻恰恰選了這么一個專業(yè),這也是為什么我現(xiàn)在在這寫讀后感而沒有跟姑娘去玩耍的原因。其實乍一看這個題目,我首先想到的是精益生產(chǎn)的過程控制,比如六西格瑪,這其實就是通過對所有數(shù)據(jù)的分析來預(yù)測產(chǎn)品品質(zhì)的變化,就已經(jīng)是大數(shù)據(jù)的具體應(yīng)用了。
而任何事物都會有偏差,會有錯誤,也就是說,這全部的數(shù)據(jù)中,肯定是要出現(xiàn)很多與總體反應(yīng)出的規(guī)律相違背的個體,但是無論如何這也是該事件中一般規(guī)律的客觀體現(xiàn)的一種形式,要遠遠好過從選定的樣本中剔除異常值然后得到的結(jié)論。換句話說,也大大減少了排除異己對表達事物客觀規(guī)律的影響。就好比是統(tǒng)計局統(tǒng)計中國人民的平均收入一樣,這些數(shù)怎么這么低啊,這不是給我們國家在國際社會上的形象抹黑么,刪掉刪掉;這些數(shù)怎么這么高啊,這還不引起社會不滿國家動蕩啊,刪掉刪掉。所以說,大數(shù)據(jù)至少對反應(yīng)客觀事實和對客觀事實做預(yù)測這兩個方面是有非常積極地意義的。而這個新興行業(yè)所體現(xiàn)的商機,既在如何利用數(shù)據(jù)上,又在如何取得數(shù)據(jù)上。
先說數(shù)據(jù)的利用,這里面表達的就是作者在通書中強調(diào)的對“相關(guān)關(guān)系”的挖掘利用。相關(guān)關(guān)系與因果關(guān)系便不再贅述,而能夠?qū)ο嚓P(guān)關(guān)系進行挖掘利用的企業(yè)其實缺不多,因為可以相信未來的大數(shù)據(jù)庫就像現(xiàn)在的自然資源一樣,必將因為對利益的追逐成為稀缺資源,而最終落在個別人或企業(yè)或部門的手中。想想無論當(dāng)你想要做什么事情的時候,都有人已經(jīng)提前知道并且為你做好了計劃,還真是一件甜蜜而又令人不寒而栗的事情。
而對于數(shù)據(jù)的獲取,我覺得必然是未來中小型企業(yè)甚至個人發(fā)揮極致的創(chuàng)造力的領(lǐng)域。如何在盡可能降低成本的情況下采集到越多越準(zhǔn)確的數(shù)據(jù)是必然的發(fā)展趨勢,鑒于這三個維度事實上都無法做到極致,那么對于數(shù)據(jù)獲取方式的爭奪肯定將成就更多的英雄人物。
現(xiàn)在回頭從說說作者書中的觀點中想到的,P87中關(guān)于巴斯德的疫苗的事件,描述了一個被瘋狗咬傷的小孩,在接種了巴斯德的狂犬疫苗后成功幸存,巴斯德成了英雄的故事。這是個非常有意思的案例,因為小孩被狗咬傷而患病的概率僅為七分之一,也就是說,本事件有85%的概率是小孩根本就不會患病。那么小孩的生命到底是不是巴斯德救的,而這疫苗到底是有效沒效,通過這個事件似乎根本就沒有辦法得到驗證。這就好比某人推出個四萬億計劃,但實際上國際經(jīng)濟形勢就是好轉(zhuǎn),哪怕你只推出個二百五計劃,GDP都會蹭蹭的往上漲,而且又不會帶來四萬億導(dǎo)致的嚴重通脹、產(chǎn)能過剩、房價泡沫等問題。那你說這四萬億到底是救了國還是誤了國?回到我自己的工作領(lǐng)域上來,安全工作,我們一直遵循的方向都是尋找因果關(guān)系,典型的從工作前的風(fēng)險評估,到調(diào)查事故的Taproot或者五個為什么,無一不是邏輯推理得到結(jié)果的產(chǎn)物。而事實上,如果能做到信息的豐富采集和匯總的話,找出事物之間的相關(guān)性,對提高工作環(huán)境的安全系數(shù)是極為有利的。這個點留著,看看可不可以在未來繼續(xù)做進一步研究。
猜你感興趣:
5.正能量讀書心得