萬方數(shù)據(jù)庫學(xué)術(shù)論文(2)
萬方數(shù)據(jù)庫學(xué)術(shù)論文
萬方數(shù)據(jù)庫學(xué)術(shù)論文篇二
淺談數(shù)據(jù)倉庫技術(shù)
摘要:數(shù)據(jù)倉庫的英文名稱為DataWarehouse,簡寫DW。從數(shù)據(jù)倉庫的概念上我們可以從兩個方面理解,一方面,數(shù)據(jù)倉庫是用來支持決策的,主要面向分析型數(shù)據(jù)處理,這一點(diǎn)有別于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫。
關(guān)鍵詞:數(shù)據(jù)庫,數(shù)據(jù)倉庫,數(shù)據(jù)處理
1.數(shù)據(jù)倉庫的定義
數(shù)據(jù)倉庫的英文名稱為Data Warehouse,簡寫DW。W.H.Inmon。我們把它的定義為:數(shù)據(jù)倉庫是一個數(shù)據(jù) 集合,它的特點(diǎn)是:用于支持管理決策時(shí)它是面向主題的,集成的,相對穩(wěn)定的,能夠反映歷史變化的。從數(shù)據(jù)倉庫的概念上我們可以從兩個方面理解,一方面,數(shù)據(jù)倉庫是用來支持決策的,主要面向分析 型數(shù)據(jù)處理,這一點(diǎn)有別于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;另一方面,數(shù)據(jù)倉庫對多個異構(gòu)的數(shù)據(jù)源進(jìn)行有效集成,在集成后又按照主題重新進(jìn)行了組合,并且包含歷史數(shù)據(jù),盡管如此,卻一般不再修改其存放在數(shù)據(jù)倉庫里的數(shù)據(jù)。
2.數(shù)據(jù)倉庫的特點(diǎn)
(1)面向主題。操作型數(shù)據(jù)庫的數(shù)據(jù)組織面向事務(wù)處理任務(wù),各個業(yè)務(wù)系統(tǒng)
之間各自分離,而數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進(jìn)行組織,一個主題通常與多個操作型信息系統(tǒng)相關(guān)。。
(2)集成的。面向事務(wù)處理的操作型數(shù)據(jù)庫通常與某些特定的應(yīng)用相關(guān),數(shù)
據(jù)庫之間相互獨(dú)立,并且往往是異構(gòu)的。而數(shù)據(jù)倉庫中的數(shù)據(jù)是在對原有分散的數(shù)據(jù)庫數(shù)據(jù)抽取、清理的基礎(chǔ)上經(jīng)過系統(tǒng)加工、匯總和整理得到的,必須保證數(shù)據(jù)倉庫內(nèi)的信息是關(guān)于整個企業(yè)的一致的全局信息。
(3)相對穩(wěn)定的。操作型數(shù)據(jù)庫中的數(shù)據(jù)通常實(shí)時(shí)更新,數(shù)據(jù)根據(jù)需要及時(shí)
發(fā)生變化。數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析只用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫之后,一般情況下將被長期保留,修改和刪除操作很少,通常只需要定期的加載、刷新。。
(4)反映歷史變化。操作型數(shù)據(jù)庫主要關(guān)心當(dāng)前某一個時(shí)間段內(nèi)的數(shù)據(jù),而
數(shù)據(jù)倉庫中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過去某一時(shí)點(diǎn)到目前的各個階段的信息,以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預(yù)測。
3.數(shù)據(jù)倉庫的結(jié)構(gòu)
如上圖所示,整個數(shù)據(jù)倉庫系統(tǒng)包含五個層次:
(1)數(shù)據(jù)源層。是數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ),是整個系統(tǒng)的數(shù)據(jù)源泉。通常包括企業(yè)內(nèi)部信息和外部信息。。
(2)數(shù)據(jù)導(dǎo)入層。是數(shù)據(jù)在進(jìn)入數(shù)據(jù)倉庫前的一個臨時(shí)存放區(qū),通過數(shù)據(jù)調(diào)度工具將業(yè)務(wù)系統(tǒng)傳送過來的數(shù)據(jù)表、文本文件等加載到臨時(shí)存放區(qū)。
(3)數(shù)據(jù)服務(wù)層。是整個數(shù)據(jù)倉庫系統(tǒng)的核心。針對現(xiàn)有各業(yè)務(wù)系統(tǒng)的數(shù)據(jù),進(jìn)行抽取、清理,并有效集成,按照主題進(jìn)行組織。數(shù)據(jù)倉庫按照數(shù)據(jù)的覆蓋范圍可以分為企業(yè)級數(shù)據(jù)倉庫和部門級數(shù)據(jù)倉庫(通常稱為數(shù)據(jù)集市)。
(4)應(yīng)用服務(wù)層。應(yīng)用服務(wù)層的功能主要是建立多維數(shù)據(jù)集、進(jìn)行OLAP分析、生成各種靜態(tài)報(bào)表并以WEB方式提供各種功能的查詢分析。
(5)用戶層。根據(jù)對數(shù)據(jù)倉庫需求的不同,數(shù)據(jù)倉庫的用戶可以分為普通用戶、技術(shù)用戶、高級管理用戶這三類。不同用戶對數(shù)據(jù)倉庫訪問的需求層次以及復(fù)雜度都是不同的,簡單的需求是訪問一些固定的靜態(tài)報(bào)表和查詢分析,復(fù)雜的可以通過前端展現(xiàn)的工具生產(chǎn)一些靈活、動態(tài)的即席查詢報(bào)表,以滿足業(yè)務(wù)部門一些臨時(shí)的、迫切的報(bào)表需求。
4.相關(guān)的網(wǎng)站和論壇:
(1)數(shù)據(jù)倉庫之路
(2)致力于打造最專業(yè)的中文數(shù)據(jù)倉庫,商務(wù)智能社區(qū)
(3)商業(yè)智能和數(shù)據(jù)倉庫愛好者
(4)數(shù)據(jù)挖掘研究院
5.研究和商業(yè)機(jī)構(gòu)
(1) 北京大學(xué)移動通信數(shù)據(jù)倉庫聯(lián)合實(shí)驗(yàn)室
2006年5月由中國移動、北京大學(xué)、亞信集團(tuán)聯(lián)合建立,該實(shí)驗(yàn)室”是全球容量最大的數(shù)據(jù)倉庫分析系統(tǒng)實(shí)驗(yàn)室,也有效的整合了三方得優(yōu)勢資源。中國移動通信目前構(gòu)建了目前國際上最大的數(shù)據(jù)倉庫系統(tǒng),聯(lián)合實(shí)驗(yàn)室的建立,既能推動中國移動自身數(shù)據(jù)倉庫系統(tǒng)建設(shè),也能明顯推動數(shù)據(jù)倉庫技術(shù)向縱深發(fā)展。
(2)中國人民大學(xué)數(shù)據(jù)倉庫和商務(wù)智能實(shí)驗(yàn)室
2004年5月由中國人民大學(xué)和全球著名的數(shù)據(jù)倉庫廠商N(yùn)CRTeradata聯(lián)合建立。該實(shí)驗(yàn)室承擔(dān)了國家863計(jì)劃、國家自然科學(xué)基金重點(diǎn)項(xiàng)目、教育部重點(diǎn)項(xiàng)目等國家重大科研任務(wù)。借助于NCRTeradata的優(yōu)勢技術(shù),雙方將通過密切的合作,共同開發(fā)具有中國行業(yè)特色的數(shù)據(jù)倉庫和商務(wù)智能應(yīng)用軟件。
(3)北京漢端科技有限公司
北京漢端公司是一家專門從事商業(yè)智能信息化服務(wù)的企業(yè),從1996年就開始專業(yè)做數(shù)據(jù)倉庫,它在數(shù)據(jù)倉庫領(lǐng)域是相當(dāng)專業(yè)的,在這可以接觸到最前沿的數(shù)據(jù)倉庫技術(shù)。
(4)上證所金融創(chuàng)新實(shí)驗(yàn)室
2006由上海證券交易所成立,該實(shí)驗(yàn)室的數(shù)據(jù)全部來源于數(shù)據(jù)倉庫系統(tǒng)。 上證所在推出金融新產(chǎn)品時(shí),都曾通過數(shù)據(jù)倉庫平臺進(jìn)行過測算和驗(yàn)證。通過實(shí)時(shí)數(shù)據(jù)倉庫技術(shù),為上證所的經(jīng)營、監(jiān)管、創(chuàng)新和服務(wù)決策提供數(shù)據(jù)支持,極大的提高了監(jiān)管的效率和服務(wù)的性能,能夠更好地服務(wù)市場和監(jiān)管市場。
參考文獻(xiàn):
1伍小榮 伍慶華 數(shù)據(jù)倉庫技術(shù)的研究現(xiàn)狀和未來方向 [期刊論文] 現(xiàn)代電子技術(shù)2002(6)
2.向海華 數(shù)據(jù)庫技術(shù)發(fā)展綜述[期刊論文] 現(xiàn)代情報(bào) 2003(12)
3.王澤明淺談數(shù)據(jù)倉庫技術(shù) [期刊論文] 計(jì)算機(jī)應(yīng)用與軟件2001-01-15
4.黃慶普 剖析數(shù)據(jù)倉庫技術(shù) [期刊論文] 華南金融電腦2003年11期
5.劉立波 數(shù)據(jù)倉庫技術(shù)的研究與應(yīng)用[期刊論文] 計(jì)算機(jī)工程與應(yīng)用2002(15)
看了“萬方數(shù)據(jù)庫學(xué)術(shù)論文”的人還看: