您现在的位置： Linux教程網 >> UnixLinux > >> Linux綜合 >> Linux資訊 >> 更多Linux

數據倉庫學習心得

　　一．概念 1．數據倉庫：是指面向主題的，一致的，不同時間的，穩定的數據集合，用於支持經營管理中的決策支持過程。從廣義上講數據倉庫是指存儲大量歷史數據的數據庫。每一個記錄代表特殊時間點上的一個數據。它是一種把收集的各種數據轉變成有商業價值的信息技術，並把收集的信息體現在報告中。包括收集數據，過濾數據，存儲數據，之後把數據應用於分析、報告等應用程序。 2．數據倉庫目標：確認數據結構，尋找趨勢，輔助決策，為經營管理提供決策信息。 3．．DSS：決策支持過程。 4．數據倉庫組成部分：數據市場，關系型數據庫，數據源，數據准備，種服務工具 5．維度: 6．多維: 7．聚合:獲取並集中一個群體或總和的結構.聚合是在一個多維層次內移動數據的概念. 9．類別:為類別和區分特定數據而分類的,在一個維度內,為提供詳細分類系統而定義的分類. 10．詳細類別:一個維度內最底層的分類. 11．分解與合成: 12．指標量: 13．OLAP：聯機分析 14．OLTP聯機事務處理二．數據模型規范化 1．概念：規范化：是一個正規的方法，它應用一套規則使屬性和實體相關聯。實體：是一個主要的數據對象，對用戶至關重要。它通常是將被記錄在數據庫中的一個人、一個地點、一樣東西或者一件事情。屬性：實體包括屬性，屬性就是特征，修飾成分、質量、數量或者特性。范式：規范化由幾個能夠減少褓以獲得更滿意的物理我的步驟組成，這些步驟稱為范式。第一范式：一個不包含重復列的表歸於第一范式。第二范式：如果一個表歸於第一范式且只包含依賴於主鍵的列，則歸於第二范式。第三范式：如果一個表歸於第二范式且只包含那些非傳遞性地依賴於主鍵的列，則歸於第三范式。二．信息需求建模: 1．自上而下建模方法:利用具體數據元素,將這些元素組織到各個維度與指標中, 2．自下而上建模方法:從用戶的觀點設計,優點是設計者可以轉紙一個通常主題或商務領域運 3．開發. 是自上而下與自下而上的方法的結合. 4．舉例：銷售收入應從預算和實際等角度表示. 指標:產品銷售的實際收入,產品銷售的預算收,產品銷售的估計收維度:已經銷售的產品. 三．設計數據倉庫，經常詢部用戶的幾個問題？ 1.用戶所在部門承擔的任務 2.用戶在部門中承擔的任務 3.為完成任務，用戶需哪些報表 4.目前從何處獲取這些信息? 5.得到信息如何處理? 6.信息是應用戶需要產生的,還是在定期報表中產生的? 7.用戶把信息輸入到過工作表中嗎?以便進一步分析嗎? 8.怎樣處理這些信息才算及時? 信息包的編制: 信息包:________________________ 維度:____________________________________________ 　類別: 　　指標（預測銷售，實際銷售，預測偏差）四．建立多維數據模型要建立多維數據庫： 1．選擇用來分析被建模主題的商業過程。建模主題：比如想通過產品線和地區分析消費者的購買傾向來制訂市場策略，此時數據模型主題就是“銷售”。 2．確定事實表的粒度。事實表粒度通常代表每一個相關維的最底層。選擇以“天”為粒度，就表示“時間維”中的每一記錄代表一天。 3．區分每一個事實表的維和層。已定義的粒度與維相關。 4．區分事實表的度量。度量不僅包括數據本身，而且包括你從已存在的數據計算得到的新值。當設計數據模型時，必須做出決策：是否儲存事實表裡的計算結果或在運行階段獲得這些值。如：比值。 5．確定每一個維表的屬性。一般情況下，定義的每一個維表屬性的數量，應該保持最小。

6．讓用戶驗證數據模型。歡迎您給我發Email , 讓我們共同進步。 mailto: hxflx@sina.com hxflx@163.com lixing@neusoft.com

上一篇文章：數據完整性檢測工具：Tripwire
下一篇文章：雙網卡解密