歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux綜合 >> Linux資訊 >> 更多Linux >> 數據倉庫學習心得

數據倉庫學習心得

日期:2017/2/27 14:18:51   编辑:更多Linux
  一.概念 1.數據倉庫:是指面向主題的,一致的,不同時間的,穩定的數據集合,用於支持經營管理中的決策支持過程。從廣義上講數據倉庫是指存儲大量歷史數據的數據庫。每一個記錄代表特殊時間點上的一個數據。 它是一種把收集的各種數據轉變成有商業價值的信息技術,並把收集的信息體現在報告中。包括收集數據,過濾數據,存儲數據,之後把數據應用於分析、報告等應用程序。 2.數據倉庫目標:確認數據結構,尋找趨勢,輔助決策,為經營管理提供決策信息。 3..DSS:決策支持過程。 4.數據倉庫組成部分:數據市場,關系型數據庫,數據源,數據准備,種服務工具 5.維度: 6.多維: 7.聚合:獲取並集中一個群體或總和的結構.聚合是在一個多維層次內移動數據的概念. 9.類別:為類別和區分特定數據而分類的,在一個維度內,為提供詳細分類系統而定義的分類. 10.詳細類別:一個維度內最底層的分類. 11.分解與合成: 12.指標量: 13.OLAP:聯機分析 14.OLTP聯機事務處理 二.數據模型規范化 1. 概念: 規范化:是一個正規的方法,它應用一套規則使屬性和實體相關聯。 實體:是一個主要的數據對象,對用戶至關重要。它通常是將被記錄在數據庫中的一個人、一個地點、一樣東西或者一件事情。 屬性:實體包括屬性,屬性就是特征,修飾成分、質量、數量或者特性。 范式:規范化由幾個能夠減少褓以獲得更滿意的物理我的步驟組成,這些步驟稱為范式。 第一范式:一個不包含重復列的表歸於第一范式。 第二范式:如果一個表歸於第一范式且只包含依賴於主鍵的列,則歸於第二范式。 第三范式:如果一個表歸於第二范式且只包含那些非傳遞性地依賴於主鍵的列,則歸於第三范式。 二.信息需求建模: 1.自上而下建模方法:利用具體數據元素,將這些元素組織到各個維度與指標中, 2.自下而上建模方法:從用戶的觀點設計,優點是設計者可以轉紙一個通常主題或商務領域運 3.開發. 是自上而下與自下而上的方法的結合. 4.舉例:銷售收入應從預算和實際等角度表示. 指標:產品銷售的實際收入,產品銷售的預算收,產品銷售的估計收 維度:已經銷售的產品. 三.設計數據倉庫,經常詢部用戶的幾個問題? 1.用戶所在部門承擔的任務 2.用戶在部門中承擔的任務 3.為完成任務,用戶需哪些報表 4.目前從何處獲取這些信息? 5.得到信息如何處理? 6.信息是應用戶需要產生的,還是在定期報表中產生的? 7.用戶把信息輸入到過工作表中嗎?以便進一步分析嗎? 8.怎樣處理這些信息才算及時? 信息包的編制: 信息包:________________________ 維度:____________________________________________   類別:    指標(預測銷售,實際銷售,預測偏差) 四.建立多維數據模型 要建立多維數據庫: 1. 選擇用來分析被建模主題的商業過程。 建模主題:比如想通過產品線和地區分析消費者的購買傾向來制訂市場策略,此時數據模型主題就是“銷售”。 2. 確定事實表的粒度。 事實表粒度通常代表每一個相關維的最底層。選擇以“天”為粒度,就表示“時間維”中的每一記錄代表一天。 3. 區分每一個事實表的維和層。 已定義的粒度與維相關。 4. 區分事實表的度量。 度量不僅包括數據本身,而且包括你從已存在的數據計算得到的新值。當設計數據模型時,必須做出決策:是否儲存事實表裡的計算結果或在運行階段獲得這些值。如:比值。 5. 確定每一個維表的屬性。 一般情況下,定義的每一個維表屬性的數量,應該保持最小。


6. 讓用戶驗證數據模型。 歡迎您給我發Email , 讓我們共同進步。 mailto: [email protected] [email protected] [email protected]



Copyright © Linux教程網 All Rights Reserved