歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux綜合 >> Linux資訊 >> Linux業界 >> 各種技術都發展 下一代數據庫技術掃描

各種技術都發展 下一代數據庫技術掃描

日期:2017/2/27 11:08:25   编辑:Linux業界

這些年,企業數據幾何級的增長 一直在刺激著數據庫市場的蓬勃發展,易觀國際近期發布《2006年第4季度中國數據庫軟件市場數據監測》數據顯示,2006年第4季度中國商業數據庫市場2006年第4季度整體規模達到5.35億元,季度環比增15.45%。IDC曾預測,2008年全球數據庫軟件市場規模將達到200億美元。

面對著如此需求強勁的市場,有人卻說,數據庫市場可以算是多年來最缺乏新意的領域。究其原因,在於其格局多年以來一直保持著相對的穩定,屈指可數的幾個巨頭各據一方,瓜分了世界范圍內數據庫市場近90%的份額。

而對早已熟知這些廠商的用戶來說,他們不再關心誰是霸主誰是領袖。對數據庫技術發展的趨勢關注程度已經遠超越了數據庫本身。

對廠商來說仍然如此,不管數據庫廠商們確立怎樣的市場發展策略,如何使自己核心產品保持領先地位卻是重中之重,這其中,數據庫技術的發展趨勢成為廠商關注的焦點。因此,未來數據庫市場競爭的焦點已不再局限於傳統的數據庫,新的應用不斷賦予數據庫新的生命力,隨著應用驅動和技術驅動相結合,也呈現出了一些新的趨勢。

下一代數據庫趨勢


XML數據庫 甲骨文、IBM、微軟、SyBase
BI數據庫 甲骨文、IBM、微軟、SyBase
開源數據庫 MySQL、PostgreSQL
網格數據庫 甲骨文、IBM

絕對主力 XML數據庫

從近幾年看,各大數據庫廠商幾乎無一例外地在數據庫內支持XML(eXtensible Markup Language,可擴展的置標語言),並以此發起猛烈的競爭攻勢。這表明,在Web應用程序和系統間信息交換方面表現突出的XML技術,已經成為主導數據庫技術趨勢的主力軍。

XML不可或缺

2006年,在IDC最近發布的一份報告中,500家受訪企業的IT部門中有29%稱,正在大量使用XML存儲庫和數據庫;約有同樣比例的受訪者稱,正在探索這方面的使用前景。

甲骨文認為:“XML在信息管理領域無處不在,不管是管理結構化或非結構化信息,或者用於信息傳輸,或者是集成信息的映射標准,它現在是不可或缺的。”

XML是定義文檔結構的機制,XML規范定義了一個對文檔進行標記的標准。

早在2000年左右,國內就表現出了對XML技術的需求。新華社當時就采用了OracleXML數據庫。當時是因為需要從美聯社、路透社等國際新聞媒體機構交換數據,而且各個功能模塊之間,如計費系統和新聞稿件內容管理系統之間的信息交互,它們都需要XML格式。

既然XML已是各種數據特別是文檔的首選格式,國際主流的數據庫廠商們自然也隨行就市,全都推出了兼容傳統關系型數據與層次型數據(XML數據)混合應用的新一代數據庫產品。

廠商趨之若鹜

甲骨文早在Oracle8i中就支持XML,在Oracle9i提供了XmlDB功能,支持XMLType數據類型,並在Oracle10g進一步加強了功能和提高了性能,如XQuery的性能。

IBM DB2 9中新的XML支持包括純 XML存儲、XML索引、XQuery和高級的XML模式處理。這與商業關系數據庫中以前的任何技術都不同。

微軟SQL Server 2005為XML數據處理提供了廣泛的支持。XML值可以自然地存儲在XML數據類型列中,並可以根據XML架構集合進行類型化,或者保持非類型化。

Sybase公司的ASE數據庫與其嵌入式數據庫都已經支持XML,可以從關系查詢中創建XML格式的結果集,並且各具特色。

XML數據庫是趨勢

北京大學信息學院數據庫實驗室副教授高軍認為,將關系數據庫的產品和XML數據產品結合在一起,將會極大的減少程序員的工作量,提高XML數據管理,包括XML從關系數據庫到XML的發布,以及XML數據存儲到關系數據庫之上的工作。

中國移動數據庫工程師段雲峰表示:“XML技術的增強,有利於幫助用戶去整合各種不同的數據源,比較靈活地去應用新的數據源、復雜的數據源,這點對整個數據庫技術是很大的一個提升。”

甲骨文大中華區技術咨詢顧問部高級總監李穎聰強調,目前,雖然一些XML數據庫在有效的存儲組織、合理索引結構、數據庫系統的安全性等方面已經不錯,但標准眾多,缺乏統一的數據庫開發標准。不同數據庫產品之間的兼容性也有待提高。

雖然業內一致認為XML數據庫是未來數據庫的一個重要的方向,但目前學術界和廠商之間的認識有一些細微的不同,學術界強調應該專注於查詢性能的提高;強調平台無關性;關注XML數據庫的模式設計規范化問題。

廠商所重視的則顯得更加現實,現有主流XML數據庫都在底層提供collection數據結構,以存儲XML元素節點,通過B+樹結構(一個多級索引方法)來索引這些元素節點;市場上的數據庫產品通過引入日志管理;增強了對異構數據源的集成管理。

未來幾年,XML數據庫技術有可能在下述方面取得進展: 異構數據源的集成、底層索引結構、並發加鎖協議、XML模式規范化。
XML數據庫為數據交互提供了統一標准

XML是定義文檔結構的機制,XML規范定義了一個對文檔進行標記的標准。“XML技術的增強,有利於幫助用戶去整合各種不同的數據源,比較靈活地去應用新的數據源、復雜的數據源,這點對整個數據庫技術來說應該說是很大的一個提升。”

廠商對XML數據庫觀點

甲骨文 業內缺乏統一的數據庫開發標准;
IBM 這將改變數據庫的游戲規則;
微軟 可以描述現實世界的每一個實體;
SyBase 解決了企業數據爆炸難題。

為何癡迷 BI數據庫

這兩年的BI(Business Intelligence,商業智能)市場確實異常火熱,處於群雄並起的“戰國時代”, 2006年,Business Objects公司收購Nsite軟件公司,Business Objects 收購 Firstlogic公司,甲骨文收購Sigma Dynamic,微軟收購ProClarity等一系列的收購,使得BI市場競爭硝煙彌漫。

廠商瘋狂搶灘

就在今年3月1日,甲骨文宣布收購海波龍(Hyperion),收購價格33億美元,這次收購行動在全球市場引起了巨大反響,對於日益興旺的商業智能產業更是強大的沖擊,成為國內外眾多媒體報道的焦點。此前,Oracle商業智能套件企業版10g第三版剛剛上市。

這次的收購並不讓人意外,先來看一組數據,據ChinaBI估計,2007年全球商業智能市場的規模高達200億美元,而中國商業智能市場達到18億元人民幣。可見,商業智能已經成為IT廠商爭食的香饽饽,這次收購Hyperion能使Oracle最終融合BI。

商業智能為什麼變得如此的瘋狂,據惠普新任的BI總經理Ben Barnes透露,BI市場——包括從數據抽取中間件到桌面數據分析工具,再到數據倉庫服務器—— 一年的市場總額約為500億美元,增長率為10%。在眾多公司的技術采購計劃中,BI都排在相當靠前的位置。《InformationWeek》調查了300家企業的技術經理2007年的項目計劃,結果顯示,44%的企業有購買數據倉庫的計劃,而43%的企業則計劃購買數據分析工具。

商業智能的魅力

為什麼數據庫巨頭會如此看重商業智能呢? 到現在,為應對日益加劇的商業競爭,企業不斷增加內部IT及信息系統,使企業的商業數據成幾何數量級不斷遞增,如何能夠從這些海量數據中獲取更多的信息,以便分析決策將數據轉化為商業價值,就成為目前數據庫廠商關注的焦點,這其中離不開商業智能。

而從用戶對數據管理需求的角度看,可分為兩類:聯機事務處理(OLTP)應用、聯機分析處理(OLAP)與輔助決策(BI)兩大類,也就是說,數據庫不僅要支持OLTP,還應該為業務決策、分析提供支持。目前,主流的數據庫廠商都已經把支持OLAP、商業智能做為關系數據庫發展的一大趨勢。

李穎聰認為,具體來說,企業高級管理層面臨著的任務是從龐大的傳統IT系統中過濾出大量的數據,以做出明智的決策。商業智能則通過精心設計的數據中心或企業數據庫能輕松應對這些挑戰,為用戶提供全面而准確的信息。

由此可見,如何更好的支持商業智能將是未來數據庫產品發展的主要趨勢之一,各數據庫廠商在新推出的產品中,紛紛表示自己的產品在商業智能方面有很大提高。

巨頭看好BI數據庫

IBM在數據庫商業智能方面是先行者之一,2004年,IBM在全國多個城市舉辦““IBM DB2商業智能行業解決方案巡展”。就在剛剛過去的3月15號,IBM在芝加哥的Gartner商業智能高層會議發布其全面的動態倉儲策略。該項舉動的初衷是圍繞公司的DB2倉儲9.1.2進行的,其前身為DB2 9數據庫管理系統,同時整合了公司的信息服務器進行數據整合。


至於新技術方面,IBM推出了OmniFind Analytics 版本,該版本主要致力於解決從無組織的雜亂數據中提取商業智能的問題。

Sybase在數據庫ASE 15版本中已經強化了對OLAP分析表現功能的支持,這樣對中小企業客戶來說,通過數據庫就可以實現BI方面的應用;對一些大型用戶,Sybase也提供了專業的數據倉庫和商業智能應用解決方案。Sybase IQ則是Sybase專門為滿足數據倉庫和商業智能設計的高性能的關系型數據庫系統。

微軟方面,隨著SQL Server 2005的發布,繼承了微軟近十年BI技術應用與軟件開發的成功經驗,包括數據倉庫、數據分析、ETL工具、報表及數據挖掘等,並有針對性的做了一些優化。

微軟(中國)有限公司數據應用平台市場經理楊晨告訴記者,數據庫本身應該具備一定的智能,根據前端的應用復雜的變化進行調整,最大化地利用資源,微軟的BI有五個工具,包括數據倉庫的工具、數據整合的工具、報表工具、多余分析工具和數據挖掘的工具。

面對數據庫和商業智能融合的大潮,有專家甚至稱,微軟的數據庫軟件已經擁有較強的商業智能能力。微軟的產品一向以易用著稱。

SyBase軟件(中國)有限公司技術總監盧東明認為,沒有一個數據庫在企業級能夠非常有效地完成連接事務處理的應用,同時又能夠完成企業的決策支持或者是BI系統的應用。那麼如何正確地理解這兩類的應用呢?實際上就是數據庫重要的創新。

從國內市場需求來看,企業信息化發展正處於一個系統集成階段,因此對高端智能決策系統的需求增強。目前金融、保險領域的國有企業,大部分已經建立了部門級的數據集市。

今後,這些企業中企業級的BI系統將會逐步建立。有些發達省份的企業,已經初步建立BI系統,或者正在考慮建設BI系統。而對國外企業而言,這一趨勢就更加明顯了,因此,BI將會是未來發展的重中之重。

商業智能在數據庫中的作用日益廣泛

商業智能則通過精心設計的數據中心或企業數據庫能輕松應對這些挑戰,為用戶提供全面而准確的信息。

強勢力量 開源數據庫

有人將這幾年IT業稱為“開源運動”時代,在開源的熱潮中,我們隨處可見開源數據庫的身影。MySQL、PostgreSQL、MaxDB、Berkeley DB,開源數據庫大家庭成員眾多,其中不乏出類拔萃者。

目前,以MySQL為代表的開源免費數據庫呈星火燎原之勢,隨著MySQL5.0版的推出,更有跻身企業市場的架勢。而MySQL等開源數據庫的異軍突起,又直接威脅著傳統數據庫巨頭的市場份額。

與傳統數據庫競爭

盡管開源數據庫,包括MySQL、Ingres和PostgreSQL,加起來在企業市場的份額也少的可憐。但是不可否認的是,他們正在市場份額和企業功能上都在迅速的增長。

據AMR Research之前的調研報告顯示,已經有43%的企業中在核心業務中使用開源數據庫產品,而將來計劃在核心業務中采用開源數據庫產品的企業占37%。隨著各類型企業對開源數據庫產品的使用和試用,以及開源數據庫產品自身功能的完善,開源數據庫的使用率和市場份額將會逐漸提升。

美國Forrester研究公司的分析師表示,數據統計表明,開源數據庫和商業數據庫相比可以給企業節省大約60%的費用。有統計表明,從總體擁有成本上看,開源數據庫比商業數據庫低50%,考慮到其他成本項目,開源比商業數據庫便宜60%。

開源數據庫與主流專有商業數據庫的競爭關系是顯而易見的,但是隨著“開源模式”的趨於成熟和穩定,以及對傳統專有商業軟件業的影響甚至顛覆,數據庫產品領域不再是“一家獨大”。用戶在以後的產品采購決策中,會更加青睐對開源數據庫的選擇。

從功能上來看,開源數據庫與商業數據庫擅長的領域並不相同,商業數據庫在處理能力,集成工具環境等方面依然強大,而開源數據庫強調的是在某幾個單項功能上的突出表現,以及輕便、易用的特點。

例如,MySQL的發展在一開始便定位於快速、穩定的大型關系型數據庫的目標,大約每2年進行一次大的版本升級,每幾個月就會有一次小規模的升級,這種小步快跑式的升級逐漸拉近了與商業數據庫產品之間的距離。而目前的MySQL5.0正式版具有更多的企業級特性。

推廣策略各不同

面對如今數據庫市場風雲正起。以甲骨文、IBM和微軟為首的廠商正在積極對抗開源廠商,只不過策略各自不同。

微軟曾公開表示,由開放源碼LAMP組合帶來的Web服務領域的變化已經明顯。作為對策,微軟推出SQL Server Express免費的工具,它擁有類似於LAMP的性能。

LAMP是一個開放源碼軟件的組合,它是一個由Linux的版本, Apache Web 服務器, MySQL和Perl, Python 或者PHP組成的軟件組合,研發者們可以運用它來建構Web服務。

IBM也發布接近成品的新數據庫服務器軟件。代號Viper的產品將與對手甲骨文一決高下,並抵抗來自開放源代碼軟件的挑戰。

其他廠商如Sun公司也在開發開源數據庫產品。Berkeley DB、Borland Software公司的Firebird以及SAP公司的 MaxDB、Ingres等產品也和PostgreSQ進行合作。

而甲骨文對開源數據庫的動作簡直可以用瘋狂表示,2005年推出一款免費Oracle 10g Express版,對MySQL使用的數據引擎公司InnoDB的收購,迫使MySQL開發自己的數據存儲引擎,InnoDB采用GPL許可協議,被捆綁在MySQL數據庫中。2006年年初,甲骨文收購了位於加州的開源數據庫提供商Sleepycat。

最近,又傳說甲骨文試圖收購MySQL,但在“開放源代碼商業會議”上,MySQL的首席執行官對媒體表示希望“保持(MySQL)公司的獨立性”而拒絕了甲骨文的“好意”。

開源帶來的問題

也許是看到開源勢頭強勁,開源數據庫廠商也爭先恐後地進一步技術研發,並各自冠亞以很有氣勢的“頭銜”。MySQL號稱“世界上最流行的開源數據庫”,PostgreSQL號稱“世界上最先進的開源數據庫”,EnterpriseDB號稱“真正的企業級開源數據庫,並足以與Oracle相競爭”。

但是,雖然開源數據庫的“開源”特點為其帶來的價格優勢成就了開源數據庫的應用和市場,但是也在一定程度上限制了其產品的商業化應用。

例如,開源數據庫最初大多是由開發團體或開發愛好者憑興趣創作而來,產品中的很多設計針對了開發者的偏好,但沒有照顧商業組織和技術力量薄弱的企業,另外,一些數據庫不支持存儲過程、觸發器,以及視圖界面等功能。

盡管如此,數據庫市場正在發生變化,MySQL、Ingres和EnterpriseDB等公司則在試圖開發高端開放源代碼數據庫產品。看來,數據庫“免費、開源”必將在響徹一片的市場中成為主流。

目前很多單位應用MySQL做為Web應用,開源數據庫與商業數據庫擅長的領域並不相同,商業數據庫在處理能力,集成工具環境等方面依然強大,而開源數據庫強調的是在某幾個單項功能上的突出表現,以及輕便、易用的特點。

商務智能是一套完整的解決方案,它是將數據倉庫、聯機分析處理(OLAP)和數據挖掘等結合起來應用到商業活動中,從不同的數據源收集數據,經過抽取(Extract)、轉換(Transform)和加載(Load),送入到數據倉庫或數據集市,然後使用合適的查詢與分析工具、數據挖掘工具和聯機分析處理工具對信息進行處理,將信息轉變成為輔助決策的知識,最後將知識呈現於用戶面前,以實現技術服務與決策的目的。

2006 LAMP開源實務應用高峰論壇主題是“理念走向實務應用,應用促進開源發展

廠商對開源數據庫的策略

甲骨文 瘋狂收購開源數據庫廠商;
IBM 推出免費數據庫版本;
微軟 推出類似LAMP功能的免費工具;
SyBase 重視和Linux的產品搭配。

未來沖擊波 網格數據庫

網格計算的出現受到業內眾多廠商追捧,到現在,EMC、Network Appliance、甲骨文等公司成立了一個促進企業網格計算的聯盟(EGA),理事會成員包括惠普、英特爾、NEC、Network Appliance、甲骨文和Sun等國際廠商。

據了解,企業網格聯盟關心數據中心計算,包括數據庫、服務器、存儲等應用。從這裡可以看出,網格作為一種新出現的重要技術,必然會對數據庫技術帶來巨大的沖擊。

數據網格成為方向

商業計算的需求使用戶需要高性能的計算方式,而超級計算機的價格卻阻擋了高性能計算的普遍能力。於是造價低廉而數據處理能力超強的計算模式--網格計算應運而生。

從IT行業的趨勢來看,企業也正在向網格計算轉移,這在很大程度上是低成本的刀片服務器驅動的。同時,共享存儲技術也簡化了硬件的虛擬化和供應,硬件供應商也開始提供實現硬件虛擬化和供應的管理軟件。

廠商方面,甲骨文公司和IBM公司已經宣布它們的數據庫管理系統產品能夠支持網格應用,它們期望將網格技術的應用領域擴展到企業計算,為企業提供一個可靠的、可擴展的、安全的分布式計算平台。

數據庫技術和網格技術相結合,也就產生一個新的研究內容,稱之為網格數據庫。網格數據庫當前的主要研究內容包括三個方面:網格數據庫管理系統、網格數據庫集成和支持新的網格應用。


被廠商普遍看好

DB2 Universal Database (UDB) 就強調了數據網格的重要性。DB2 UDB v.8.2 for Linux、Unix和Windows 提供了自主管理和自行恢復功能,從而簡化了數據管理、業務流程任務和數據網格。

IBM網格計算副總裁KenKing表示:“IBM在人力和技術方面有大量投資,幫助客戶實施網格解決方案,以實現業務轉型。我們依靠這些專業技術力量,通過IBM設計中心、網格整合中心和IBM研究院等多個網格中心協助我們的客戶。”

甲骨文公司Oracle 10g網格數據庫產品的推出,將網格技術的應用領域擴展到企業計算。甲骨文對網格計算的定義包括三部分,一是共享資源,將可用資源匯集起來形成共享池;二是虛擬化堆棧的每一層,可以如同管理一台計算機一樣管理資源;基於策略實現自動化負載均衡是第三部分。

李穎聰說:“中國公司的機構復雜程度在不斷上升,並且他們參與到了國際市場競爭中,繼續尋求最具靈活性、適應性和擴展性的商業模式對中國公司來說是至關重要的,而這種模式正是網格計算的承諾。”

Sybase和微軟方面表示,網格應用在技術上還需解決一些問題(如:多節點性能問題) ,網格技術要成為商業應用的主流,還需要幾年時間在應用和產品上進一步完善,但也表示出了對網格計算的關注。

業內專家認為,網格數據庫系統具有很好的前景,會給數據庫技術帶來巨大的沖擊,但它面臨一些新的問題需要解決。廠商網格數據庫系統要注意結合網格應用的新需求來展開自己的研究。網格數據庫管理系統應該可以根據需要來組合完成數據庫管理系統的部分或者全部功能,這樣做的好處除了可以降低資源消耗,更重要的是使得在整個系統規模的基礎上優化使用數據庫資源成為可能。

對網格計算的定義包括三部分:

一是共享資源,將可用資源匯集 起來形成共享池;
二是虛擬化堆棧的每一層,可以如同管理一台計算機一樣管理資源;
三是基於策略實現自動化負載均衡。

廠商對網格數據庫的觀點

甲骨文 企業國際化需要網格計算;
IBM 網格將會實現企業業務專型;
微軟 向上擴展完全能夠滿足客戶的需求,沒有必要采用向外擴展(網格)技術;
yBase 網格應用在技術上還需解決一些問題。


編輯/孟波 原創 來源:HARDSPELL/硬派網




Copyright © Linux教程網 All Rights Reserved