當前位置:首頁 > 深度報道 >

瀚高軟件CTO鄭曉軍:以開源之路發展國產數據庫符合市場規律

發布時間:2019-07-31 19:38:58 來源:中國軟件網 作者:劉學習
[摘要]中國要不要發展自己的基礎軟件?中國的基礎軟件怎樣才能異軍突起?從十幾年前到現在,這些一直是人們爭論不休的話題。 而最近幾年在中國IT市

中國要不要發展自己的基礎軟件?中國的基礎軟件怎樣才能異軍突起?從十幾年前到現在,這些一直是人們爭論不休的話題。

而最近幾年在中國IT市場,又出現這樣一個令人困惑的現象:中國基礎軟件做得出來,卻用不起來。

對于中國基礎軟件崛起之難,企業是最深有感觸的,但是十幾年來行業人士卻從來沒有放棄。與十幾年前的困境相比,如今IT應用環境云化帶來了極大機會,中國基礎軟件也取得的巨大進步,這一切都在證明,中國基礎軟件發展未來可期,前途光明。

(瀚高軟件CTO鄭曉軍)

“推進開放標準和開源軟件可以幫助中國軟件產業發展,包括中國基礎軟件的發展。在這方面,我很認同中國工程院院士倪光南等人的觀點。” 瀚高軟件CTO鄭曉軍接受中國軟件網記者采訪時指出,發展國產基礎軟件一定不能錯過“開源”路線。

2009年,瀚高軟件基于開源的PostgreSQL數據庫,開始研發國產數據庫,品牌為Highgo Database。十年鑄一劍,公司2015年成功在新三板上市,經過十幾年的發展,瀚高數據庫——Highgo DB目前已在眾多關系國計民生的關鍵核心領域和重大工程中得到成功應用。

開源數據庫使用比例大幅上升

鄭曉軍,畢業于復旦大學計算機系,獲碩士學位。多年來,他一直專注于分布式數據庫和面向對象數據庫的技術研究,曾經在全球著名的幾大數據庫企業中任職,非常具有傳奇色彩。他,1992年加入Sybase,任市場總監;1996年加入Informix,任技術咨詢總監,參與了多項數據倉庫的設計和商業智能系統的實施;2001年,Informix被IBM并購,遂加入IBM,出任IBM中國軟件實驗室信息管理技術拓展經理和IBM數據倉庫Netezza產品的渠道業務經理;2012年加入Oracle,前后擔任亞太區Exadata資深技術顧問和Oracle中國區新興技術解決方案部首席架構師。

作為業內知名大咖,鄭曉軍加入瀚高軟件后出任瀚高軟件CTO,主要從事瀚高軟件數據庫產品的技術研發工作。十多年數據庫行業的從業經歷,讓鄭曉軍能非常敏銳地洞察到數據庫軟件和應用環境發生的變化。

鄭曉軍認為,數據庫市場的變化主要有幾個方面:

第一,商業數據庫市場進一步集中。隨著Informix被收購、IBM軟件部衰落、DB2市場萎縮、普通商業數據庫市場(OLTP及OLTP/OLAP混合模式)進一步集中,Oracle一家獨大,許多企業核心及主要的數據庫系統基本由Oracle承擔。微軟雖然推出Linux版本的SQL Server,但其份額很小,主要市場在Windows服務器上。

第二,開源數據庫的使用比例大幅度上升。互聯網公司、新興企業,乃至傳統大型企業都在考慮開源數據庫的解決方案,數據庫的應用有向輕數據庫應用模式變化的跡象。在開源數據庫中,MySQL的份額最大,但其社區被Oracle把控。

第三,數據倉庫市場,傳統的龍頭Teradata發展不大,Oracle的Exadata推出后,拿下了一些單子,其他企業均在萎縮。開源的分布式文件系統(Hadoop、Spark等)大數據項目也瓜分了一部分市場。

同時,對于數據庫應用,存在“輕數據庫”的現象,對數據庫功能的要求有所降低,這跟開源數據庫的應用有關。應用環境上,在公有云、私有云上提供數據庫/倉庫的服務,將成為未來的一個趨勢。

中國數據庫市場格局未來變局

Gartner發布報告顯示,在2016年~2018年,AWS、微軟、阿里云、Oracle、谷歌位列全球云數據庫市場份額前五,而Oracle數據庫服務依然保持了66%的增速。同時,國內的華為、阿里等推出不同類型數據庫產品等,在市場引起了巨大反響。而瀚高軟件則提出,用開源軟件的商業版本改變中國基礎軟件產業格局,是一條行得通的捷徑。

面對市場這些紛繁的變化,目前中國基礎軟件市場格局特別是數據庫市場格局未來會發生怎樣的變化呢?

鄭曉軍認為,Oracle公司雖然裁員,但其傳統的業務部門變化不大。由于一些大型單位、企業的區域性許可到期更新,Oracle在中國傳統領域的業績短期內是上升的。Oracle裁員集中在云計算團隊,對數據庫市場的格局影響不大。

傳統企業上規模的交易數據庫以前都是運行在高端的IBM小型機上(即常說的IOE),如今的趨勢是一般采取x86系列的PC服務器,甚至是ARM作為CPU芯片的服務器。為了提高系統的處理能力,需要采用集群的架構。同時,一些互聯網應用并發吞吐量的要求甚至遠遠高于傳統企業集中式的大型系統,因為成本原因,更不可能選用傳統的集中式架構了。

阿里、華為等推出了運行在分布式集群環境下的、多個節點組成的、能夠比較“優雅”地支持交易處理的數據庫系統。在分布式環境下,跨節點的交易處理是最耗時間的,也是系統擴展性的障礙,這是一個理論上的限制。不過,在日常的實踐中,用戶在數據模型、應用架構設計上有很多空間可以利用、提升。即便用普通的數據庫也能夠支撐非常大規模的應用系統,如目前的大多數互聯網和電子商務應用。

目前,業界的技術焦點在于采用什么樣的手段對分布式事務進行排序,是“中心時鐘”還是“分布式時鐘”?“邏輯時鐘”還是“物理時鐘”?瀚高數據庫已有的方案屬于“中心邏輯時鐘”類,適合在局域網內構建多節點數據庫群集。對于分布式和物理時鐘,也正在研究并跟進。目前,掌握基礎技術,提供穩定、可靠、對企業級應用的數據庫產品是瀚高軟件的優先任務。

鄭曉軍認為,中國數據庫市場的格局在未來幾年肯定會發生改變。對于應用來說,數據庫之間的差距沒有想象的那么大,Oracle也沒那么神秘和高不可攀。今天,即便是在硅谷,年輕的一代使用Oracle的人數也在大幅度減少。使用Oracle數據庫不是好不好的問題,而是有沒有必要的問題。

未來,開源的數據庫,包括云計算上提供的開源數據庫服務,會得到廣泛應用。大量的政府部門、生產業務類系統會有更多的國產數據庫出現。Oracle的市場會被壓縮在一些傳統、核心的數據庫系統上,并在更長的時間周期中,隨著應用架構的更新逐漸被替換。

以開源發展國產數據庫系統切實可行

中國的國產數據庫發展已經很多年了,實際情況不甚理想。鄭曉軍認為,究其原因來說,有以下幾個方面:

穩定性:數據庫,穩定性第一,重于性能。開源軟件得到全世界用戶的廣泛使用,軟件研發中的缺陷暴露得徹底,產品穩定性可與商業軟件比肩。而很多自研的系統很難走入良性循環,一些有份量的客戶會以“不敢用”來推辭。

應用生態:市場的接受度、應用開發商的接受度是數據庫軟件的生命。開源的產品是“自帶”生態的,而閉源產品在擴展生態方面是一個難以逾越的坎兒。

重復發明輪子:數據庫軟件并非每一行代碼都是高深的技術,它是由很多成熟的解決方案和實現邏輯與算法構成的。很多經典的實現,都已被無數計算機專業學生作為習題做過。作為數據庫產品,實際上是一個工程,需要嚴絲合縫地把無數零件組合到一起,并讓機器正常運轉。因此,對于很多完全掌握了制造方法的零件,沒必要重新生產一遍。

開源的社區在技術領先性方面能夠保持相當的水準,全世界人民都看著,各種建議、各種評論影響著社區。

(瀚高軟件CTO鄭曉軍)

利用開源為基礎發展國產數據庫系統,是一個切實可行的發展之路,也是符合市場規律的一個策略。它本質上并不依賴政策的扶植,本身就有明確的市場需求支撐。成效就是以合理的投入,自主地快速成長,而且掌握前沿數據庫技術。

鄭曉軍認為,利用開源發展國產數據庫面臨三大挑戰:

一是開源協議的制約。開源并不是隨便用的,尤其是想基于它去發展自己的技術、產品和市場。PostgreSQL是整個數據庫(甚至是開源世界)業界唯一的一個BSD協議的開源資源。它本身就是鼓勵開放、創新的。在這個平臺上已經有好幾個成功的商業產品問世,如Greenplum、Netezza、RedShift、Citus等。

二是對開源代碼的掌握程度。使用開源不等于抄襲和不勞而獲。對于使用的開源代碼,需要安排資源掌握,并思考自己未來的改進和創新。

三是技術實現上是否分叉。是不是要分叉、什么時間分叉、怎么分叉?自身的產品發展計劃如何與社區的發展吻合?哪些技術要跟蹤、哪些應該走自己的路子?

瀚高軟件真正對于PostgreSQL的研究始于2009年,大部分時間花在源代碼的了解、梳理、掌握上,起初主要為滿足本區域客戶(山東)的一些需求。近兩年,瀚高數據庫增加了安全可控的特性,產品已符合相關國家級權威資質認證。

在生態建設上,由于不少用戶不理解PostgreSQL與MySQL的本質區別,大家抱著使用者的心態更多一些。

合適的開源商業模式是關鍵

利用開源,成功實現盈利并發展成為獨角獸企業在基礎軟件領域也不在少數,但是做法多有不同。有的企業通過訂閱收費,有些通過提供實施、咨詢培訓等服務賺錢,有些提供商業組件等實現盈利和發展。這一切的關鍵在于是否擁有一個合適的開源商業模式。

鄭曉軍認為,瀚高軟件采用的開源商業模式的出發點與眾不同:瀚高軟件定位于中國本土數據庫廠商,并不局限于開源數據庫的外圍服務,而是以開源技術為基礎,致力于發展成為國際領先的數據管理綜合解決方案提供商。

瀚高軟件最初是以提供Oracle數據庫售后服務起家的,在山東擁有大量的Oracle售后服務的客戶。同時,瀚高軟件也在做數據復制工具HVR的業務。這些業務都在持續推進,并都是可以實現盈利的業務。

瀚高軟件也提供開源服務,目前正在為太平保險等企業提供服務,因為強大的技術背景、深厚的數據庫服務經驗,以及一流的人才隊伍,使其服務受到用戶的高度認可。

開源軟件離不開社區。鄭曉軍說,瀚高軟件參與社區的活動經歷了從外圍服務、貢獻代碼到核心參與這一過程。長久以來,瀚高軟件承擔PostgreSQL社區本土企業的責任,如PostgreSQL資料的中文翻譯大多出自瀚高軟件,為社區提交數據庫日志分析工具xlog等。目前瀚高軟件開始向社區投放資源,成立北美研究院,吸引來自中國、加拿大、巴基斯坦的研發人員;積極參與社區的研發規劃、參與主要代碼的開發;協調國內產品研發與社區主線的協同。

數據庫的明天 瀚高的未來

對于基礎軟件特別是數據庫未來的發展方向,鄭曉軍認為有幾個方面值得關注:

1、分布式,發展大規模、跨區域的分布式架構,同時支撐OLTP/OLAP的業務場景。

2、NVRAM,以NVRAM作為主要存儲介質,提供快速隨機訪問。

3、發展多樣化存儲與接口。接口的豐富性,除了傳統SQL,提供圖數據庫、知識推理、機器學習等各類接口。

4、適應云計算服務模式,以云服務的模式交付市場。

對于瀚高數據庫而言,首先支持政策市場,立足價值市場;提供多層次的服務:圍繞開源的服務、提供數據庫擴展、企業級國產數據庫;積極參與社區,參與核心研發,把握發展方向;把自己打造成一個本土的,掌握數據庫核心技術的一支力量,做一個有技術含量的中流砥柱。

【返回首頁】

麻将现金游戏
福彩3d和直尾走势图 宁夏11选5爱彩乐 河南貔貅脉动棋牌 二十一点 蛭魔 出租房中介怎么赚钱 广西十一选五走势图百度彩票 一天赚200的方法 河北快三中奖助手下载 免费波克麻将下载