軟件國產(chǎn)化:關(guān)注基礎軟件&工業(yè)軟件
2021年計算機軟件板塊收入增速回升(同比變動(dòng)9.8pct)、新勢力廠(chǎng)商層出不窮,產(chǎn)業(yè)蓬勃發(fā)展。政策端來(lái)看,國產(chǎn)化扶植政策陸續出臺,信創(chuàng )采購有望推動(dòng)軟件行業(yè)快速發(fā)展。我們認為,國產(chǎn)化替代涉及從底層硬件到應用軟件的多個(gè)層次,正在從黨政試點(diǎn)進(jìn)一步推廣。具體來(lái)看,硬件層面包括主機及外部設備,軟件層面包括基礎軟件及應用軟件,具體包括操作系統、數據庫、中間件、辦公軟件等。目前,國產(chǎn)化節奏正處于從“可用”向“好用”的進(jìn)化階段,終極形態(tài)或為包含軟硬多個(gè)層次的生態(tài)系統,應用領(lǐng)域也從信創(chuàng )始于黨政及特殊領(lǐng)域,逐步向其他行業(yè)拓展。
操作系統:國產(chǎn)化生態(tài)建設可期
操作系統是計算系統的核心底層基礎軟件,負責控制、管理、調度整個(gè)計算系統的硬件資源和軟件資源。據億歐智庫預計,2021-2023年國產(chǎn)操作系統市場(chǎng)規模增速分別為29.98%、29.98%、30.01%。劃分技術(shù)路線(xiàn)來(lái)看,按照數據處理的實(shí)時(shí)性可以主要分為實(shí)時(shí)操作系統和分時(shí)操作系統。目前國產(chǎn)操作系統相比國外仍然存在差距,主要體現在硬件適配、內核理解以及基礎外圍軟件建設三個(gè)維度。我們認為,國產(chǎn)操作系統追趕的關(guān)鍵在于操作系統、用戶(hù)、配套軟硬件開(kāi)發(fā)商共同推進(jìn),共同建設國產(chǎn)化生態(tài)。
數據庫:分布式數據庫或成市場(chǎng)新增量
隨著(zhù)計算架構遷移、計算載體演進(jìn)以及計算環(huán)境變化,數據規模大幅增加,數據結構發(fā)生變化,傳統的關(guān)系型數據庫在高并發(fā)、分析等方面存在一定的劣勢,應運而生的分布式數據庫能夠較好地滿(mǎn)足大數據分析的需求,或形成數據庫市場(chǎng)新的增量。我們預計2023年國產(chǎn)數據庫市場(chǎng)規模將達257.2億元,同比增長(cháng)30.01%。目前國內數據庫市場(chǎng)呈現新興與傳統廠(chǎng)商并存態(tài)勢,主要細分技術(shù)路線(xiàn)包括關(guān)系型、非關(guān)系型、集中式、分布式等等。國產(chǎn)廠(chǎng)商在細分領(lǐng)域內各具優(yōu)勢,國產(chǎn)化替代可期。
工業(yè)軟件:長(cháng)期看好工業(yè)軟件國產(chǎn)替代機遇
2011年以來(lái)我國工業(yè)增加值穩居世界第一,工業(yè)軟件市場(chǎng)需求潛力龐大。據前瞻產(chǎn)業(yè)研究院預計,2021-2026年國內工業(yè)軟件市場(chǎng)規模CAGR將達13.4%,有望保持較快增長(cháng)。工業(yè)軟件核心賽道包括研發(fā)設計、生產(chǎn)控制等環(huán)節。研發(fā)設計環(huán)節主要包括CAD、CAE、EDA等;生產(chǎn)控制環(huán)節主要包括MES、DCS、PLC等。我們認為,中國工業(yè)軟件行業(yè)發(fā)展的核心驅動(dòng)因素來(lái)自于外部刺激下內生需求的釋放。基于此,我們長(cháng)期看好國產(chǎn)工業(yè)軟件發(fā)展,關(guān)注有行業(yè)整合能力和產(chǎn)業(yè)鏈輻射能力的龍頭公司。
國產(chǎn)軟件:信創(chuàng )政策推動(dòng)下,國產(chǎn)替代可期
2021年計算機軟件板塊收入增速回升。我們對180家計算機軟件板塊上市公司進(jìn)行了統計,2021年軟件板塊總營(yíng)收3793億元,同比增長(cháng)13.7%,同比增速出現回升。主要原因:2020年疫情爆發(fā)基數較低;2021年疫情逐步控制,收入有所恢復。22Q1軟件板塊總營(yíng)收686億元,同比增長(cháng)9.2%,增速較去年同期有所下滑,主要與今年一季度疫情反復有關(guān)。
疫情好轉有望帶動(dòng)板塊估值修復。絕對估值方面,2021年初至今計算機行業(yè)估值整體呈現下降趨勢,PE(TTM)估值下從190倍左右下降至75倍左右,PS(TTM)估值下降近一倍;相對估值方面,計算機指數相對滬深300指數的PE比值下降明顯,2021年以來(lái)歷史最高點(diǎn)超過(guò)12倍,目前下降至5倍左右;PS比值略有波動(dòng),基本在1.5-2倍之間浮動(dòng)。但自今年5月以來(lái),行業(yè)估值下滑已趨緩,未來(lái)隨著(zhù)疫情好轉,計算機板塊業(yè)績(jì)預計有望回暖,估值有望修復。
企業(yè)端來(lái)看,過(guò)去一年國產(chǎn)軟件新勢力層出不窮。隨著(zhù)智能制造與工業(yè)互聯(lián)網(wǎng)的推進(jìn),我國制造業(yè)信息化需求不斷上升,軟件賽道國產(chǎn)玩家持續增多。2021年6月至今,計算機軟件板塊新上市公司共21家,主營(yíng)業(yè)務(wù)范圍涵蓋建筑信息化、醫療信息化、能源信息化等多個(gè)下游細分領(lǐng)域,覆蓋研發(fā)設計、生產(chǎn)制造、終端銷(xiāo)售等產(chǎn)業(yè)全流程。
政策端來(lái)看,信創(chuàng )采購等扶植政策出臺有望推動(dòng)軟件行業(yè)發(fā)展。2021年11月,工信部相繼發(fā)布工業(yè)綠色、軟件和信息技術(shù)服務(wù)業(yè)、信息化和工業(yè)化融合、大數據產(chǎn)業(yè)等“十四五”發(fā)展規劃,鼓勵軟件及相關(guān)行業(yè)發(fā)展的同時(shí),也對綠色發(fā)展、產(chǎn)品迭代及技術(shù)創(chuàng )新方面提出了新的要求。12月,第八屆全國人大常委通過(guò)《中華人民共和國科學(xué)技術(shù)進(jìn)步法》,首次對政府統籌采購科技創(chuàng )新產(chǎn)品進(jìn)行規定。國家政策的支持與行業(yè)規范新要求的提出,促進(jìn)軟件行業(yè)可持續發(fā)展。2022年,深圳和北京先后出臺信創(chuàng )產(chǎn)業(yè)扶持政策,其中深圳市發(fā)改委發(fā)布的《關(guān)于促進(jìn)消費持續恢復的若干措施》明確指出,新增關(guān)鍵信息基礎設施中信創(chuàng )產(chǎn)品的采購比例,黨政機關(guān)、國資國企不低于40%。
國產(chǎn)化替代涉及硬件及軟件等層次,從黨政試點(diǎn)進(jìn)一步推廣。國產(chǎn)化替代涉及從底層硬件到應用軟件的多個(gè)層次,具體來(lái)看,硬件層面包括主機及外部設備,具體涉及芯片、服務(wù)器、存儲、固件等領(lǐng)域;軟件層面包括基礎軟件及應用軟件,具體包括操作系統、數據庫、中間件、辦公軟件等。從推進(jìn)節奏看,我國的自主創(chuàng )新起始于黨政辦公領(lǐng)域,2018年開(kāi)始加速啟動(dòng),2019年實(shí)現了突飛猛進(jìn)的發(fā)展。我們認為,自2020年開(kāi)始,我國始于黨政及特殊領(lǐng)域、進(jìn)一步拓展至央企國企乃至關(guān)鍵行業(yè)的自主創(chuàng )新替代將迎來(lái)黃金發(fā)展期。
國產(chǎn)化節奏正處于從“可用”向“好用”的進(jìn)化階段。經(jīng)過(guò)多年的產(chǎn)品研發(fā)積累,國產(chǎn)基礎軟硬件體系目前已經(jīng)處于“可用”狀態(tài),但相比成熟的Wintel體系,國產(chǎn)基礎軟硬件體系在產(chǎn)品性能、軟件生態(tài)、用戶(hù)使用體驗等,以及未來(lái)可預見(jiàn)的售后、運維等還面臨眾多難題,正處于從“可用”向“好用”的進(jìn)化階段。
國產(chǎn)化終極形態(tài)或為包含軟硬多個(gè)層次的生態(tài)系統。從IT架構的組成看,底層芯片提供了重要的算力支持,固件則為重要的使用載體,操作系統提供了調度硬件資源,支撐上層應用的作用,應用軟件則是數據生成、沉淀的重要環(huán)節。對于自主創(chuàng )新、安全可控的需求貫穿了各個(gè)環(huán)節。我們認為,國產(chǎn)化的終極形態(tài)將包含CPU、桌面電腦、服務(wù)器等整機硬件產(chǎn)品和操作系統、數據庫、中間件等基礎軟件產(chǎn)品,辦公office、OA、安全軟件等應用產(chǎn)品以及在此基礎上的國產(chǎn)軟件集成。
基礎軟件:國產(chǎn)替代市場(chǎng)空間廣闊
基礎軟件產(chǎn)業(yè)鏈上下游產(chǎn)品需要高度適配。基礎軟件上游主要是芯片、網(wǎng)絡(luò )設備、存儲器、固件/IO設備以及整機等基礎硬件廠(chǎng)商,基礎軟件在計算機系統中作為接觸硬件的第一層軟件,需要根據基礎硬件的架構、終端特點(diǎn)等進(jìn)行開(kāi)發(fā),基礎硬件的下游主要是應用軟件以及系統集成廠(chǎng)商,應用軟件廠(chǎng)商需要根據上游基礎硬件及基礎軟件兩層架構完成進(jìn)一步的軟件開(kāi)發(fā),系統集成廠(chǎng)商負責對軟硬件做最后的集成并銷(xiāo)售給下游客戶(hù),可以看到每一環(huán)都需要產(chǎn)品之間的高度適配。
預計2023年國產(chǎn)操作系統市場(chǎng)規模將達56.2億元。預計國產(chǎn)操作系統市場(chǎng)將伴隨著(zhù)各個(gè)行業(yè)信創(chuàng )的深入而快速增長(cháng),黨政市場(chǎng)方面,國產(chǎn)化替換節奏從公文系統拓展到電子政務(wù)系統,并且隨著(zhù)向下沉市場(chǎng)的拓展,并入替換節奏的黨政機關(guān)體量也會(huì )激增。金融市場(chǎng)方面,國產(chǎn)化替代從由大型銀行、證券、保險等機構向中小型金融機構拓展,從郵件、OA等系統向核心及外圍業(yè)務(wù)拓展,并且在交通、能源、電信等多個(gè)行業(yè)也不斷涌現操作系統國產(chǎn)化替代的案例,據億歐智庫預測,國產(chǎn)操作系統市場(chǎng)規模會(huì )從2021年的33.3億元增長(cháng)到2023年的56.2億元,CAGR達30%。
預計2023年國產(chǎn)數據庫市場(chǎng)規模將達257.2億元。據艾瑞咨詢(xún),2020年中國數據庫市場(chǎng)規模為247億元,據億歐智庫,2020年國內數據庫市場(chǎng)國產(chǎn)化率約47.4%,計算得2020年中國國產(chǎn)數據庫市場(chǎng)規模為117.1億元。進(jìn)一步,據億歐智庫預測,2021-2023年中國國產(chǎn)操作系統市場(chǎng)增速分別為29.98%、29.98%、30.01%,又因為操作系統和數據庫的替換節奏類(lèi)似,因此我們假設,2021-2023年國產(chǎn)數據庫與國產(chǎn)操作系統市場(chǎng)規模的同比增速相同,計算得2021-2023年國產(chǎn)數據庫市場(chǎng)規模分別為152.2、197.8、257.2億元,對應國產(chǎn)化率52.1%、58.4%、65.9%。
操作系統:國產(chǎn)化生態(tài)建設可期
操作系統是IT產(chǎn)品的底層核心。操作系統,一般存在于計算系統中,比如PC、服務(wù)器、手機、其他智能終端等。在計算系統中,操作系統是核心底層基礎軟件,負責控制、管理、調度整個(gè)計算系統的硬件資源和軟件資源。具體來(lái)看,操作系統負責:處理如管理與配置內存、決定系統資源供需的優(yōu)先次序、控制輸入與輸出設備、操作網(wǎng)絡(luò )與管理文件系統,以及用戶(hù)的交互界面等。
國產(chǎn)操作系統廠(chǎng)商的技術(shù)路線(xiàn),按照數據處理的實(shí)時(shí)性可以分為實(shí)時(shí)操作系統和分時(shí)操作系統兩類(lèi)。并且存在按照特定行業(yè)及應用場(chǎng)景的需求而選擇的特殊操作系統路線(xiàn),主要包括網(wǎng)絡(luò )操作系統、分布式操作系統以及嵌入式操作系統。
分時(shí)操作系統,采用分時(shí)技術(shù)及多用戶(hù)交互的方式。作業(yè)處理上,其利用分時(shí)技術(shù),面向不同終端做時(shí)間切割后形成時(shí)間片,然后采用平等的時(shí)間片輪轉的方式為多個(gè)終端服務(wù),因為其作業(yè)運行輪轉速度極快,一般普通的終端用戶(hù)感受不到輪轉的時(shí)間間隔。交互上采取多用戶(hù)交互的方式,其在一臺主機上連接了多個(gè)終端,允許用戶(hù)根據系統響應結果進(jìn)一步提出新請求,且多個(gè)用戶(hù)共享主機中的資源,以此為基礎分時(shí)操作系統對交互式計算機進(jìn)行了推廣,并促進(jìn)了交互式軟件的開(kāi)發(fā)進(jìn)程。
分時(shí)操作系統中的Linux發(fā)行版,是信創(chuàng )廠(chǎng)商的主流技術(shù)路線(xiàn)。分時(shí)操作系統的優(yōu)點(diǎn)在于其采取多用戶(hù)交互的方式,有效增加了資源的使用率,并且可以進(jìn)行的人機交互的深度比較高,因此在民用及商業(yè)領(lǐng)域應用很廣,典型應用終端如桌面系統、車(chē)載終端、智能手機以及服務(wù)器等,常見(jiàn)的Linux和Windows都是屬于分時(shí)操作系統。因為當前操作系統國產(chǎn)化替代核心發(fā)生在黨政、金融、電信等行業(yè),主要涉及PC以及服務(wù)器,且分時(shí)操作系統中的Linux開(kāi)源,且有很多成熟的發(fā)行版,廠(chǎng)商可以快速獲取其源代碼及資源并進(jìn)行開(kāi)發(fā),所以國產(chǎn)信創(chuàng )廠(chǎng)商多選擇Linux發(fā)行版作為源系統進(jìn)行二次開(kāi)發(fā)。
不同Linux發(fā)行版的差別,體現在軟件包內容、管理器以及維護方上。一個(gè)發(fā)行版包括內核以及其上的軟件包,并由不同的維護方進(jìn)行收費和提供服務(wù)。內核上,一般都是基于統一的Linux內核,部分發(fā)行版可能進(jìn)行了強化。軟件包,主要指附加的軟件以及桌面環(huán)境等,內容上存在豐富度的差異,并且高效且操作簡(jiǎn)潔的軟件包管理器可以提升用戶(hù)體驗。維護方上,商業(yè)公司作為維護方,要付費但可以提供更好的技術(shù)支持,開(kāi)源社區作為維護方,免費但一般沒(méi)有技術(shù)支持,社區貢獻的軟件資源可能更為豐富。國產(chǎn)廠(chǎng)商主要選的Linux發(fā)行版包括Debian系(Debian及其衍生)以及RedHat系(RedHat及其上游代碼、衍生)。
實(shí)時(shí)操作系統(RTOS),通過(guò)優(yōu)先級排序實(shí)現實(shí)時(shí)任務(wù)處理。業(yè)務(wù)處理上,其根據優(yōu)先級處理任務(wù),通過(guò)時(shí)鐘管理功能將任務(wù)進(jìn)行定時(shí)處理和延遲處理,以此保證當外界事件或數據產(chǎn)生時(shí),能夠接受并以足夠快的速度予以處理,也就是核心保證實(shí)時(shí)性。互動(dòng)上,系統會(huì )周期性地對多路現場(chǎng)信息進(jìn)行采集,以及對多個(gè)對象或多個(gè)執行機構進(jìn)行控制,在典型的非實(shí)時(shí)操作系統中,用戶(hù)一般對操作系統的調度功能沒(méi)有任何控制,或者僅能提供了概括性的指導,并且僅限于訪(fǎng)問(wèn)系統中某些特定的專(zhuān)用服務(wù)程序。
實(shí)時(shí)操作系統多應用于工業(yè)以及汽車(chē)控制軟件領(lǐng)域。實(shí)時(shí)操作系統優(yōu)點(diǎn)在于高優(yōu)先級任務(wù)不需要時(shí)間片排隊,因此能優(yōu)先響應緊急任務(wù),在嚴格的時(shí)限內處理完事件,在工業(yè)自動(dòng)化、航空航天、國防、自動(dòng)駕駛、醫療等對時(shí)間敏感的場(chǎng)景應用很廣,因此國產(chǎn)主要是做工業(yè)以及汽車(chē)控制軟件的廠(chǎng)商會(huì )選擇該路線(xiàn),工業(yè)實(shí)時(shí)操作系統產(chǎn)品比如INTEWELL(東土科技)、RT-Thread(睿賽德科技)、LiteOS(華為)、ReWorks Cert(中國電科)等,當前主要向工業(yè)物聯(lián)網(wǎng)領(lǐng)域發(fā)展,汽車(chē)實(shí)時(shí)操作系統產(chǎn)品主要負責處理車(chē)輛行駛過(guò)程中的控制能力,產(chǎn)品如AUTO SAR(普華軟件)、GoldOS(中興新支點(diǎn))等。
我們認為,目前國內操作系統相比國外仍然存在差距,主要體現在:
硬件適配維度:國產(chǎn)操作系統適配硬件數量遠少于主流系統。以桌面操作系統為例,win10系統已完成對主流硬件的支持,但國產(chǎn)操作系統硬件適配情況卻與之存在較大差距,像中標麒麟桌面操作系統已完成的適配硬件數僅為40種。此外,國產(chǎn)操作系統基本都對國產(chǎn)芯片開(kāi)發(fā)了不同版本,但由于缺乏統一標準,導致軟硬件廠(chǎng)商適配工作量劇增,增加調試成本。
內核維度:國產(chǎn)主流操作系統對國外內核依賴(lài)度較高,對內核理解不深。國內較少開(kāi)發(fā)自有知識產(chǎn)權操作系統內核,主要因開(kāi)發(fā)操作系統內核存在較高難度,要與廠(chǎng)商合作兼容多種硬件驅動(dòng),需要投入大量人力和資金。開(kāi)發(fā)操作系統需要對內核具有較深理解。操作系統內核可實(shí)現支撐功能和管理功能。基于內核才可以進(jìn)一步構建包括桌面環(huán)境、資源管理器等基礎應用。以桌面環(huán)境為例,如果對底層不夠熟悉,所有的修改能力則會(huì )限于修改主題、字符串替換的能力,無(wú)法統一操作接口,調整設計細節,產(chǎn)品質(zhì)量也無(wú)法保證。
基礎外圍軟件維度:國內缺乏高質(zhì)量高優(yōu)化的編譯器。編譯器可將便于人編寫(xiě)、閱讀的高級計算機語(yǔ)言源代碼程序翻譯為計算機能解讀、運行的低階機器語(yǔ)言程序。國內芯片廠(chǎng)商多依賴(lài)于國外編譯器,例如飛騰、華為海思、申威、龍芯主要借助GCC編譯器。這主要因1)國外編譯器支持較多編程語(yǔ)言,穩定度高。2)由于編譯器需參考指令集將高級語(yǔ)言轉化為機器編碼適配多種主流指令集架構。國內在底層指令集和IP設計上較為落后,因此多采用IP授權或指令集授權方式開(kāi)發(fā)CPU產(chǎn)品,導致國內使用國外現成編譯器,對其依賴(lài)度較高。
我們認為,國產(chǎn)操作系統追趕的關(guān)鍵在于操作系統、用戶(hù)、配套軟硬件開(kāi)發(fā)商共同推進(jìn):
操作系統維度:從內核等角度提升操作系統可用性,吸引用戶(hù)使用,提升軟硬件開(kāi)發(fā)廠(chǎng)商開(kāi)發(fā)意愿。在通用操作系統領(lǐng)域,積累操作系統內核架構、多核/眾核CPU適配、內核安全、Runtime(運行時(shí))優(yōu)化、并發(fā)錯誤檢測等技術(shù)。在嵌入式操作系統領(lǐng)域,研發(fā)自動(dòng)駕駛、高性能實(shí)時(shí)插件等技術(shù),適配不同行業(yè),擴大操作系統適用范圍。
軟硬件開(kāi)發(fā)廠(chǎng)商維度:加強協(xié)作,開(kāi)放平臺端口,優(yōu)化適配問(wèn)題,引導軟硬件開(kāi)發(fā)商基于國產(chǎn)系統操作系統進(jìn)行開(kāi)發(fā)。借鑒安卓系統經(jīng)驗,它憑借更開(kāi)放的軟硬件生態(tài)實(shí)現了彎道超車(chē)。安卓系統由開(kāi)源項目AOSP和GMS服務(wù)組成,可將核心軟件本體以開(kāi)源形式供給移動(dòng)設備廠(chǎng)商,提供手機產(chǎn)品差異化空間,帶動(dòng)軟件硬件開(kāi)發(fā)商搭建生態(tài)體系。GMS部分則可強化谷歌對軟件的控制和監管,收緊分散碎片化的安卓生態(tài)圈。正是基于這兩項架構的優(yōu)勢,安卓得以在手機操作系統市場(chǎng)形成軟件生態(tài)優(yōu)勢。
用戶(hù)維度:通過(guò)信創(chuàng )政策、校企合作等方式提升國產(chǎn)操作系統的滲透率,提高用戶(hù)對國產(chǎn)Linux操作系統的接受度。信創(chuàng )即信息技術(shù)應用創(chuàng )新,信創(chuàng )政策可推動(dòng)信創(chuàng )產(chǎn)業(yè)在部委、央企、民營(yíng)企業(yè)等范圍的實(shí)踐和應用,以培育市場(chǎng),形成示范引路,并將其延伸至 “2+8+N”多個(gè)行業(yè)應用領(lǐng)域。目前國內對基于Linux的操作系統仍有較低的接受度,而增強校企合作,設立和推進(jìn)中小學(xué)Linux課程,則可逐步提升學(xué)校、家長(cháng)、學(xué)生乃至社會(huì )對國產(chǎn)操作系統的認知度。同時(shí)操作系統廠(chǎng)商也要加強院校的產(chǎn)教學(xué)研合作,為產(chǎn)業(yè)輸送源源不斷的動(dòng)力人才。
數據庫:分布式數據庫或成市場(chǎng)新增量
數據庫的發(fā)展與計算載體緊密相關(guān)。數據庫是計算機行業(yè)的基礎核心軟件,所有應用軟件的運行和數據處理都要與其進(jìn)行數據交互。數據庫的開(kāi)發(fā)難度,不僅體現在與其他基礎器件的適配,更在于如何實(shí)現對數據高效、穩定、持續的管理。從數據庫的發(fā)展歷程來(lái)看,計算架構的變化,計算載體的變化、計算場(chǎng)景的變化,以及計算數據格式的變化都對數據庫的發(fā)展帶來(lái)一定的影響。或者說(shuō),在以上計算環(huán)境變化下,其需要的數據庫類(lèi)型也發(fā)生了變化。
從計算載體來(lái)看,數據的計算從原來(lái)的大型機、到小型機、個(gè)人電腦PC、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、云計算,以及未來(lái)更多終端的物聯(lián)網(wǎng)智能終端。計算的載體更加多樣化。
從計算場(chǎng)景來(lái)看,數據計算也從單獨的單機計算,到互聯(lián)網(wǎng)多群體交互的聯(lián)網(wǎng)計算和云計算,以及萬(wàn)物互聯(lián)的高并發(fā)、低時(shí)延的物聯(lián)網(wǎng)計算。
從計算架構來(lái)看,傳統的IT架構也正逐步向云架構遷移。傳統的IT架構從C-S架構逐步發(fā)展到了B-S架構,而目前的云原生、分布式計算架構正對傳統計算架構帶來(lái)深刻變革。而新的計算架構也對計算的基礎軟件(操作系統、數據庫、芯片等)提出更高的需求。
在以上計算環(huán)境的變化下,我們看到,聯(lián)網(wǎng)的數據也在發(fā)生深刻變化。
數據的大小。目前聯(lián)網(wǎng)數據量也在高速增長(cháng)。通信技術(shù)的發(fā)展帶動(dòng)從2G到3G、4G、5G的演進(jìn),每代通信技術(shù)之間,聯(lián)網(wǎng)的數據規模也呈現(幾個(gè))數量級的增加。對大容量、高性能計算提出更高要求。
數據的類(lèi)型。計算場(chǎng)景的演變,我們對數據的定義也在發(fā)生變化。圖片、語(yǔ)音、視頻等非結構化數據成為增量數據的主要類(lèi)型。聯(lián)網(wǎng)的數據類(lèi)型也逐步從原來(lái)的結構化數據到非結構化數據演變,這就對計算的并發(fā)性提出了更高的要求。
數據的快慢。對數據的高速計算是計算機一直以來(lái)的追求。但原有的IT架構下,計算速度的提升存在一定的物理條件限制。經(jīng)典的IT架構已經(jīng)存在了幾十年的歷史,當時(shí)的IT架構并沒(méi)有完全考慮到目前計算場(chǎng)景的變化。因此,新的計算場(chǎng)景下,對數據高速計算的追求,需要我們從底層基礎軟件的變革開(kāi)始。我們看到無(wú)論芯片、操作系統還是數據庫,都在經(jīng)歷深刻變革。
在以上計算和數據多個(gè)維度變化的情況下,我們認為,數據庫行業(yè)也正在經(jīng)歷歷史演進(jìn)的深刻變革。在傳統計算環(huán)境和數據類(lèi)型方面,傳統數據庫依然發(fā)揮比較重要的作用。但在面向未來(lái)新的計算場(chǎng)景方面,我們需要的可能是新型的數據庫產(chǎn)品。這種新型數據庫,是計算架構遷移、計算載體演進(jìn)以及計算環(huán)境變化之后的產(chǎn)物;同時(shí),也是數據規模大幅增加,數據結構變化之后所需要的產(chǎn)品。
全球關(guān)系型數據庫市場(chǎng)增速漸趨平穩。數據庫誕生于上世紀60年代,傳統的數據庫產(chǎn)品面臨的是以事務(wù)型、交易處理為主的任務(wù),事務(wù)支持性能較好的關(guān)系型數據庫如Oracle、DB2迅速興起。而近年來(lái),傳統的關(guān)系型數據庫市場(chǎng)增長(cháng)漸趨平穩,據Gartner,2021全球數據庫管理系統(DBMS)市場(chǎng)規模達800億美元,同比增長(cháng)22.3%,增速達到近十年峰值。但關(guān)系型數據庫市場(chǎng)增長(cháng)漸趨平緩,據T4.ai預測,全球關(guān)系型數據庫市場(chǎng)規模2018-2022E CAGR為6%。
數據量上升催生分析需求,數據庫市場(chǎng)新機遇顯現。隨著(zhù)智能移動(dòng)手機的普及及云計算的興起,全球數據產(chǎn)生量不斷上升,從2010年的1.2ZB上升至2021年的54ZB。未來(lái)幾年內隨著(zhù)各類(lèi)智能物聯(lián)設備的推廣以及云計算的進(jìn)一步應用,數據量有望進(jìn)一步上升。隨著(zhù)數據量上升,大數據分析的需求逐步顯現,傳統的關(guān)系型數據庫在高并發(fā)、分析等方面存在一定的劣勢,應運而生的分布式數據庫能夠較好滿(mǎn)足大數據分析的需求,或形成數據庫市場(chǎng)新的增量。
國產(chǎn)數據庫廠(chǎng)商的技術(shù)路線(xiàn):按照數據庫存儲數據方式的不同分為關(guān)系型和非關(guān)系型兩條路線(xiàn),按照不同的系統架構分為集中式和分布式兩類(lèi),按照數據庫應用類(lèi)型的不同還可以分為OLTP、OLAP、HTAP。
關(guān)系型數據庫vs非關(guān)系型數據庫。根據數據存儲結構區分,可以分為關(guān)系型數據庫、非關(guān)系型數據庫,其中非關(guān)系型數據庫根據存儲方式又可以分為鍵值數據庫、列數據庫、文檔數據庫、圖數據庫等。非關(guān)系型數據庫在讀寫(xiě)性能、擴展性上具有一定的優(yōu)勢,因此較適應大數據、高并發(fā)等場(chǎng)景,而關(guān)系型數據庫具備強一致性,遵循ACID原則,因此在事務(wù)支持中具備優(yōu)勢。
集中式數據庫vs分布式數據庫。根據系統架構分,可以分為集中式數據庫、分布式數據庫。分布式數據庫在可擴展性、高并發(fā)支持方面具有優(yōu)勢,集中式數據庫在事務(wù)性支持上遵循ACID原則,在事務(wù)支持上具備優(yōu)勢。分布式數據庫的優(yōu)劣勢與非關(guān)系型數據庫類(lèi)似,而近年來(lái),分布式數據庫不斷發(fā)展,在提供高彈性、支持高并發(fā)的同時(shí),與關(guān)系型數據庫強事務(wù)性支持的特性進(jìn)一步結合。
OLTP vs OLAP vs HTAP:按照數據庫的應用類(lèi)型,可以分為OLTP(事務(wù)型數據庫)、OLAP(分析型數據庫)以及HTAP(混合事務(wù)分析處理),OLTP主要針對實(shí)時(shí)數據,關(guān)注最近一段時(shí)間的數據,響應及時(shí)性要求很高,常見(jiàn)的事務(wù)型數據庫有Mysql、MangoDB等。OLAP主要用于在大量數據中分析規律的,通過(guò)查詢(xún)分析規律趨勢,用于產(chǎn)品決策等。隨著(zhù)時(shí)間的推移,演進(jìn)出了混合OLTP和OLAP的HTAP(混合事務(wù)分析處理),其既可以應用于事務(wù)型數據庫場(chǎng)景,亦可以應用于分析型數據庫場(chǎng)景。