11月19日在華為2019全球數(shù)據(jù)基礎設施論壇上,華為Cloud & AI產(chǎn)品與服務總裁侯金龍宣布全面啟動數(shù)據(jù)基礎設施戰(zhàn)略,并開源數(shù)據(jù)虛擬化引擎“河圖引擎”(HetuEngine)。
據(jù)悉,“河圖引擎”開源版本名稱為“openHetu”,開發(fā)者可基于開源代碼進行定制,主要包括數(shù)據(jù)源擴展、SQL執(zhí)行策略等。實現(xiàn)應用快速對接,提升開發(fā)效率。另外,該引擎將在2020年6月上線。
公開數(shù)據(jù)顯示,2018年中國的總數(shù)據(jù)量就已擁有7.6 ZB,至2025年中國的總數(shù)據(jù)量將躍升至48.6 ZB,全球總數(shù)據(jù)量達到125 ZB,可以說到2020年每天就有1.5 GB的數(shù)據(jù)量生成。但實際數(shù)據(jù)的利用量卻并不樂觀。
據(jù)了解,這款引擎主要針對的是大數(shù)據(jù)管理,讓開發(fā)者好似使用數(shù)據(jù)庫一般使用數(shù)據(jù),復用現(xiàn)有生態(tài)、工具、技能。主要體現(xiàn)在“一個目錄(1000+異地異構數(shù)據(jù)源)”,“一個入口(5000節(jié)點SQL引擎,實現(xiàn)30種異地異構數(shù)據(jù)源統(tǒng)一SQL訪問)”,“一份數(shù)據(jù)(CarbonData技術實現(xiàn)多場景分析和多應用共享)”,“統(tǒng)一安全(異地異構數(shù)據(jù)源集中式安全配置與管控)”。
此前9月,華為全聯(lián)接大會上指出,將進行“一云兩翼雙引擎”的鯤鵬計算機產(chǎn)業(yè)布局,其中,“一云”指的是華為云,“兩翼”指的是智能計算和智能數(shù)據(jù),“雙引擎”指的是“鯤鵬+昇騰”的雙引擎。
此次發(fā)布的引擎主要針對數(shù)據(jù)角度進行“平臺+生態(tài)”戰(zhàn)略的再升級。大會上,華為指出將通過對數(shù)據(jù)“采、存、算、管、用”實施端到端的整合和優(yōu)化,另外將基于“AI+存儲+華為云”,通過云上云下結合,云上訓練和云下推力讓系統(tǒng)越用越快。
不過這個引擎對比騰訊與阿里巴巴的引擎又有區(qū)別呢?目前來說,虛擬化引擎概念應該是華為在國內首次提出的,此前騰訊與阿里巴巴發(fā)布的相關引擎主要是數(shù)據(jù)中臺。這種技術也許對于近二十年來社會變革來說是最佳的。
目前來說,數(shù)據(jù)虛擬化是艱巨但又剛需的,隨著數(shù)據(jù)量的飛速上升以及應用范圍的拓寬,數(shù)據(jù)虛擬化就是必經(jīng)之路了。迄今為止,雖然數(shù)據(jù)虛擬化平臺并不鮮見,但真正將云與大數(shù)據(jù)世界拼接在一起的層、界面和抽象化展開進一步概述之路仍需繼續(xù)前行。
當然,能沿著“數(shù)據(jù)-虛擬化”路線走多遠,將取決于用戶業(yè)務需求和大數(shù)據(jù)環(huán)境的復雜性。此外,還取決于用戶對風險、復雜性和困難的承受程度。在未來,隨著分析模型、規(guī)則和大數(shù)據(jù)云上匯聚的信息日益復雜,平臺將成為虛擬化訪問、執(zhí)行和管理的核心。
相信通過華為的“平臺+生態(tài)”戰(zhàn)略的進一步實施,這個開源平臺將會為大眾帶來更多普惠。
(21ic原創(chuàng)內容,轉載請標明出處,作者:付斌)