X

中国数据库产业的“高地战事”

作者 | Aholiab

出品 | CSDN(ID:CSDNnews)

随着5G技术的飞速发展,海量数据的持续激增,大数据时代数据库行业也迎来了快速增长。

作为大数据存储、处理、分析的关键系统,基础软件核心之一,数据库对推动中国互联网信息行业发展至关重要。据 Gartner 统计,2018 年全球数据库软件市场规模 461 亿美元,预计 2021 年将达到 549 亿美元,预计年复合增速 9.1%。2009 年我国数据库软件市场规模为 35.03 亿元,2017 年我国数据库软件市场规模增长至 120.00 亿元。8年时间内,我国数据库软件市场始终保持平稳增长,年均复合增长率为 17.5%,且增速呈现递增趋势。根据中研产业研究院估计,到 2020 年,我国数据库软件市场规模预计达到 200 亿元。但市场份额的大部分,被 Oracle 等国际厂商占据。

另一方面,在市场增长与技术升级的双重机遇推动下,众多国产数据库在市场上涌现。阿里巴巴的 OceanBase、华为的 GaussDB 以及传统的南大通用、人大金仓等“老四家”最被人所熟知。也有更多新兴数据库企业,找准了在更加细分的赛道优势打开局面,有的甚至登上了技术标准的高地。

为了从企业实践应用角度更深入分析如何协调产品技术和产品管理的冲突;探讨建立行业标准对中国数据库发展的重要意义;了解中国数据库发展历程和未来方向, CSDN 对柏睿数据董事长刘睿民先生进行独家专访。刘睿民先生是柏睿数据创始人,同时兼任技术研发的首席科学家。早年获得新加坡电信海外全额奖学金赴美科罗拉多大学 Boulder 分校攻读博士。同期加盟惠普实验室主攻海量并行 MPP 数据库,之后先后参与 NonstopSQL/MP,SQL/MX 及 Neoview 的预研及实现。2014 年,刘睿民创立柏睿数据,到目前已经完成了 C 轮融资。柏睿数据针对海量数据实时分析处理的需求,研发国内首个海量并行 MPP 内存数据仓库引擎,进而完善打磨海量并行 MPP 全内存数据库系统—RapidsDB。产品已应用于电信、制造业、金融等多个行业,突破了外国厂商在内存数据仓库的垄断。多年的数据库行业从业经验磨练了刘睿民先生看待行业发展的独到眼光,今天就跟随我们,从企业角度纵观中国数据库行业的过去和未来。以下为采访精华,话不多说,让我们一起看看!

刘睿民

优势积累,做市场需要的产品

CSDN:请先介绍一下柏睿数据当前的工作重点。

刘睿民:柏睿数据当前的工作重点主要有两个方面:

第一是数据库标准方面的工作,这是我们一直比较薄弱的环节。一直以来,我国在数据库产品领域现在没有一个严格的官方标准。今年我们很重要的一个任务,是要把数据库的国家标准也给制订出来。这一点很重要,因为只有有了国家标准,其他的国内的厂商才有规可依,否则很多地方没办法真正去体现国内数据库的优势和特性。柏睿数据有国际标准的制定经验,因此在工信部和信标委的指导下,我们联合了国内华为、阿里等很多厂商一起共同来做这件事,我们也承担了相应的职位。

第二是继续打磨产品。在当下激烈的市场竞争中立足,产品就是那个“1”,没有过硬的产品,及时后面再多0也无济于事。在产品研发的过程中,还要更加重视技术的原始创新。过去大家对技术的原始创新不是很重视,近年来由于国际形势的变化,问题变得越来越突出,市场对自有技术的需求也激增。短时间内的需求激增,对于研发团队的效率要求一下变得很高。过去柏睿的整体工作来说都比较平稳,但目前就面临着“如何能在最短的时间里做出成果”的问题,也是我们目前最重要的一件事。

CSDN:柏睿有很多的产品、服务,能总体介绍一下目前的产品体系吗?

刘睿民:一直以来柏睿的产品基本上都是全内存分布式数据库、全内存流数据库、数据库内人工智能并行算法库,然后再加上跨源异构数据连接器,以及数据库加速&安全芯片,这主打的五个产品。

在今年年初柏睿又发布了两款产品,一个是数据编织 DataFabrics,一个是自动化人工智能 AI WorkFlow,我们的产品系列基本上跟 Databricks 的产品是一致的,产品上发布的时间也很接近。

我们的产品体系总体上是围绕大数据实时分析处理来构建,让数据处理分析的速度更快、突破不同数据源、不同类型数据的限制,实现海量数据的实时分析,同时让数据分析变得更加智能,这是大数据发展的必然趋势,也是市场给我们提出需求。

CSDN:目前这些产品有哪些比较典型的或者优质的应用案例呢?

刘睿民:柏睿产品的应用案例比较多,全世界单一市场最大的运营商是广州移动,拥有一亿多用户。很多欧洲、美国的运营商也很难达到这个数字,从客户层面来说这是一个非常大的客户群体。除此之外,柏睿做的上海企业信用平台在全国也是名列前茅,能跟上海的体量相比的企业信用案例是非常少的,这也是我们的特色案例。

在港口、制造业、汽车方面同样也有很多案例,因为数据库本身应用范围非常广阔,所以它在每个行业都有相当的应用。

主导数据库国际标准,做了华为、阿里没有做的事

CSDN:你认为国内目前的数据库产业全景图是怎样的?和外国相比我们处在什么水平上?

刘睿民:现在国内数据库的版图和以前相比基本上变化不大。在以前,传统的数据库企业起步做得其实很好。在当时的版图下,主要是南大通用、神州通用、人大金仓、达梦四家企业。近来出现了一些新的企业比如华为,还有一些较小的企业,做的领域也相对狭窄一点,或者在某一个小的领域里去做新的尝试。

我国数据库行业的发展还有很长的路要走,现在数据库行业里面的实践只是做了一些新的尝试。比如用中间件的方式来加速,这种方式相对原来的调优更高级,但是没有发生根本性的改变,执行引擎包括底层的编译层都没有发生实质性的变化。很多还是对别人开源的数据库里面的组件复用,再做优化,至今还处在优化的层面上,没有到创新发明的层面,所以目前相对来说处在比较初级的阶段。

CSDN:柏睿为何要参与到数据库标准制订当中?意义是什么呢?

刘睿民:有了领先于市场的技术和产品之后,我们就该思考如何将其推向更广阔的市场,如何巩固技术优势!制定标准除了让技术更加容易推广之外,还意味着你在这个领域的影响力和话语权。在数据库领域,我们长期以来是缺席的,柏睿数据参与到国际标准制定当中,为的也是要打破这种局面。

2015 年,我们开始根据所掌握的技术进入国际标准化组织(ISO)工作组做《SQL9075 2018 流数据库》国际标准,那时国际国内对这一标准基本上没有概念,不知道数据流通过怎么样的方式去处理,当中运用一些何种的函数,完全没有概念。即使是数据库行业里的专家,很多人对数据库标准都不是特别清晰,想怎么做?数据库标准到底有什么意义?最大的用途在什么地方?

我们花费了 4、5 年的时间来推动这项工作,中间也遇到了很多竞争和阻碍。在 2016 年的草案通过以后,有其他国家想要阻挠我们的标准,它提出另外一套提案,希望把我们的提案替代掉,说的话理由都比较荒谬。大概在 2018 年,所有的标准基本上完稿,中国也变成了一个非常重要的数据库的应用市场,也有了自己做数据库的基础,不得不说,中国的数据库领域力量变的越来越强。「数据库的标准在制订当中」的这个事实,让外界开始认识到中国在数据库领域有新的公司出现、新的力量产生,这是中国整个科技行业最大的改变。

CSDN:你认为未来 10 年数据库行业应该往什么样的方向去发展?

刘睿民:从美国硅谷的情况来看,数据库的趋势基本上是两个方面:

第一是云原生,是依靠云计算里面的各种附件重新去建构数据库,数据库完全扎根于云计算上。

第二是全内存的数据,代表另外一种方向。

云原生数据库,服务的更多的是刚开始使用云计算的用户,商业模式是基于云计算,因此它使用云原生的数据库,自然而然变成了一种服务。

另一个趋势是以性能为主,这也是柏睿数据为什么要走全内存的数据库研发路线的核心诉求。数据智能系统对实时性的要求越来越高,在数据量大幅提升的情况,要求数据库分析处理数据的速度万倍、十万倍的提高。就像功能手机和智能手机,存在质的提升。

技术为本,归国入海搏杀

CSDN:按照你的履历,你之前在硅谷 IT 界头部的企业工作,是什么契机让您回到国内创业建立柏睿数据?

刘睿民:对于一个中国人来说这是一个自然而然的过程,同时也与国内的产业发展有关。2004 年,我担任中国华胜天成的 CTO 期间,达成了迄今为止都是最大的客单,涉及中国邮政、湖南移动、移动等公司的数据库项目。慢慢我们会发现中国的数据库市场规模逐渐呈现出几何式的增长。

在中国市场,数据库产品是以一个销售商品的概念进来的。没有研发,没有产品,产品核心技术掌握在别人手上,这是致命的问题。中国当时没有自己的数据库。既然市场有需求,我们有资源,与其命运掌握在人家手里,那么不如我们来填补这个空白。

CSDN:作为技术出身的管理者和企业家,你认为技术出身对于公司的管理当中有哪些优势?或者说又有哪些挑战?

刘睿民:精益求精是我过去在搞科研搞技术过程中那些导师们、大牛们教给我最最重要的品质,我也希望把他们带给我的品质传递到我所创办的企业当中,不论是企业哪一方面的工作,我们都力图达到较高的标准。比如说柏睿数据跟别的企业最大的差别就是劳动生产率高,人平均签单将近150万,在IT公司、数据库公司里面很少能达到这种数据。

作为数据库企业来说,它是技术带动的。长期在技术一线对于企业发展方向的把握,也能够帮助企业在竞争中保持好步伐。