每经编辑 赵云 肖勇
10月2日,在浓浓的国庆气氛中,一场“技术阅兵”在大洋彼岸上演。
结果再添喜气:继5G移动通信和高端芯片之后,中国公司在又一个“核高基”领域取得了重大突破。
据科技日报报道,蚂蚁金服自主研发的数据库OceanBase打破数据库基准性能测试的世界纪录,成绩是前世界纪录保持者、老牌巨头甲骨文(Oracle)的两倍。数据库领域最权威的国际机构国际事务处理性能委员会(TPC,Transaction Processing Performance Council)在官网发表了这一最新结果。
丨这个技术有多厉害?
据了解,由TPC制定的TPC-C测试是衡量数据库在线事务处理(OLTP)能力的公认标杆,是全球主流计算机硬件厂商、数据库厂商公认的评价标准。
TPC-C性能以每分钟的新订单交易数量作为衡量标准。主要指标是交易速率(tpmC),还有每笔交易的关联价格($/tpmC)等。
TPC-C标准模拟了经典商品销售付款场景来做测试,通过每分钟创建新订单数量来评价数据库的性能和性价比。此前,甲骨文已垄断了9年冠军。
TPC官网截图
OceanBase以60880800 tpmC的成绩(即每分钟内系统处理的6088万多个新订单)创造了新的联机交易处理系统(OLTP)世界纪录。这一纪录,是甲骨文最好成绩的两倍多。
过去数十年,TPC-C一直是海外传统数据库厂商竞技的舞台,而OceanBase是登上TPC-C排行榜前列、由中国公司完全自主研发的第一款大型数据库产品。
中国工程院院士、计算机专家李国杰评价说,这是中国基础软件取得的重大突破!
丨数据库有多重要?
从1978年,“数据库”三个字首次出现在中国大学的课堂上,中国发展自己的数据库已经有40年历史。
数据库和操作系统一样,是IT行业的重要基础软件。用“卡脖子”的关键技术来形容数据库,一点也不为过。数字经济时代,一切经济工作都离不开数据,如果没有数据库,就没有信息科技发展的根本。
2006年,国务院发布《国家中长期科学和技术发展规划纲要(2006-2020年)》,提出“核高基”的概念。“核高基”是对核心电子器件、高端通用芯片及基础软件产品的简称,同时也是与载人航天、探月工程并列的16个重大科技专项之一。其中,基础软件就包括数据库、操作系统、中间件等。
资料图(图文无关,来源:摄图网)
不过,据微信公众号“InfoQ”介绍,数据库从诞生起已经有几十年的时间了,但基本上它的市场格局就没有多少变化,最早起来的几家厂商今天还是占据着统治地位。因为数据库非常难被替换,它处在整个产品或者产业链最底层的位置,替换风险很大,但收益相比起来却小得多。
时间回到1997年,当时国内在数据库服务上处于对甲骨文的“全面依赖”。甲骨文创始人拉里·埃里森(Larry Ellison)首次到访中国,因为他晚起床让中国接待人员在零下二十几度的环境中等待了一个多小时。
然而接待人员却有些“敢怒不敢言”,因为我们的数据库技术完全依赖于甲骨文。
彼时的中国,商业力量快速复苏,外贸进出口总额突破4000亿美元大关,相伴而生的,是信息技术需求的井喷。甲骨文的数据库,正是软件中最硬的核心技术。
于是,国内几乎所有机构和公司,从金融、电信到航空,清一色地使用甲骨文。
这意味着,中国人每一笔银行取款、转账,每一次充话费、买机票的数字,都储存和运行在美国的数据库上。
丨自主研发:从濒临解散到支撑每年“双11”
如今这个里程碑式的技术反超,背后是一代技术人的探索和攻坚。
此次以两倍优势反超的阿里巴巴一度是甲骨文中国的标杆客户,淘宝、支付宝等公司98%以上的软件系统和业务都由甲骨文数据库提供数据服务。但随着“双11”成为现象级商业活动,几何级增长的交易量把一个严峻的问题摆上台面:如果继续使用甲骨文,为了应对天量数据,只能再花上亿人民币购买主机。
他们选择了自主研发。
当时阿里有自己的数据库研发团队,但很多人不看好。毕竟甲骨文有十几万人,从事核心数据库研发的超过两千,而阿里数据库团队20多个人,团队负责人阳振坤此前在另一家大厂开发数据库,2010年才加入淘宝,选择建立这个项目组。
OceanBase的研发始于2010年6月,研发之路从一开始就磨难重重,中途因为找不到愿意使用的业务,团队曾经濒临解散。
视频截图(来源:微信公众号“InfoQ”)
转机发生于2012年底,OceanBase整个团队被调到了支付宝。2013年夏天,支付宝也开始启动“去IOE”,并希望能够把甲骨文数据库替换掉。阳振坤向当时的主管、也是现在蚂蚁金服的CTO程立自荐了OceanBase的解决方案。
(注:“去IOE”是阿里巴巴内部的一个概念。其本意是,在阿里巴巴的IT架构中,去掉IBM的小型机、Oracle数据库、EMC存储设备,代之以自己在开源软件基础上开发的系统。)
程立认可了阳振坤提出的方案,OceanBase团队开始埋头开发,第一个要攻克的目标是支付宝交易库。2014年“双11”,OceanBase迎来了第一次大考。
视频截图(来源:微信公众号“InfoQ”)
在一开始的计划里,“双11”交易流量的1%会切给OceanBase,但因为当时的Oracle数据库系统支撑不了汹涌而来的巨大流量,最后OceanBase成功支撑了2014年“双11”10%的交易流量。
经过了“双11”的考验之后,OceanBase得到了更多的认可和支持。
截自OceanBase官网
2015年春夏,支付宝交易库和支付库都换成了OceanBase;2016年,支付宝账务系统上线,这也标记着OceanBase真正在金融系统最核心最关键的领域站住了脚。
据悉,如今OceanBase已在蚂蚁金服和阿里巴巴业务系统中得到了广泛应用,凭借强劲的性能成为过去多年“双11”支付宝交易处理系统的守护神。数亿人能够随时随地网购、移动支付,背后靠的都是OceanBase数据库的力量。从2017年开始,OceanBase数据库开始对外开放,服务包括银行、保险等金融机构。
丨任重而道远
科技日报认为,OceanBase的崛起,不只是商业力量竞逐的结果,更有时代变革的红利。
此前,国产数据库之所以没有得到广泛使用,原因主要在于金融、电信、航空等关键行业必须确保数据库的可用和稳定,无法给新兴的国产产品试错空间。
而电子商务完全是新兴领域,“双11”的交易规模,完全超出甲骨文的经验范围,反而有了趟出一条新路的机会。
资料图(图文无关,来源:摄图网)
OceanBase是云计算时代中国数据库的代表。几乎同一时期,达梦、人大金仓、神通、南大通用等一批国产数据库都陆续应用到央企、国家财政、军事等专用领域。华为、腾讯等中国公司也纷纷推出了自己的数据库产品。
但与此同时,在底层核心技术突破、产业生态建设等方面,国产数据库仍面临挑战。
据第一财经报道,深耕数据库领域多年的南大通用首席技术官武新曾表示:甲骨文、微软等公司经过几十年的发展,建立起非常强大的生态系统,这种依存关系还将维持一二十年,而中国的生态系统仍然较为薄弱,这与缺乏技术基础积累有关。
数据库是支撑人工智能、区块链等新技术的基础技术,尤其是在核心敏感行业,自主可控意义重大。建设强大完善的自研数据库,中国技术人仍在“升级打怪”的路上。
(每日经济新闻综合科技日报、中国新闻网、微信公众号“InfoQ”、“量子位”等)
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。