从1970 年,关系数据库之父E.F.Codd在其论文中首次提出关系模型的概念算起,数据库的历史长河已经流淌了整整52年。在当中很长的一段区间内,都是商业数据库在信息化时代构建起的难以撼动的商业帝国。
直到2000年之后,MySQL、PostgreSQL等开源数据库逐渐诞生,正式终结了传统数据库只有唯一性选择的格局。但开源数据库由于部署和升级的难度,在企业级市场依然进展缓慢。直到云的出现,在2014年之后,在开源数据库的基础上,云原生数据库开始了对数据库市场发起新的挑战。2022年 5月,Google Cloud 发布了主打HTAP的云端数据库 AlloyDB, 2022 年6月,Snowflake发布了主打HTAP 的Unistore, 加上之前Oracle MySQL Heatwave,微软Azure 、AWS 、阿里云的HTAP 产品,所有热门云厂商到2022年中都开始下注HTAP,Gartner甚至说 HTAP已经成为进入云数据库市场的筹码,这个或许要从PingCAP的创业史和他们最近一个线上发布会才能找到答案。专注于企业级开源分布式数据库的PingCAP,诞生于2015年。围绕着开源和云两个关键标签,7年来,PingCAP只专注做一件事:分布式关系型数据库“TiDB”。
“站在七年前的那个时间点,我们发现数据库技术正在经历一个重大的变革,从一个单机系统开始变成一个分布式系统。”PingCAP 联合创始人兼 CTO黄东旭说,“既然有了一个重新去做数据库的机会,我们就希望从第一天起,这件事就要做对。”但创业这条路何其艰难,况且又是数据库这样的基础技术创新,更是难上加难。黄东旭坦言,“最难的事情并不是如何做一个数据库这样的产品,能够证明它是可用的,这要比做出数据库的产品要难上许多。”的确,近年来在整个行业内,都比较少有从零起步迈向成功的基础技术公司。不仅因为基础技术横亘在前方的都是垄断级别的巨头公司,也因为企业级用户主观上并不会轻易动摇已被验证几十年的架构和系统。要知道,今天的用户都经过了几十年IT建设的磨砺,他们会要求产品和技术上必须要有明显的差异化,还要第一时间让用户知道你的价值。PingCAP树立起第一个差异点,就是对MySQL数据库的全面兼容,TiDB的第一个版本就做到了这一点。“MySQL 数据库在诞生时,没有考虑过互联网业务会面临庞大的数据,因此当用户的业务增速特别快的时候,数据库是最难扩展的点,所以谁能帮助客户把扩展性背后的痛苦减轻一点,谁就能比较容易的进入市场。”黄东旭说。当然,解决了差异化,为产品扫清了进入市场的基本障碍之后,PingCAP才只能算是刚刚起步。从0到1的创造过程固然艰辛,但相比之下,从1到N的发展过程,就更为艰苦。用户凭什么在自己的核心系统里用你的数据库,对你的产品建立信任?即使你的产品足够好,但凭什么让每一个客户都清楚地认知你的品牌?即便获得了客户的信任,作为一个新的产品,你有什么能力保证产品的成熟度,能够在客户的系统中保持稳定的运行?不知道,有多少创业公司,倒在了这致命的“三问”之下。黄东旭认为,“这三个问题都会集中到一个本质,就是软件本身的进化速度,只要产品迭代的速度足够快,绝大多数的问题都会迎刃而解。”可是,发现问题并不等于能够解决问题。PingCAP要如何通过提高迭代速度,迈向成功?随着计算机和互联网技术的兴起,开源技术对整个移动互联网时代的软件架构创新都起到了重要的影响。开源软件在操作系统、编译工具链、数据库、WEB服务器等各个方面都向主流赛道发起挑战。相比传统商业软件,开源软件的成熟与发展,可以为客户提供更高质量,更好支持和更多灵活性的选择。我们说,天下武功,唯快不破,在加快产品迭代速度这一点上,开源软件本身就具备了天然的优势。因此,TiDB找到的第一个增长引擎,就是通过开源来最大程度上的加快软件的迭代速度。“开源社区当中,开发者、贡献者、布道者和用户形成了飞轮效应,让软件的迭代速度变得更快。” 黄东旭说。的确,开源也在改变数据库的格局。但近年来局面正在迅速改变,年初的一份DB-Engines数据显示,全球383款数据库中开源数据库占据51.7%,六款开源数据库进入到前十,开源数据库流行度首度超过非开源数据库。TiDB 也已成为2021年全球数据库技术开源项目热度排行榜第三,也是中国开源项目活跃度排名第三的项目。有了开源社区的飞轮,TiDB的版本迭代频率可以提升到每个月,这种速度已经是所有传统软件所无法想象的。那么,有没有可能让这种迭代的速度,还能够更进一步?变得更快呢?而这就是云能够提供的价值。在云的开发环境下,可以做到以天甚至以小时为单位去改进产品。正是通过这种快速的迭代节奏,TiDB做到了与时俱进,根据用户的需求迅速做出调整,让它总是保持在用户最需要的“模样”。实际上“与时俱进”,恰是在云时代,能够对用户提供最大价值的重点。因为企业用户在面对不断变化的场景和需求,它们越来越不介意采取的技术到底是不是开源,关键在于,你的产品和技术能不能帮助用户,更快的走向市场,你的产品价值如何在用户的市场节奏中为用户提速。也就是说:真正的迭代速度或者说更有价值或更有意义的迭代速度,在于你的软件怎么帮助应用开发者更快地开发出他的应用。这才是TiDB通过不断进化,所要实现的目标。TiDB 从 V6 开始,正式进入到“开源+云”的混合开发模式,保障了 TiDB 的高速成长。云时代,为千行百业带来了新业务创新的机遇,但同时也带来了巨大的系统压力。比如疫情期间,餐饮行业迎来了外卖大爆发,面对潮水般涌来的订单,系统很容易就会走向崩溃;大型商业银行的信用卡系统,MySQL 分库分表架构无法应对数据库的暴增与应用的快速变迁;新零售、智能制造企业中的门店销售经理希望当天就能从系统里查到销售报表,而不是月底。这些“幸福”的烦恼,正考验着一大批中国优质企业,这其中既有处于数字化转型中的传统企业,也包括新一代的泛互联网企业,以及大型消费类制造业等中国数字原生企业。他们都面临着数据库带来的挑战:原有 的 RDS 无法解决持续增长的扩展性问题,尤其在2022年,很多国内企业加速全球化,但因为诸多客观因素的影响,面临着投入预算减少、运维预算降低等难题,他们更希望简化数据架构,在同一个交易系统里同时分析订单数据、用户画像等。要解决这样越来越普遍的问题,本质上需要一个创新的数据架构。开源与云的结合,把快速的迭代和多云部署的敏捷度糅合在一起。带给企业新的价值,这就是:数据敏捷。而 HTAP 和云原生则是数据敏捷的核心能力,这两项技术的结合带来了新一代数据库,让用户已以更简单和更便捷的方式使用数据,看上去是在用一个简单版的数据库,但实际上却具有双向大规模的扩展能力,用户可以更加关注数据,更加关注业务增长本身。这种趋势现在已经在 Snowflake 和 GCP 的 AlloyDB 身上得到了验证,而 TiDB 则在多年间一直致力于此,有明显的先发优势。这种数据敏捷能力带来的价值是,TiDB 可以实现“一种经典的 SQL 体验,一套整体能力,多种部署形态”的用户体验,既支持多云部署(AWS、GCP、阿里云)、也可以私有部署,而用户获得的 TiDB 核心能力完全一致,从而满足企业用户多元化的部署要求。因此在多云环境下,如果企业只选一种数据库的话,那么TiDB就是其最好选择。目前,TiDB发布的 TiDB Cloud ,依托于公有云提供开箱即用的全托管 TiDB 服务,已陆续登陆亚马逊云科技 Marketplace、Google Cloud Marketplace,在国内市场, TiDB 还上线了阿里云云市场。形成了开源、多云的数据服务生态,为全球千行百业的用户提供一致的数据服务。如今,云原生,数据库技术和人工智能,这三项技术已经汇聚成了新一代数据库最重要的云服务模式。这在TiDB当中也有体现,例如智能诊断服务 PingCAP Clinic,大幅增强了 TiDB 作为企业级数据库产品的可管理性和可观测性,降低了技术选择背后的隐性成本。客观地说,今天的TiDB,已经不是刚刚步入开源之路的小软件,而是已经服务了全球超过 2000 家企业用户的最佳实践,通过快速的产品迭代,作为伴随企业走向数字未来的数据库。过去一年,TiDB也在全球范围内受到了广泛的认可。几天前,Gartner 发布了云数据库市场领域 2022 Gartner Peer Insights“Voice of the Customer” 报告,PingCAP 是唯一入选的中国分布式云数据库服务商,客户总体评分达到 4.7 分(满分 5 分),在所有入选企业中位列第一;同时在DB-Engines排行榜中,TiDB也是中国唯一入选的top榜单100,以及关系型数据库Top榜单50的产品。命运总会垂青有准备的人,TiDB从蹒跚学步的少年,一步步走到成熟,正是不断的试错,迭代中历练出来的结果。插上了开源和云原生两支翅膀,PingCAP也踏上了高速成长的飞轮,为广大 MySQL 用户提供了一种既熟悉的,又创新的选择。
原件地址:云厂商都在下注的HTAP,到底发生了怎样的转向?
版权声明:本文来源网络整理,不代表本站观点。分享本文章目的在于学习,如有侵权,请邮件告知删除,本站将在收到删除告知信息的情况下,24小时内删除,并给予道歉,谢谢支持!请使用微信客户端打开页面并长按下方二维码关注我们,或者微信直接搜索文库网。
[ 微信公众号ID:WENKUNET ]