×

开源会越来越落后?OceanBase杨传辉:开源和商业数据库都有生存空间

admin admin 发表于2024-05-01 12:20:03 浏览9 评论0

抢沙发发表评论

  近期,百度创始人、董事长兼 CEO 李彦宏称开源模型会越来越落后,引起行业对‘开源’技术的广泛讨论。不止在 AI 大模型领域,包括开源数据库等多个领域的重要从业者也对此表达看法。

  4 月 20 日上海 OceanBase 开发者大会上,OceanBase 首席技术官(CTO)杨传辉对钛媒体 App 等表示,仅从数据库领域而言,开源技术对于行业的意义非常重要,开源和商业化数据库都有一定的生存空间。

  “就开源和商业化定位来说,我认为,首先我要把开源做好,我一定要使开源出去的东西足够有诚意,能够真正解决用户核心痛点;但同时,开源之后又不能让这家公司完全不商业化,那也活不下去,最后开源社区也没了。在 OB 这里,数据库相当于发明的一个自行车,‘开源’是教你怎么去骑自行车,‘商业’是卖给你一个好的自行车,但你不会骑没用,开源对我们的商业化反而有助力。对 OB 来讲没有问题,我们可以把开源和商业很好地融合在一起。”杨传辉表示。

 OceanBase 首席技术官(CTO)杨传辉

  事实上,作为一款 100% 根自研的分布式数据库,OceanBase 持续践行一体化数据库的产品战略,以负载关键业务系统。

  2020 年,OceanBase 宣布独立商业化运作。当时 OceanBase 表示,在原有功能基础上增加分析型业务处理能力,OceanBase 将升级为一款支持 HTAP 混合负载的企业级分布式数据库。

  2022 年,OceanBase 发布 4.0 版本,从技术上首次突破分布式数据库的单机性能瓶颈,实现单机分布式一体化。目前在一体化上,OceanBase 已实现单机分布式一体化、TP/AP 一体化、云上云下一体化、多模一体化等,用一个数据库满足客户 80% 的场景需求。

  2024 年 4 月,OceanBase 发布 4.3 版本,推出列式存储引擎,打造 PB 级实时分析数据库,可实现秒级实时分析,进一步加强 TP/AP 一体化。现场跑分显示,在同等硬件条件下,OceanBase4.3 的 AP 查询性能已达到业内一流列存大宽表数据库同一水平。

  此次 OceanBase 开发者大会上,杨传辉表示,OceanBase 4.3 在 TP/AP 一体化上的进一步突破,也是 OceanBase 坚持 100% 根自研的产品力结果。不基于开源数据库二次开发、自建研发环境和流程,才使 OceanBase 具备对内核代码的完全掌控力和掌控权,才具备更强的突破复杂业务场景和为关键业务系统兜底的能力。这标志着其在“关键业务负载”一体化战略上迈出重要一步。

  值得一提的是,今年 3 月,蚂蚁集团宣布,OceanBase 已成立董事会,独立面向市场。

  谈及此事,杨传辉表示,“这体现了蚂蚁对把一个数据库长期持续做下去这件事情的更加笃定、更大投入,这是一个核心。基于这个核心,我觉得对我们的产品技术是利好。今天,大家看到 OceanBase 在业界得到了一定的认可,但还没有完全成功。我们相信,一体化架构不管是在国内还是在国外、在全球范围内,它都有机会成为新的主流。基于这样的思考和判断,才有信心使其独立运营,接受市场考验。”

  “数据库这件事要真的做好,首先要敢于挑战最难的事情,敢于自研做 TP(transaction processing,面向交易的处理系统)。TP 壁垒是极强的,TP 的壁垒和用户场景的积累,才会使得一款数据库形成特别大的生态。在这个过程中,我们非常欢迎竞争,并不是要成为‘一枝独秀’。从商业的角度来看,有些公司的衰败是因为没有竞争,而不是因为竞争多,良性竞争对所有参与者都是好事。”杨传辉称。

  目前,OceanBase Landscape 技术生态已扩展至超 750 个主流产品,覆盖基础设施、数据集成、数据治理、应用集成等多个领域。OceanBase 已经服务超过 1000 家行业客户,其中 30% 将其应用于核心系统。

  谈及新一轮 AI 热潮,杨传辉指出,GPT 大模型对于数据库有很大影响,尽管目前 OceanBase 没有专门支持向量数据库产品,但整个插件和社区已具备向量数据库的能力,目前开源社区已有基于 OB 开源版去做向量 Demo 的尝试。“往后,我们会往这个方向去布局研发,现在有一些尝试。”

  清华大学教授、蚂蚁技术研究院院长陈文光表示,AI 大模型的发展和崛起,对整个的数据处理、数据库领域也提出了很多新的需求。

  展望未来,陈文光在演讲中表示,未来数据库领域有三大新趋势:在线离线一体化;向量数据库和关系数据库的一体化;更大的愿景是数据处理与 AI 计算的一体化。

  “之前的数据处理更多是偏底层的方式去做的,然后先去收集、存储,后面做记账,再上面在这个数据上做一些分析聚合。AI 已经越来越多的占有整个计算的成本、容量,如果是这样的情况,我们的数据处理跟 AI 到底应该是一个什么样的关系?我认为它也应该是有一个一体化的趋势。”陈文光称。

  杨传辉在演讲结尾表示,“我希望,未来在 OceanBase 开源社区里面,应该有越来越多像‘向量数据库’这样的有趣尝试,我们的开源社区不是冷冰冰的产品,而是一个连接你我的,让大家交朋友好玩的地方,一个真正的社区。”

  (本文首发于钛媒体 App,作者|林志佳)

群贤毕至

访客