开源会越来越落后?OceanBase杨传辉:开源和商业数据库都有生存空间|钛媒体AGI 开源会越来越落后?OceanBase杨传辉:开源和商业数据库都有生存空间|钛媒体AGI
admin
2024-04-22 22:13:38
0


(图片来源:unsplash)

近期,百度创始人、董事长兼CEO李彦宏称开源模型会越来越落后,引起行业对‘开源’技术的广泛讨论。不止在AI大模型领域,包括开源数据库等多个领域的重要从业者也对此表达看法。

4月20日上海OceanBase开发者大会上,OceanBase首席技术官(CTO)杨传辉对钛媒体App等表示,仅从数据库领域而言,开源技术对于行业的意义非常重要,开源和商业化数据库都有一定的生存空间。

“就开源和商业化定位来说,我认为,首先我要把开源做好,我一定要使开源出去的东西足够有诚意,能够真正解决用户核心痛点;但同时,开源之后又不能让这家公司完全不商业化,那也活不下去,最后开源社区也没了。在OB这里,数据库相当于发明的一个自行车,‘开源’是教你怎么去骑自行车,‘商业’是卖给你一个好的自行车,但你不会骑没用,开源对我们的商业化反而有助力。对OB来讲没有问题,我们可以把开源和商业很好地融合在一起。”杨传辉表示。


OceanBase首席技术官(CTO)杨传辉

事实上,作为一款100%根自研的分布式数据库,OceanBase持续践行一体化数据库的产品战略,以负载关键业务系统。

2020年,OceanBase宣布独立商业化运作。当时OceanBase表示,在原有功能基础上增加分析型业务处理能力,OceanBase 将升级为一款支持 HTAP 混合负载的企业级分布式数据库。

2022年,OceanBase发布4.0版本,从技术上首次突破分布式数据库的单机性能瓶颈,实现单机分布式一体化。目前在一体化上,OceanBase已实现单机分布式一体化、TP/AP一体化、云上云下一体化、多模一体化等,用一个数据库满足客户80%的场景需求。

2024年4月,OceanBase发布4.3版本,推出列式存储引擎,打造PB级实时分析数据库,可实现秒级实时分析,进一步加强TP/AP一体化。现场跑分显示,在同等硬件条件下,OceanBase4.3的AP查询性能已达到业内一流列存大宽表数据库同一水平。

此次OceanBase开发者大会上,杨传辉表示,OceanBase 4.3在TP/AP一体化上的进一步突破,也是OceanBase坚持100%根自研的产品力结果。不基于开源数据库二次开发、自建研发环境和流程,才使OceanBase具备对内核代码的完全掌控力和掌控权,才具备更强的突破复杂业务场景和为关键业务系统兜底的能力。这标志着其在“关键业务负载”一体化战略上迈出重要一步。

值得一提的是,今年3月,蚂蚁集团宣布,OceanBase已成立董事会,独立面向市场。

谈及此事,杨传辉表示,“这体现了蚂蚁对把一个数据库长期持续做下去这件事情的更加笃定、更大投入,这是一个核心。基于这个核心,我觉得对我们的产品技术是利好。今天,大家看到OceanBase在业界得到了一定的认可,但还没有完全成功。我们相信,一体化架构不管是在国内还是在国外、在全球范围内,它都有机会成为新的主流。基于这样的思考和判断,才有信心使其独立运营,接受市场考验。”

“数据库这件事要真的做好,首先要敢于挑战最难的事情,敢于自研做TP(transaction processing,面向交易的处理系统)。TP壁垒是极强的,TP的壁垒和用户场景的积累,才会使得一款数据库形成特别大的生态。在这个过程中,我们非常欢迎竞争,并不是要成为‘一枝独秀’。从商业的角度来看,有些公司的衰败是因为没有竞争,而不是因为竞争多,良性竞争对所有参与者都是好事。”杨传辉称。

目前,OceanBase Landscape技术生态已扩展至超750个主流产品,覆盖基础设施、数据集成、数据治理、应用集成等多个领域。OceanBase已经服务超过1000家行业客户,其中30%将其应用于核心系统。

谈及新一轮 AI 热潮,杨传辉指出,GPT大模型对于数据库有很大影响,尽管目前OceanBase没有专门支持向量数据库产品,但整个插件和社区已具备向量数据库的能力,目前开源社区已有基于OB开源版去做向量Demo的尝试。“往后,我们会往这个方向去布局研发,现在有一些尝试。”

清华大学教授、蚂蚁技术研究院院长陈文光表示,AI 大模型的发展和崛起,对整个的数据处理、数据库领域也提出了很多新的需求。

展望未来,陈文光在演讲中表示,未来数据库领域有三大新趋势:在线离线一体化;向量数据库和关系数据库的一体化;更大的愿景是数据处理与 AI 计算的一体化。

“之前的数据处理更多是偏底层的方式去做的,然后先去收集、存储,后面做记账,再上面在这个数据上做一些分析聚合。AI已经越来越多的占有整个计算的成本、容量,如果是这样的情况,我们的数据处理跟AI到底应该是一个什么样的关系?我认为它也应该是有一个一体化的趋势。”陈文光称。


杨传辉在演讲结尾表示,“我希望,未来在OceanBase开源社区里面,应该有越来越多像‘向量数据库’这样的有趣尝试,我们的开源社区不是冷冰冰的产品,而是一个连接你我的,让大家交朋友好玩的地方,一个真正的社区。”

(本文首发于钛媒体App,作者|林志佳)


相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...