OceanBase 4.3.3发布,致力打造AI时代的一体化数据库底座

AI 时代,需要怎样的数据库? 10月23日,独立数据库厂商OceanBase在2024年度发布会上推出OceanBase 4.3.3GA版本,升级向量检索与索引功能,实现SQL AI一体化。 该版本深度融合AI与数据库处理能力,支持多模态数据的融合查询,帮助企业简化AI技术栈,提升AI应用构建效率。

AI 时代,需要怎样的数据库?10月23日,独立数据库厂商OceanBase在2024年度发布会上推出OceanBase 4.3.3GA版本,升级向量检索与索引功能,实现SQL+AI一体化。该版本深度融合AI与数据库处理能力,支持多模态数据的融合查询,帮助企业简化AI技术栈,提升AI应用构建效率。

CEO杨冰表示,OceanBase持续践行一体化产品战略,为AI时代打造易用、好用的数据底座。

杨冰:一体化数据库是AI时代的数据底座

OceanBase 4.3.3发布,致力打造AI时代的一体化数据库底座

随着AI技术发展,越来越多的AI应用不再局限于纯文本来生成回答,涉及的数据类型日益复杂,并且常存储于IT架构的不同数据库中,这对数据库提出了新的要求,包括提升性能与响应速度,要求数据库处理和存储不同类型的数据,并支持结构化、半结构化及非结构化数据的复杂融合查询。

杨冰认为,伴随着互联网/移动互联网时代向AI时代演进,数据库也正从分散走向统一,一体化数据库将成为AI时代的数据底座。如何通过一个统一的数据库来处理所有类型的数据,并通过向量融合查询能力,让小团队也可以快速构建AI应用,是OceanBase一体化产品战略在AI时代的核心思考。

会上,杨冰演示了一个叫“望小京”的AI Agent Demo,请“望小京”推荐两公里内、评分4.5以上、人均消费25元以内干净卫生的奶茶店。他介绍,这一Demo以OceanBase为数据底座,管理和处理结构化、半结构化以及非结构化数据,完成空间查询、关系过滤、向量计算等工作,为AI实时查询提供支持。

“以往构建一个复杂的AI应用,需要依赖多个不同的数据库、管理非常复杂的技术栈,同时还需要一个经验丰富且规模较大的团队。”他介绍,正是因为OceanBase具备一体化能力,才得以通过一个数据库高效处理所有查询、并通过极简架构就可以完成数据管理和AI应用开发。以OceanBase为底座的“望小京”仅依靠几位工程师、用一周时间就开发完成。

未来,OceanBase将成为蚂蚁集团的AI数据新底座,支持AI生活管家“支小宝”、AI金融管家“蚂小财”、AI健康管家三大AI应用,及支付宝百宝箱智能体开发平台的数据管理。

OceanBase 4.3.3发布,增加向量能力

OceanBase 4.3.3发布,致力打造AI时代的一体化数据库底座

面对AI时代提出的全新挑战,OceanBase持续推进技术升级。在发布会上,OceanBase推出4.3.3版本,这也是其面向实时AP场景的首个GA版本。

OceanBase CTO杨传辉介绍,OceanBase 4.3.3在向量融合查询的关键能力上取得了显著突破,推出全新的向量检索功能,实现SQL+AI一体化,深度融合AI与数据库处理。

具体而言,在对多模态数据的支持层面,4.3.3进一步扩展了对复杂数据类型的处理能力,新增Array类型,并对Roaringbitmap类型数据的计算性能进行了优化,为企业处理多样化数据结构提供更高的灵活性。

在向量融合查询能力上,4.3.3新增向量检索能力,支持向量数据类型和向量索引,并基于向量索引提供强大的搜索能力。用户可通过SQL及Python SDK等方式灵活调用OceanBase的向量检索能力,同时结合对海量数据的分布式存储能力、多模数据类型及多类型索引的支持,极大简化AI应用的技术栈,助力企业高效构建AI应用。

在多工作负载方面,OceanBase 4.3.3对AP(分析处理)场景进行大幅性能优化,尤其是在海量数据分析时,能够提供更短的响应时间和更高的吞吐能力。同时,4.3.3引入了列存副本的新形态,实现满足 TP 和 AP 负载的物理资源强隔离。该物理隔离机制可确保系统在处理事务型负载时,不受分析型负载的影响,特别是在实时数据分析和决策场景中,能够保持系统的高性能与稳定性。

发布会上,OceanBase与蚂蚁集团联合开发的向量库在业内标准的ANN Benchmarks基准测试中,针对GIST-960数据集表现出色。测试结果显示,该向量库在ANN Benmarks测试中性能远超其他算法,排名第一。特别是在 90% 以上的召回率区间,查询性能(QPS)相比此前最优算法 glass 提升 100%,相比基线算法 hnswlib 提升 300%。

杨传辉还强调,AI天然拥抱云,OceanBase作为一体化数据库,不仅具备云上云下一体化能力,同时具备多云原生开放架构,这些优势都能有效地帮助客户实现云与AI结合,满足客户在云+AI时代的数据管理需求。

相关资讯

甲骨文推出 HeatWave GenAI:提供数据库内大语言模型等功能

感谢甲骨文公司宣布正式推出 HeatWave GenAI,其中包含数据库内大语言模型、自动化数据库内向量存储、可扩展向量处理,以及基于非结构化内容进行自然语言上下文对话的能力。HeatWave 是一项云技术服务,在一个产品中为交易和湖仓(IT之家注:Lakehouse,一种新的数据架构)规模分析提供自动化、集成的生成式 AI 和机器学习。这些新功能使客户能够将生成式 AI 的功能应用于客户数据,不需要具备 AI 专业知识,也不需要将数据移动到单独的向量数据库中。HeatWave GenAI 将立即提供,且无需 He

全日程发布!向量数据库就该这么学

向量数据库现在有多火,在 Google Trends 上搜索「vector database」一词,我们可以看到下面这张趋势图。这是过去 5 年「vector database」一词的热度随时间变化的趋势,毫无疑问,向量数据库从一开始的不温不火到现在的走红离不开今年爆火的 ChatGPT。这之后,新的大模型如雨后春笋般不断涌现,而向量数据库凭借其快速、高效检索和召回高维向量数据的能力,逐渐进化为大模型的「超级大脑」,热度不减。向量数据库一方面解决了大模型在 “事实性” 和 “实时性” 等方面的天然缺陷,另一方面也重

线上开售!大模型时代的向量数据库 AI 技术论坛圆满收官

致力于助力大模型技术升级的“大模型时代的向量数据库”——机器之心 AI 技术论坛日前圆满收官。活动当日,北京海淀文津国际酒店论坛现场门庭若市,来自全国十余个城市的 200 多名参会者亲临现场,在 21 位向量数据库技术专家的带领下,系统拆解了向量数据库的关键技术,向量数据库、向量模型和知识库的应用场景和最佳实践,并用两个技术实操来巩固所学知识,一起高效完成了大模型技术升级。来看看现场的精彩瞬间吧!活动现场大家一同探讨了向量数据库和知识库的最佳落地场景、向量数据库的未来、RAG 和向量数据库的关系、个人如何在大模型时