数据库
一文带你入门 MCP(模型上下文协议)
什么是 MCP? MCP(Model Context Protocol,模型上下文协议) 是由 Anthropic 推出的一种开放标准,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信协议。 MCP 的主要目的在于解决当前 AI 模型因数据孤岛限制而无法充分发挥潜力的难题,MCP 使得 AI 应用能够安全地访问和操作本地及远程数据,为 AI 应用提供了连接万物的接口。
在PostgreSQL数据库中应用机器学习进行预测性容量规划
译者 | 李睿审校 | 重楼如今,数据库领域正在迅速向人工智能(AI)和机器学习(ML)迈进,数据库的工作量将会大幅增加。 对于数据库管理员来说,提前预测数据库基础设施的工作负载并满足需求将是一项额外的责任。 随着数据库规模的扩展和资源管理变得越来越重要,传统的容量规划方法往往难以满足需求,从而导致性能问题和计划外停机。
Elasticsearch虽好,但矢量数据库才是未来
作者 | Jiang Chen译者 | 布加迪审校 | 重楼出品 | 51CTO技术栈(微信号:blog51cto)几十年来,以Elasticsearch为代表的关键词匹配(又称为全文搜索)一直是企业搜索和推荐引擎等信息检索系统的默认选择。 随着基于人工智能的搜索技术不断进步,如今企业组织在向语义搜索转变,从而使系统能够理解用户查询背后的含义和意图。 嵌入模型和矢量数据库已成为这一转变的核心。
基于关系型深度学习的自助机器学习
译者 | 朱先忠审校 | 重楼本文将探讨直接在关系数据库上执行机器学习的新方法——关系型深度学习。 本文示例项目数据集的关系模式(作者提供图片)在本文中,我们将深入探讨一种有趣的深度学习(DL)新方法,称为关系型深度学习(RDL)。 我们还将通过在一家电子商务公司的真实数据库(不是数据集!
OceanBase 4.3.3发布,致力打造AI时代的一体化数据库底座
AI 时代,需要怎样的数据库? 10月23日,独立数据库厂商OceanBase在2024年度发布会上推出OceanBase 4.3.3GA版本,升级向量检索与索引功能,实现SQL AI一体化。 该版本深度融合AI与数据库处理能力,支持多模态数据的融合查询,帮助企业简化AI技术栈,提升AI应用构建效率。
甲骨文推出 HeatWave GenAI:提供数据库内大语言模型等功能
感谢甲骨文公司宣布正式推出 HeatWave GenAI,其中包含数据库内大语言模型、自动化数据库内向量存储、可扩展向量处理,以及基于非结构化内容进行自然语言上下文对话的能力。HeatWave 是一项云技术服务,在一个产品中为交易和湖仓(IT之家注:Lakehouse,一种新的数据架构)规模分析提供自动化、集成的生成式 AI 和机器学习。这些新功能使客户能够将生成式 AI 的功能应用于客户数据,不需要具备 AI 专业知识,也不需要将数据移动到单独的向量数据库中。HeatWave GenAI 将立即提供,且无需 He
入选国际数据库顶级会议ICDE,腾讯云数据库技术创新获权威认可
今日获悉,腾讯云数据库2篇论文入选国际数据库顶级会议ICDE。其分布式事务协议——Lion和内存-磁盘跨越索引设计框架,解决了数据库领域的普遍难题,技术创新获得国际权威认可。(腾讯云数据库团队在ICDE会场进行技术分享)据悉,ICDE(IEEE International Conference on Data Engineering)是数据库研究领域历史悠久的国际会议,与SIGMOD、VLDB并称数据库三大顶级会议,也是中国计算机学会(CCF)推荐的A类国际会议,主要聚焦设计、构建、管理和评估高级数据密集型系统和应
狂奔一年后的向量数据库,何去何从?|对话 MyScaleDB
2023 年可以说是大模型元年,借着大模型的东风,向量数据库也迎来了大爆发,被带到了更高的关注度上。一方面,向量数据库和 RAG 得到广泛的关注和认可,是因为他们的确可以解决一些短期内大模型无法攻克的难题,比如模型幻觉问题等。同时,在尝试用向量数据库和 RAG 做场景落地的时候,效果也还不错。不过另一方面,我们也无法回避对他们普遍的困惑与争议,比如向量数据库是否已经凉了,以及如今势头正盛的 RAG 是否会被长文本杀死等等。那此刻距离 ChatGPT 的发布已经有一年多的时间,站在当下的这个时间点上来看,向量数据库和
亚马逊云科技展示数据构建三大核心能力,助力企业生成式AI能力落地
「能够利用自己的数据构建具有真正商业价值的生成式AI应用的公司,将会是成功的公司。」
阿里云首创PilotScope新技术,为AI4DB应用提速
12月20日,数据库国际顶会VLDB2024公布新一批论文,阿里云新技术PilotScope成功入围,该平台技术可实现AI算法在数据库的“一键部署”,极大降低数据库中AI算法的应用门槛,为数据库智能化开辟了全新空间。同日阿里云宣布将PilotScope全部技术免费开源。图说:数据库顶会VLDB2024数据库是事关国计民生的基础软件技术,数据库技术的更新影响着数字时代的千行百业,其中一个前沿领域即是数据库智能化(AI4DB,AI for Database)。现在的数据库系统非常复杂,对稳定性要求极高,即便将单一AI算
为通用人工智能提速,蚂蚁图计算连续四次打破权威测评世界纪录
近日,国际关联数据基准委员会(Linked Data Benchmark Council,以下简称LDBC)发布了图数据基准测评“LDBC SNB-BI”最新结果。由蚂蚁集团自研的流式图计算引擎TuGraph Analytics在30TB规模的数据集上成功完成了基准测试,数据规模和性能打破了此前美国某图数据库厂商的公开纪录,关键指标中的并发吞吐量提升至2.84倍,查询能力提升至1.86倍。 LDBC官方公布蚂蚁LDBC SNB-BI测评新纪录在本次测评中,测试产品需要快速导入和分析30TB 规模的数据,处理多达72
GPU上运行速度比现有模型快3-7倍,IU团队使用全卷积神经网络进行准确的从头肽测序
编辑 | 萝卜皮从头肽测序不依赖于全面的靶序列数据库,这为科学家提供了一种从串联质谱中识别新肽的方法。然而,当前的从头测序算法的准确性和覆盖率较低,这阻碍了它们在蛋白质组学中的应用。印第安纳大学(Indiana University,IU)的研究人员提出了 PepNet,一种用于高精度从头肽测序的全卷积神经网络。PepNet 将 MS/MS 谱(表示为高维向量)作为输入,并输出最佳肽序列及其置信度得分。PepNet 模型使用来自多个人类肽谱库的总共 300 万个高能碰撞解离 MS/MS 谱图进行训练。评估结果表明,
线上开售!大模型时代的向量数据库 AI 技术论坛圆满收官
致力于助力大模型技术升级的“大模型时代的向量数据库”——机器之心 AI 技术论坛日前圆满收官。活动当日,北京海淀文津国际酒店论坛现场门庭若市,来自全国十余个城市的 200 多名参会者亲临现场,在 21 位向量数据库技术专家的带领下,系统拆解了向量数据库的关键技术,向量数据库、向量模型和知识库的应用场景和最佳实践,并用两个技术实操来巩固所学知识,一起高效完成了大模型技术升级。来看看现场的精彩瞬间吧!活动现场大家一同探讨了向量数据库和知识库的最佳落地场景、向量数据库的未来、RAG 和向量数据库的关系、个人如何在大模型时
全日程发布!向量数据库就该这么学
向量数据库现在有多火,在 Google Trends 上搜索「vector database」一词,我们可以看到下面这张趋势图。这是过去 5 年「vector database」一词的热度随时间变化的趋势,毫无疑问,向量数据库从一开始的不温不火到现在的走红离不开今年爆火的 ChatGPT。这之后,新的大模型如雨后春笋般不断涌现,而向量数据库凭借其快速、高效检索和召回高维向量数据的能力,逐渐进化为大模型的「超级大脑」,热度不减。向量数据库一方面解决了大模型在 “事实性” 和 “实时性” 等方面的天然缺陷,另一方面也重
当LLM遇到Database:阿里达摩院联合HKU推出Text-to-SQL新基准
在新基准 BIRD 上,ChatGPT 仅能达到 40.08%,相比人类 92.96% 还有很大差距。
了解「AI 对齐失败数据库」
AI对齐失败数据库是一个用于追踪“机器学习系统的目标与人类的设计意图不一致”实例(instance)的社区项目,该项目由安远AI发起。今天,作为该项目的运营伙伴,机器之心SOTA!模型社区正式上线「AI对齐失败数据库」中文社区站点!
知网被罚8760万元,承诺三年内降价30%以上
据新华社报道,2022 年 12 月 26 日,市场监管总局依据反垄断法对知网作出行政处罚决定,责令其停止违法行为,并处以其 2021 年中国境内销售额 17.52 亿元 5% 的罚款,计 8760 万元,同时要求其围绕解除独家合作、减轻用户负担、加强内部合规管理等方面进行全面整改。
近30天中国下载第一,Sci-Hub新年首更,实时查看下载统计,logo钥匙环变「锤子和镰刀」
在重重压力下,Sci-Hub 还是更新了。