Databricks
模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平
现阶段,微调大型语言模型(LLMs)的难点在于,人们通常没有高质量的标注数据。 最近,AI 公司 Databricks 推出了一种新的调优方法 TAO,只需要输入数据,无需标注数据即可完成。 更令人惊喜的是,TAO 在性能上甚至超过了基于标注数据的监督微调。
3/30/2025 5:21:00 PM
机器之心
Anthropic与Databricks达成1亿美元合作,开发AI代理工具
Anthropic和 Databricks 宣布达成一项为期五年的合作协议,合作总金额达1亿美元。 此次合作的重点是开发 AI 代理工具,旨在为企业处理各种任务。 Databricks 首席执行官阿里・戈德西(Ali Ghodsi)表示,Anthropic的 Claude 模型将直接在 Databricks 平台上提供,这将使客户能够利用公司的数据开发自己的 AI 代理。
3/28/2025 9:29:00 AM
AI在线
开源模型逆袭:Databricks TAO 技术微调 Llama 超越 GPT-4o
近日,数据智能公司 Databricks 推出了一种全新的大语言模型微调方法 ——TAO(Test-time Adaptive Optimization),这一技术的出现为开源模型的发展带来了新的希望。 通过运用无标注数据和强化学习,TAO 不仅在降低企业成本方面表现出色,更是在一系列基准测试中取得了令人瞩目的成绩。 根据科技媒体 NeoWin 的报道,TAO 微调后的 Llama3.370B 模型在金融文档问答和 SQL 生成等任务中,展现出了优于传统标注微调方法的性能,甚至逼近了 OpenAI 的顶级闭源模型。
3/27/2025 2:39:00 PM
AI在线
开源逆袭:TAO 方法微调 Llama 模型,FinanceBench 跑分超 GPT-4o
Databricks发布TAO方法,通过无标注数据和强化学习技术,微调Llama模型在FinanceBench等基准测试中表现优异,甚至超越OpenAI的GPT-4o。这一技术不仅降低了企业成本,还为开源模型提供了持续进化的路径。#开源创新# #AI技术#
3/27/2025 8:56:38 AM
故渊
Databricks 推出 1320 亿参数大语言模型 DBRX,号称“现阶段最强开源 AI”
Databricks 近日在推出了一款通用大语言模型 DBRX,号称是“目前最强开源 AI”,据称在各种基准测试中都超越了“市面上所有的开源模型”。IT之家从官方新闻稿中得知,DBRX 是一个基于 Transformer 的大语言模型,采用 MoE(Mixture of Experts)架构,具备 1320 亿个参数,并在 12T Token 的源数据上进行预训练。研究人员对这款模型进行测试,相较于市场上已有的 LLaMA2-70B、Mixtral、Grok-1 等开源模型,DBRX 在语言理解(MMLU)、程式设
3/31/2024 3:15:05 PM
漾仔
开源大模型王座再易主,1320亿参数DBRX上线,基础、微调模型都有
「太狂野了」。这是迄今为止最强大的开源大语言模型,超越了 Llama 2、Mistral 和马斯克刚刚开源的 Grok-1。本周三,大数据人工智能公司 Databricks 开源了通用大模型 DBRX,这是一款拥有 1320 亿参数的混合专家模型(MoE)。DBRX 的基础(DBRX Base)和微调(DBRX Instruct)版本已经在 GitHub 和 Hugging Face 上发布,可用于研究和商业用途。人们可以自行在公共、自定义或其他专有数据上运行和调整它们,也可以通过 API 的形式使用。基础版::
3/28/2024 3:15:00 PM
机器之心
“LLM”席卷大数据行业,独角兽Databricks收购以 AI 为中心的大数据平台Okera
由chat GPT带起的AI浪潮正在席卷全球,影响着所有的行业,也包括数据库领域。据TechCrunch报道,数据库领域独角兽Databricks 宣布收购了专注于 AI 的数据治理平台 Okera。虽然两家公司均未透露收购价格,从Crunchbase 的数据来看,Okera 此前筹集了近 3000 万美元,投资者包括 Felicis、Bessemer Venture Partners、Cyber Mentor Fund、ClearSky 和 Emergent Ventures。Databricks 在今天的公告中
5/5/2023 6:34:00 PM
新闻助手
世界首款真开源类ChatGPT大模型Dolly 2.0,可随意修改商用
众所周知,在 ChatGPT 的问题上 OpenAI 并不 Open,从 Meta 那里开源的羊驼系列模型也因为数据集等问题「仅限于学术研究类应用」,在人们还在因为寻找绕过限制方法的时候,主打 100% 开源的大模型来了。
4/13/2023 2:28:00 PM
机器之心
- 1
资讯热榜
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型
上海AI实验室开源InternVL3系列多模态大型语言模型
50组多风格提示词,全面测评Midjourney V7生图效果!
全日程揭晓!ICLR 2025论文分享会我们北京见
斯坦福2025 AI指数出炉!中美AI对决差距仅剩0.3%,DeepSeek领衔
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
AI设计
Anthropic
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
模态
AI视频
驾驶
文本
xAI
搜索
人形机器人
大语言模型
Copilot
神器推荐
LLaMA
字节跳动
具身智能
Claude
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练