腾讯

腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]过去十年间,基于随机梯度下降(SGD)的深度学习模型在许多领域都取得了极大的成功。与此同时各式各样的 SGD 替代品也如雨后春笋般涌现。在这些众多替代品中,Adam 及其变种最受追捧。无论

腾讯大模型App元宝上线,我们用它「单挑」了下GPT-4o

腾讯元宝 VS GPT-4o,究竟谁技高一筹?最近,腾讯一改往日的慢性子,忽然「卷」起来了:5 月 14 日,腾讯全面开源混元文生图模型;5 月 17 日,腾讯发布一站式 AI 智能体创作与分发平台「腾讯元器」;5 月 30 日,基于混元大模型的 App「腾讯元宝」正式上线,目前应用商店已经可以下载。腾讯元宝是一个基于混元大模型及搜索引擎驱动的高效信息整合工具,界面设计简洁,可以搜索实时信息,也可以对上传的多格式文档进行总结、翻译,还能语音对话练习口语。而此次腾讯元宝产品能力升级的背后,是腾讯混元底层模型的持续迭代

腾讯混元大模型全面降价!混元-lite即日起免费

5月22日,腾讯云公布全新大模型升级方案。主力模型之一混元-lite模型,API输入输出总长度计划从目前的4k升级到256k,价格从0.008元/千tokens调整为全面免费。混元-standard API输入价格从0.01元/千tokens降至0.0045元/千tokens ,下降55%,API输出价格从0.01元/千tokens降至0.005元/千tokens,下降50%。新上线的混元-standard-256k,具备处理超过38万字符的超长文本能力,API输入价格下调至0.015元/千tokens,下降87.

腾讯混元大模型全面降价,混元-lite 即日起免费

感谢今天,腾讯云公布全新大模型价格方案,其中主力模型之一混元-lite 模型,API 输入输出总长度计划从目前的 4k 升级到 256k,价格从 0.008 元 / 千 tokens 调整为全面免费。混元-standard API 输入价格从 0.01 元 / 千 tokens 降至 0.0045 元 / 千 tokens ,下降 55%,API 输出价格从 0.01 元 / 千 tokens 降至 0.005 元 / 千 tokens,下降 50%。新上线的混元-standard-256k,具备处理超过 38 万

腾讯云 AI 代码助手免费限时公测:自动补全、根据注释生成内容、解释代码等

腾讯云宣布旗下 AI 代码助手现已开放免费限时公测,目前开发者、开发团队、企业客户可以通过腾讯云官网在线体验。AI 代码助手是腾讯云自研的一款编程提效辅助工具,以插件形式安装到编辑器(VSCode 或者 JetBrian 系列 IDE)中辅助编程。AI 代码助手可提供自动补全代码、根据注释生成代码、代码解释、生成测试代码、转换代码语言、技术对话等功能。IT之家附腾讯云 AI 代码助手特点:基于腾讯混元代码模型:腾讯表示内部超过 50% 的研发在使用支持多种语言:支持 Python, JavaScript / Typ

腾讯版“GPTs”腾讯元器开启内测

在 5 月 17 日举办的腾讯云生成式 AI 产业应用峰会上,腾讯发布了新推出的智能体产品“腾讯元器”,腾讯称之为“一站式智能体创造与分发平台”,目前已开启内测(点此申请内测)。据腾讯官方介绍,腾讯元器有如下特点:具有智能体商店:可以在商店中选择并使用自己需要的智能体,以满足不同的需求低门槛创建智能体:通过提示词、插件、工作流、AI 辅助创建等能力,无需代码,低门槛创建智能体丰富的插件与知识库:预集成腾讯生态特色插件、知识库资源,将开放第三方能力,为创作者提供开箱即用的工具。腾讯全域分发:率先支持腾讯全域分发渠道,

腾讯将推 C 端助手 App 腾讯元宝:基于混元大模型,支持 AI 搜索、文档总结、口语陪练

感谢在今日举办的腾讯云生成式 AI 产业应用峰会上,腾讯预告将在 5 月 30 日发布基于混元大模型的面向 C 端(消费者端)的助手 App“腾讯元宝”。腾讯元宝是基于混元大模型及搜索引擎驱动的高效信息整合工具,同时结合腾讯的内容生态,为用户提供多种生活功能。腾讯元宝将支持以下功能:AI 搜索:参考多个信息来源并总结,让信息获取更加准确、可靠文档总结:支持多格式多文档总结超能翻译官:直译意译均可翻译,用户可以提供论文链接,App 给出翻译口语陪练:练习口语对话,对用户语法与发音作出评价腾讯混元大模型,作为腾讯全链路

首个中文原生DiT架构!腾讯混元文生图大模型全面开源,免费商用

中文 AI 社区迎来了一个好消息:与 Sora 同架构的开源文生图大模型来了!5 月 14 日,腾讯宣布旗下混元文生图大模型全面升级并全面开源,目前已在 Hugging Face 平台及 GitHub 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。官网地址: 项目地址: Face 模型地址:: 据了解,这是业内首个中文原生的 DiT 架构文生图开源模型,支持中英文双语输入及理解,参数量 15 亿。升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构,即全新的 Huny

腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用

感谢腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在 Hugging Face 及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲ 混元文生图效果▲ 混元长文生图效果升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构,腾讯表示,混元 DiT 是首个中英双语 DiT 架构。混元 DiT 是一个基于 Diffusion transformer 的文本到图像生成模型,此模型具有中英文细粒度理解能力,混元 DiT 能够与用户进行多轮对话,根据上下文生

最新中文大模型测评出炉,腾讯混元居卓越领导者象限

5月6日 记者获悉,国内权威的大模型评测机构SuperCLUE最新发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准,其前身是知名的第三方中文语言理解测评基准CLUE(The Chinese Language Understanding Evaluation)。SuperCLUE基于通用大模型在学术、产业与用户侧的广泛应用,构建了多层次、多维度的综合性测评基准,由十

腾讯发布汽车行业大模型“全域智能”方案,与文远知行合作打造智驾

感谢腾讯云今日官宣发布汽车行业大模型“全域智能”方案,并升级“云、图”底座。官方表示,在汽车产业全面拥抱“智能化”的新阶段,云计算、AI、地图等核心技术,已经成为智能汽车的重要基础设施,推动汽车产业实现“全域智能”。目前,腾讯云已经和长安、一汽丰田、东风岚图、易车等十多家汽车相关企业,开启了汽车行业大模型在汽车研发、生产、营销、服务、企业协同等核心场景的合作。据介绍,腾讯云基于混元大模型,用汽车行业专业数据做精调,深入五大场景,为用户提供服务。销售和营销领域通过 AI 销售助手,大模型可以基于过往的线上咨询,快速生

腾讯旗下协作SaaS产品全面接入混元大模型,实现智能化升级

大模型应用落地再加速。

腾讯文档推出智能白板创新品类,自研开物引擎支持全端应用

4月18日,“腾讯文档,打开想象”2024产品发布会在线上举办。腾讯社交协作产品部总经理、腾讯文档负责人鄢贤卿在会上,正式发布智能白板创新品类、双核编辑“开物引擎”、云加端解决方案等产品矩阵。他表示,在自研文档品类和自研双核引擎的基座下,腾讯文档也全面搭载了AI助手,致力于打造专业、智能的Office产品体验,提升用户和企业生产力。同时,全面开启商业化尝试一年后,腾讯文档个人付费用户已突破100万,累计付费企业和组织数超2万家。智能白板、AI助手移动端等全新产品能力发布本次发布会上,腾讯文档自研产品矩阵迎来全新品类

上海举办国内首个 AI 音乐会

4 月 13 日至 14 日,上海民族乐团国乐与 AI 音乐会《零・壹|中国色》,在第 39 届上海之春国际音乐节首演,这是全国首台 AI 创作的国乐音乐会。据悉,《零・壹|中国色》由上海民族乐团、腾讯音乐娱乐集团(TME)、1862 时尚艺术中心联合主办,参演曲目以颜色为创作灵感,由腾讯音乐娱乐集团和腾讯 AI Lab 联合研发的 AI 音乐大模型“琴乐大模型”创作,并经过乐团演奏家们二度创作最终成曲,通过大自然色彩的起承转合千变万化,让观众从乐曲中感受到不同的色彩演绎。IT之家附重点节目名单如下:笙曲《东方既白

腾讯音乐与长城汽车开启战略合作,聚焦智能座舱 AI 音频技术

感谢腾讯音乐娱乐集团(TME)与长城汽车 4 月 9 日举办研讨会,并宣布正式开启战略合作。腾讯音乐为长城汽车颁发了“AI 座舱先锋合作伙伴”证书,双方将聚焦智能座舱中的 AI 音频技术展开合作,并通过 TME 旗下产品实现,共同打造座舱娱乐的创新体验。此次合作将充分利用腾讯音乐在音频领域的技术优势和长城汽车在智能座舱领域的研发实力,共同推动智能座舱 AI 音频技术的发展。腾讯音乐娱乐集团提供在线音乐和以音乐为核心的社交娱乐两大服务。腾讯音乐娱乐在中国有着广泛的用户基础,拥有目前国内市场知名的四大移动音乐产品:QQ

Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话

AniPortrait 模型是开源的,可以自由畅玩。「小破站鬼畜区的新质生产力工具。」近日,腾讯开源发布的一个新项目在推上获得了如此评价。这个项目是 AniPortrait,其可基于音频和一张参考图像生成高质量动画人像。话不说多,我们先看看可能会被律师函警告的 demo:动漫图像也能轻松开口说话:该项目刚上线几天,就已经收获了广泛好评:GitHub Star 数已经突破 2800。下面我们来看看 AniPortrait 的创新之处。论文标题:AniPortrait: Audio-Driven Synthesis o

腾讯发布 GiiNEX AI 游戏引擎:面向 AI NPC、场景制作与内容生成

感谢腾讯近日在 GDC 2024 游戏开发者大会上,发布了 AI Lab 团队打造的 GiiNEX AI 游戏引擎,基于生成式 AI 和决策 AI 技术。腾讯表示,GiiNEX AI 游戏引擎面向 AI NPC、场景制作、内容生成等场景,提供了包括 2D 图像、动画、3D 城市、剧情、对话、关卡以及音乐等 AIGC 能力,可被用于 MOBA、FPS、MMO 等各类游戏。IT之家从官方获悉,腾讯在 GDC 2024 上展示了 GiiNEX 的游戏 3D 城市生成工具。采用 GiiNEX 城市布局工具构思并创建一个面积

数量即力量!腾讯揭秘:Agent数量越多,大语言模型效果越好

来自腾讯的研究者们做了一个关于 agent 的scaling property(可拓展性)的工作。发现:通过简单的采样投票,大语言模型(LLM)的性能,会随着实例化agent数量的增加而增强。其第一次在广泛的场景下验证了该现象的普遍性,与其他复杂方法的正交性,以及研究了其背后的原因,并提出进一步促成scaling发挥威力的办法。论文标题:More Agents Is All You Need论文地址::,来自腾讯的研究者发现:只需通过一种简单的采样投票法,大语言模型的性能就会随着实例化 agent 的数量的增大而增