资讯列表
Cerebras 加速扩张六座数据中心,令推理速度提升十倍!
Cerebras Systems 近日宣布将在北美和欧洲新建六座数据中心,以提升其人工智能(AI)推理能力。 这一举措将大大增强公司的算力,支持各类 AI 应用的发展。 根据计划,85% 的计算能力将集中在美国,其中已有三座设施在加州的圣克拉拉、斯托克顿和德克萨斯州的达拉斯投入运营。
3/12/2025 11:07:00 AM
AI在线
Flower Labs推出全新云本地AI服务,本地处理与云端计算无缝切换!
近期,Y Combinator 支持的初创公司 Flower Labs 宣布推出其分布式云平台 ——Flower Intelligence 的预览版本。 该平台旨在为人工智能模型提供服务,Mozilla 已开始应用这一技术,以支持其即将推出的 Thunderbird 电子邮件客户端的 Assist 摘要插件。 Flower Intelligence 的独特之处在于,它能够支持在移动设备、个人电脑和网络应用中进行本地 AI 处理,并在用户允许的情况下,自动切换到私有云。
3/12/2025 11:04:00 AM
AI在线
无需训练!Q-Filters 实现 KV 缓存高效压缩,提升推理性能
近年来,基于 Transformer 架构的大型语言模型(LLMs)取得了显著进展,诸如 Gemini-Pro1.5、Claude-3、GPT-4和 Llama-3.1等新模型能够处理成百上千的token。 然而,这些扩展的上下文长度带来了实际应用中的一些重大挑战。 随着序列长度的增加,解码延迟上升,内存限制也成为了一个严重的瓶颈。
3/12/2025 11:03:15 AM
AI在线
LLMs.txt生成器 v2发布:网站文本转换速度提升10倍
近日,LLMs.txt生成器迎来重大升级,正式推出v2版本。 这一工具能够将任何网站内容快速转化为可供人工智能代理或大型语言模型(LLM)使用的文本文件,为AI应用的开发者和使用者带来了极大便利。 新版本由@firecrawl_dev团队开发,并得到其官方llmstxt端点的全力支持,相较于上一代,处理速度提升了惊人的10倍。
3/12/2025 10:53:00 AM
AI在线
联发科发布 Genio 720/520 物联网平台:6nm 制程,AI 算力 10 TOPS
这两款产品支持先进的生成式 AI 模型、人机界面、多媒体和连接功能,适用于广泛 IoT 设备。
3/12/2025 10:46:40 AM
溯波(实习)
10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜
音乐创作,尤其是完整歌曲的生成,一直是人工智能领域的一大挑战。 Suno、Udio等商用音乐生成大模型展现出惊人的音乐生成能力。 但现有开源的音乐生成模型要么只能生成人声或伴奏,要么依赖复杂的多阶段架构,难以扩展到长音频生成。
3/12/2025 10:41:34 AM
新智元
多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools
大型语言模型(LLMs)目前仍然很难处理需要多步骤推理、特定领域知识或外部工具集成的复杂任务,有研究工作探索了使用预先构建的外部工具来增强LLMs处理复杂任务的能力,但这些方法需要对模型进行微调或额外训练以实现工具的集成,在不同任务之间难以灵活适应。 现有的方法要么依赖于静态的、预定义的工具集,要么缺乏高效的工具选择和规划机制,这种低效性会导致任务执行出错、计算成本增加,以及在应用于新领域时适应性受限。 传统增强LLMs的方法包括少量样本提示(few-shot prompting)、思维链(chain-of-thought reasoning)以及与外部工具接口的功能调用API;有的框架如LangChain和AutoGen允许LLMs够使用外部资源,但通常智能用于指定应用场景或需要大量的预配置,没有提供一种统一的多步骤规划和执行方法,因此在处理复杂推理问题时效果不佳。
3/12/2025 10:38:05 AM
新智元
DeepSeek 开源的 DualPipe,居然是梁文峰写的,你感性?
继DeepGEMM之后,deepseek开源了第四弹DualPipe。 今天来简单聊聊DualPipe,包懂。 DualPipe是干嘛的?
3/12/2025 10:36:32 AM
架构师之路
OpenAI突然发布智能体API!支持网络和文件搜索以及computer use
「Agent/智能体」可说是当今 AI 领域最炙手可热的话题。 今天凌晨,OpenAI 发布了一系列可让开发者通过 API 构建智能体的新工具,其中最大的看点便是 Responses API,这是对之前的 Chat Completions API 的一轮大升级,使其获得了 Assistants API 般使用工具的能力,从而可以帮助开发者构建智能体。 目前,Responses API 已经内置了网络搜索、文件搜索和计算机使用(computer use)能力。
3/12/2025 10:35:00 AM
机器之心
OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手
Manus掀起的智能体风暴,再次逼急了OpenAI。 凌晨,OpenAI突然开启线上直播,正式放出开发者自主构建智能体的大礼包——一个全新API、三个内置工具,以及一个开源SDK。 具体包括:全新Responses API:将Chat Completions API简单性与Assistants API工具使用功能相结合,用于构建智能体内置三大工具:网络搜索、文件搜索和计算机使用全新Agents SDK:用于编排单智能体和多智能体工作流程集成可视化工具:用于追踪和检查智能体工作流程执行情况以往,开发者构建一款智能体应用,需要从不同来源拼凑各种底层API。
3/12/2025 10:32:23 AM
在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架
在 ChatGPT 爆火两年多的时间里,大语言模型的上下文窗口长度基准线被拉升,以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。 随之而来的是,长文本推理速度被提出更高要求,而基于现有 Transformer 架构的模型受限于注意力机制的二次方复杂度,难以在较短时延内处理超长文本请求。 针对这一痛点,清华大学 NLP 实验室联手中南大学、北京邮电大学以及腾讯微信 AI 实验室取得了突破,共同提出了 APB 框架 —— 其核心是一个整合了稀疏注意力机制的序列并行推理框架,通过整合局部 KV 缓存压缩方式以及精简的跨 GPU 通信机制,解决了长上下文远距离语义依赖问题,在无性能损失的前提下大幅度提升超长文本预填充的效率。
3/12/2025 10:31:00 AM
机器之心
一行代码、无需训练突破视频生成时长「魔咒」,清华朱军团队开源全新解决方案RIFLEx
自 OpenAI 发布 Sora 以来,视频生成领域迎来爆发式增长,AI 赋能内容创作的时代已然来临。 去年 4 月,生数科技联合清华大学基于团队提出的首个扩散 Transformer 融合架构 U-ViT,发布了首个国产全自研视频大模型 Vidu,打破国外技术垄断,支持一键生成 16 秒高清视频,展现出中国科技企业的创新实力。 Vidu 自去年 7 月上线以来,已服务数千万用户,极大促进了视频内容的智能创作。
3/12/2025 10:25:00 AM
机器之心
X-CLR:通过新型对比损失函数提升图像识别能力
译者 | 刘汪洋审校 | 重楼AI 驱动的图像识别技术正在改变各行各业,从医疗健康和安保,到自动驾驶汽车和零售业。 这些系统能分析海量视觉数据,以惊人的准确度识别模式和物体。 然而,传统图像识别模型面临着不少挑战:它们需要消耗大量计算资源,缺乏良好的扩展性,而且通常难以高效处理大型数据集。
3/12/2025 10:10:21 AM
刘汪洋
快慢双系统!清华&博世最新Chameleon:无需训练即可解决复杂道路拓扑(ICRA'25)
在自动驾驶技术中,车道拓扑提取是实现无地图导航的核心任务之一。 它要求系统不仅能检测出车道和交通元素(如交通灯、标志),还要理解它们之间的复杂关系。 例如,判断车辆是否可以左转进入某条车道,就需要综合考虑交通规则、车道布局和信号灯状态等多种因素。
3/12/2025 10:07:06 AM
自动驾驶之心
OpenAI深夜发布全新Agent工具:两大杀器登场,感觉可以手搓Manus了
可以自己动手手搓Manus了? 刚刚OpenAI举行了一个19分钟的线上发布会,推出全新Agent工具,OpenAI直接祭出自研Agent SDK和Responses API两大杀器! 旨在彻底简化agent开发流程,让开发者和企业都能轻松构建实用又可靠的智能体!
3/12/2025 10:00:44 AM
AI寒武纪
Manus与阿里云通义千问达成合作,共推国产AI智能体产品
人工智能Agent产品新秀Manus与阿里云旗下大语言模型通义千问近日达成战略合作。 根据Manus在其视频号"Manus AI"发布的消息,双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。 目前两家技术团队已开始紧密协作,致力于为中国用户打造更具创造力的通用智能体产品。
3/12/2025 10:00:41 AM
AI在线
重生之我在小红书给AI当老板 元宝动不动崩溃,DeepSeek天天摸鱼
这年头,谁还没个AI打工仔?但你见过直接在群聊里遥控AI军团的赛博老板吗?最近,小红书上就火爆了这样一股清奇画风——网友们纷纷化身AI公司的“霸道总裁”,在群聊里对一众AI模型指点江山,发号施令,上演了一出啼笑皆非的AI职场大戏。 始作俑者是小红书网友Komorebi,她的一条也是当上AI的领导了的图文笔记,瞬间点燃了网友们的玩梗热情。 只见她煞有介事地建了一个工作群,自己当起了人类CEO,一本正经地指挥群里的AI员工们打卡签到。
3/12/2025 9:53:00 AM
AI在线
揭示显式CoT训练机制:思维链如何增强推理泛化能力
基于逐步生成解决方案的大语言模型(LLMs)训练范式在人工智能领域获得了广泛关注,并已发展成为行业内的主流方法之一。 例如,OpenAI 在其「12 Days of OpenAI」直播系列的第二日推出了针对 O1 模型的强化微调(Reinforcement Fine-Tuning,RFT),进一步推动了 AI 定制化的发展[1]。 RFT/ReFT[2] 的一个关键组成部分是使用思维链(Chain-of-Thought,CoT)注释[3] 进行监督微调(Supervised Fine-Tuning,SFT)。
3/12/2025 9:48:19 AM
机器之心