系统

DeepSeek突袭公布成本利润率:545%

五连开源后,DeepSeek还有One More Thing! 就在刚刚,DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。 重点包括,优化吞吐量和延迟的方法:跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计:每个H800节点每秒有73.7k/14.8k个输入/输出token成本利润率545%更多细节,一起来看官方原文↓更大的吞吐,更低的延迟DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。

工信部新规:智能驾驶辅助系统须限制不规范使用行为

2月28日,工信部发布《智能网联汽车产品准入、召回及软件在线升级管理与技术指南》,明确要求智能网联汽车系统在驾驶员未规范使用组合驾驶辅助功能时,应具备禁止激活相应功能等限制策略。 这一新规旨在进一步提升智能驾驶辅助系统的安全性与可控性。 根据指南,智能网联汽车系统需具备明确的激活、执行和退出策略。

岚图汽车将发布超高效 AI 语音对话系统,响应小于 1 秒

岚图汽车宣布,其自主研发的 AI 语音对话系统将于2025年上半年正式发布,并应用于即将推出的新车型。 该系统的响应时间极快,所有操作的反应时间都将小于1秒,这意味着车主在使用语音控制车辆时可以获得更为顺畅的体验。 此外,该系统还具备超过98% 的唤醒识别率,能够精准识别用户的指令。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现,CEO皮猜也来站台了

CEO皮猜亲自站台,谷歌的最新研究狠狠火了——为科学家群体推出“科研搭子”AI co-scientist,一个能够利用高级推理综合大量文献、生成新颖假设,并提出详细研究计划的多智能体AI系统。 划重点,该系统将与OpenAI o1/DeepSeek-R1相似的测试时间计算用来加速科学发现。 据皮猜介绍,这个系统已经在肝脏纤维化治疗、抗菌耐药性和药物再利用等重要研究领域取得了初步成果。

黑客如何利用快速工程技术操纵代理人工智能

“代理”人工智能时代已经到来,企业再也不能忽视其变革潜力。 人工智能代理独立运作,根据其编程做出决策并采取行动。 Gartner预测,到2028年,15% 的日常业务决策将完全由人工智能代理自主做出。

AI编码工具Bolt:是神器还是鸡肋?

David Eastman 试用了新的 AI 编码工具 Bolt。 他现它在某些方面做得很好,但他渴望更精细的控制。 译自 Introduction to Bolt: Does It Suit Professional Developers?,作者 David Eastman。

攻破AI最强守卫,赏金2万刀!Anthropic新方法可阻止95% Claude「越狱」行为

最近,Anthropic安全研究团队「有点忙」。 本月4日,Anthropic在X上,邀请网友挑战新的AI防护系统。 两天后,Anthropic称:目前,没有人完全越狱新系统,因此提高了赌注。

2024年十大人工智能研究论文:收获与应用

2024年,人工智能领域迎来了令人惊叹的创新浪潮。 这一年,从大型语言模型的飞跃到计算机视觉和AI安全的革命性突破,研究界不断突破自我,带来了无数惊喜。 面对如此多的前沿成果,哪些真正让人眼前一亮?

HtmlRAG:RAG系统中,HTML比纯文本效果更好

HtmlRAG 方法通过使用 HTML 而不是纯文本来增强 RAG 系统中的知识表示能力。 通过 HTML 清洗和两步块树修剪方法,在保持关键信息的同时缩短了 HTML 文档的长度。 这种方法优于现有基于纯文本的RAG的性能。

浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

大模型智能体正在迅速发展,能力已不再局限于 API 调用。 诸如OpenAI的Operator和Anthropic的Computer Use等,能够像人类一样直接与界面交互,执行复杂操作。 在处理这类复杂任务的过程中,大模型智能体将问题分解为可执行的工作流(Workflow)是关键的一步。

Claude创始人:AI全面超越人类,只剩2-3年

在最新的对话访谈当中,Claude厂家Anthropic的CEO Dario Amodei谈论了他对于AI未来的看法。 他认为,AI确有可能在短期内替代部分人类的工作,但让AI与人类形成互补才是对生产力最有益的方式。 对于当下的年轻人,Amodei也给出了他的建议,鼓励其学会使用AI工具并培养批判思维能力。

你的LLM评估方法过时了吗?这三个范式转变不容错过

在我的职业生涯中,我一直致力于为机器学习系统打造评估体系。 在担任 Quora 数据科学部门负责人时,我们为新闻源排序、广告投放、内容审查等构建了评估机制。 在 Waymo,我们团队为自动驾驶汽车开发了评估标准。

斯坦福AI科研神器开源,一键成文GPT-4o mini加持!科研写作彻底解放双手

AI写作神器,竟被斯坦福开源了! 在OpenAI与Perplexity绞尽脑汁去动谷歌搜索的蛋糕时,斯坦福研究团队却「于无声处响惊雷」,一鸣惊人推出了支持避开信息盲点、全面整合可靠信息、从头写出维基长文的STORM&Co-STORM系统。 图片背后模型是由必应搜索,以及GPT-4o mini加持。

Anthropic预测:2025是智能体系统年!年终总结分享最佳实践

模型到应用之间的距离,就是烧钱与搞钱之间的距离。 这条路上,Agent已经身经百战,万事俱备。 在这个2024的结尾,Anthropic开发者关系主管Alex Albert表示:2025年将是智能体系统之年!

掌握多云:AI工作负载的简单成本优化技巧

现实案例展示了企业如何在多云 AI 中实现成本效益。 译自Master Multicloud With These Simple Cost Tips for AI Workloads,作者 Advit Patel。 现代人工智能的进步依赖于数据处理、模型训练和实时推理。

HuggingFace工程师亲授:如何在Transformer中实现最好的位置编码

在 Transformer 模型中,位置编码(Positional Encoding) 被用来表示输入序列中的单词位置。 与隐式包含顺序信息的 RNN 和 CNN 不同,Transformer 的架构中没有内置处理序列顺序的机制,需要通过位置编码显式地为模型提供序列中单词的位置信息,以更好地学习序列关系。 位置编码通常通过数学函数生成,目的是为每个位置生成一个独特的向量。

大模型应用系列:从Ranking到Reranking

每个搜索引擎背后都隐藏着一个至关重要却往往被忽视的组成部分——Reranking(重新排名)。 那么,什么是Rerank呢? 简而言之,这一过程旨在优化并调整搜索结果的顺序,使之更加精准地匹配用户的查询需求。

LVLM赋能端到端!地平线&华科联手打造更强自动驾驶系统Senna!

本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解近年来,自动驾驶技术发展迅速,在驾驶感知、运动预测、规划等领域取得了重大进展,为实现更准确、更安全的驾驶决策奠定了坚实的基础。 其中,端到端自动驾驶技术取得了重大突破,端到端方法以大规模数据为基础,展现出卓越的规划能力。