重新思考轨迹预测 | 复旦提出PIFM:如何将规划引入预测?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 && 笔者理解传统的自动驾驶主要可以分为感知、预测、规控三个大的部分,其中预测模块承担着十分重要的角色,为下游规划路径提供重要的信息。 然而,现实世界驾驶环境的复杂性,其中包括多个动态智能体(如车辆和行人)之间的相互作用,给预测造成了不小的挑战。- 968
- 0
AI Agent应用出路到底在哪?
1 Agent/Function Call 的定义Overview of a LLM-powered autonomous agent system:图片Agent学会调用外部应用程序接口,以获取模型权重中缺失的额外信息(预训练后通常难以更改),包括当前信息、代码执行能力、专有信息源访问权限等。 2 从去年到现在有什么进展?Not a research seminar but good to kn…- 968
- 0
一种实现符号钢琴音乐声音和谱表分离的GNN新方法
译者 | 朱先忠审校 | 重楼本文涵盖了我最近在ISMIR 2024上发表的论文《聚类和分离:一种用于乐谱雕刻的声音和谱表预测的GNN方法》的主要内容。 简介以MIDI等格式编码的音乐,即使包含量化音符、拍号或小节信息,通常也缺少可视化的重要元素,例如语音和五线谱信息。 这种限制也适用于音乐生成、转录或编曲系统的输出。- 968
- 0
深入理解多重共线性:基本原理、影响、检验与修正策略
在数据科学和机器学习领域,构建可靠且稳健的模型是进行准确预测和获得有价值见解的关键。 然而当模型中的变量开始呈现出高度相关性时,就会出现一个常见但容易被忽视的问题 —— 多重共线性。 多重共线性是指两个或多个预测变量之间存在强相关性,导致模型难以区分它们对目标变量的贡献。- 968
- 0
谷歌内部项目:大模型 AI 智能体发现了代码漏洞
开源数据库引擎 SQLite 有 bug,还是智能体检测出来的! 通常,软件开发团队会在软件发布之前发现软件中的漏洞,让攻击者没有破坏的余地。 模糊测试 (Fuzzing)是一种常见的软件测试方法,其核心思想是将自动或半自动生成的随机数据输入到一个程序中,并监视程序异常。- 968
- 0
英伟达团队机器训练新方法!仅5次演示让机器生成1000个新demo,李飞飞高徒与徒孙联手出品
人类只需要演示五次,就能让机器人学会一项复杂技能。 英伟达实验室,提出了机器人训练数据缺乏问题的新解决方案——DexMimicGen。 五次演示之后,DexMimicGen就可以直接模仿出1000个新的demo。- 970
- 0
解决真实GitHub Issue能力登顶,字节豆包MarsCode团队分享背后工程实践,踩过的坑也分享了
解决真实GitHub Issue的基准测试,字节家的豆包MarsCode Agent悄悄登顶了。 SWE-Bench,一个由普林斯顿大学提出的极具挑战性的Benchmark,近期受到工业界、学术界和创业团队的广泛关注。 在其子集SWE-Bench Lite排行榜上,豆包MarsCode Agent近期冲上第一。- 968
- 0
基于PyTorch的大语言模型微调指南:Torchtune完整教程与代码示例
近年来,大型语言模型(Large Language Models, LLMs)在自然语言处理(Natural Language Processing, NLP)领域取得了显著进展。 这些模型通过在大规模文本数据上进行预训练,能够习得语言的基本特征和语义,从而在各种NLP任务上取得了突破性的表现。 为了将预训练的LLM应用于特定领域或任务,通常需要在领域特定的数据集上对模型进行微调(Fine-tun…- 968
- 0
Jim Fan全华人团队HOVER问世,1.5M小模型让机器人获「潜意识」!
1.5M参数模型就可以控制人形机器人的身体? ! 英伟达高级科学家Jim Fan表示,并不是每个基础模型都需要规模庞大。- 968
- 0
使用 SHAP 使机器学习模型变的可解释!!
SHAP 是一种解释机器学习模型预测结果的方法,它基于博弈论中的 Shapley 值理论。 它通过计算每个特征对模型输出的贡献度,帮助我们理解模型的决策过程。 SHAP 适用于各种类型的机器学习模型,使得黑盒模型(如深度神经网络、随机森林等)的预测更加透明、可解释。- 968
- 0
慢思考准确率反降30%!普林斯顿揭示思维链某些任务上失效的秘密
OpenAI o1彻底带火慢思考和思维链(CoT)方法,但CoT在某些任务上反而会降低模型表现。 比如给生造的词分类任务,GPT-4在zero-shot提示下的准确率高达94%,换成CoT的准确率却断崖式下跌到64.4%。 内置CoT的o1-preview准确率更是只有57.7%。- 969
- 0
UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪
又一个看似坚固无比的数学理论,被证伪了! 最近,UCLA和MIT的研究者证伪了概率论中众所周知的假设——「上下铺猜想」。 上下铺猜想(Bunkbed Conjecture)也称为双层床猜想,是渗透理论中的一个陈述,该领域处理的是在图的边随机删除后存在的路径和簇。- 970
- 0
十种数据预处理中的数据泄露模式解析:识别与避免策略
在机器学习教学实践中,我们常会遇到这样一个问题:"模型表现非常出色,准确率超过90%!但当将其提交到隐藏数据集进行测试时,效果却大打折扣。 问题出在哪里?"这种情况几乎总是与数据泄露有关。 当测试数据在数据准备阶段无意中泄露(渗透)到训练数据时,就会发生数据泄露。- 969
- 0
Gartner认为企业必须探索的十大战略科技趋势
分析机构Gartner提出了2025年企业“需要探索”的十大战略技术趋势,其中一些趋势涉及人工智能,还有一些涉及数据管理和存储领域。 Gartner杰出的副总裁Gene Alvarez表示:“今年的十大战略技术趋势涉及人工智能的必要性和风险、计算的新前沿以及人机协同,”“跟踪这些趋势将有助于 IT 领导者以负责任并合乎道德的创新塑造组织的未来。 ”2025年最重要的战略技术趋势是:人工智能代理(A…- 968
- 0
大语言模型时代,提示词才是王道:堪比专业翻译软件的提示词
先给大家看看最终效果:商人罗伯特·洛卡西奥,开了个名叫EqualAI的非营利组织,专门应对人工智能开发中那些看不见、摸不着的无意识偏见。 这名字听起来倒是光鲜,然而,他却在《Fast Company》上发了一篇文章,讲的是什么“提示工程”的局限。 事情的由头不过是一个普普通通的提示语:“写篇750字的文章,说说人工智能怎么成了品牌的‘数字门面’,要写得像《Fast Company》的文章那样。- 970
- 0
OpenAI安全大佬,华人科学家翁荔B站首秀!人类如何培养出下一代聪明且安全的AI技术
出品 | 51CTO技术栈(微信号:blog51cto)B站真的啥也能学到! 11月B站的哔哩哔哩超级科学晚活动,竟然请来了OpenAI的研究副总裁(安全)——翁荔! 她是OpenAI的华人科学家,也是ChatGPT的贡献者之一。- 969
- 0
为什么多智能体能够解决LLM无法解决的复杂问题
ChatGPT的引入使得大型语言模型(LLM)在技术行业和非技术行业都得到了广泛应用,这种普及主要归因于两个因素:1. LLM作为知识宝库:LLM基于海量的互联网数据进行训练,并定期更新(即GPT-3、GPT-3.5、GPT-4、GPT-4o等)。 涌现能力:随着LLM的发展,它们展现出小型模型中不具备的能力。- 970
- 0
谷歌员工集体打脸劈柴,25%新代码AI生成夸大事实!Linux之父怒斥90%都是营销
「谷歌内部超1/4新代码,全是由AI生成的」! 上周,CEO劈柴在Q3财报会议上的一句话,瞬间点燃了全网的激烈讨论。 图片AI生成的代码再由工程师进行审核,能够帮助工程师完成更多的工作,加快开发效率然而,也正是这句话,劈柴却遭到了自家员工「打脸」。- 968
- 0
程序员又又又要失业了?有反转!Google CEO称1/4的代码是AI写的!谷歌员工在线打脸:数据明显掺水,工程都是我们做的
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)谷歌不止Q3的财报很强劲。 CEO “劈柴”更是在财报电话会议里曝了个猛料! 图片他指出:谷歌超过四分之一的新代码都是由人工智能生成的!- 968
- 0
大模型也冲“奥斯卡”:港科大腾讯等提出AI角色扮演全景综述,四方面剖析关键细节
AI界也有了自己的“奥斯卡”,哪家大模型角色扮演更入戏? 来自香港科技大学、腾讯、新加坡管理大学的团队提出新综述——不仅系统性地回顾了角色扮演语言模型的发展历程,还对每个阶段的关键进展进行了深入剖析,展示了这些进展如何推动模型逐步实现更复杂、更逼真的角色扮演。 AI世界如同不断扩展的“舞台”,语言模型则是这个舞台上不断精进的“演员”。- 968
- 0
2024 AI年度报告发布,附十大预测:人形机器人热度下降,英伟达维持霸主地位
AI发展之势迅猛,从技术、政策到产品风险,相比从前都有了很大变化。 最近,State of AI发布了2024产业报告,也是调研团队发布的第七份年度报告,从研究进展、行业局势、现有政策、安全问题、未来预测等角度出发,对人工智能行业的现状和预期进行了深度分析。 图片报告链接::前沿实验室的性能开始趋同,专有模型的优势逐渐消失,GPT-4与其他模型之间的差距正在缩小。- 968
- 0
架构赋能 AI:知识工程推动下的软件架构数字化
TL;DR:我们试验了将 AI 应用到基于 Protobuf 的微服务架构中,基于 ArchGuard 治理平台、Shire AI 助手、Team AI 三个工具中,构建了一套完整的 AI4SE 原型,在需求、设计、开发、测试和运维等阶段,这里是我们的思考和实践。 过去几个月里,我们在各大技术大会上频繁看到生成式 AI 的应用,很多研发组织都在尝试将其引入开发的各个环节。 然而,随着 AI 技术的…- 968
- 0
o1满血版泄露!奥数题图片推理手拿把掐,奥特曼上线剧透o2
o1满血版泄露了! 没想到,OpenAI还搁那儿“今年一定”呢,不少网友已经率先上手体验到了(doge)。 事情是酱婶的:有网友发现,OpenAI已经在ChatGPT官网上部署了完整版o1,大家伙儿还都能卡bug直接用!- 968
- 0
理论
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!