资讯列表
清华新VLA框架加速破解具身智能止步实验室“魔咒”,LLM开销节省4-6倍 | NeurIPS'24
计算、存储消耗高,机器人使用多模态模型的障碍被解决了! 来自清华大学的研究者们设计了DeeR-VLA框架,一种适用于VLA的“动态推理”框架,能将LLM部分的相关计算、内存开销平均降低4-6倍。 (VLA:视觉-语言-动作模型,代表一类用于处理多模态输入的模型)简单来说,DeeR-VLA就像人的决策系统:简单任务快速思考,复杂任务仔细思考。
微信公众号后台新增“AI 配图”功能
微信公众号后台最近推出了一项全新功能,在文章编辑过程中,除了传统的从图片库选择和本地上传图片外,新增了一个选项 ——“AI 配图”。
解读小模型—SLM
大模型的世界几乎每天都在发生变化。 一方面,人们越来越重视开发更大、更强大的语言模型,以实现通用人工智能(AGI)。 这些大模型通常位于拥有数十万GPU的大型数据中心中。
终于把神经网络中的知识蒸馏搞懂了!!!
大家好,我是小寒今天给大家分享神经网络中的一个关键知识点,知识蒸馏知识蒸馏是一种模型压缩方法,用于将大型神经网络(教师模型)中的知识转移到较小的神经网络(学生模型)中。 这一技术能够在保持或接近原始模型性能的情况下,显著减小模型的体积,从而提升推理效率。 知识蒸馏在很多场景中非常有用,尤其是在计算资源有限或需要部署到边缘设备的应用中。
想成为营销高手?AI 带你飞
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 基于 Chatbots(聊天机器人)如何提高营销活动投资回报率...在竞争激烈的市场环境下,如何提升营销活动的有效性,最大化营销投资回报率(ROI)是每一位营销人关注的焦点。 而 . Chatbots(聊天机器人)作为一种新兴的营销工具,以其独特的优势为营销人员提供了解决方案。
关于计算机视觉中的自回归模型,这篇综述一网打尽了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。
Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿
大模型回答人类的对话内容,究竟有多少「智能」成分在里面? 本周五,知名 AI 领域学者,OpenAI 创始成员、特斯拉前 AI 高级总监 Andrej Karpathy 发表观点:「人们对『向人工智能询问某件事』的解释过于夸张」,引发网友热议。 Karpathy 称:人工智能基本上是通过模仿人工标注数据来进行训练的语言模型。
ICLR 惊现[10,10,10,10]满分论文,ControlNet 作者新作,Github 5.8k 颗星
机器之心报道,编辑:佳琪、蛋酱。
ChatGPT 两岁,OpenAI 10 亿用户计划曝光
ChatGPT 已经 2 岁了!OpenAI 下一个目标瞄准十亿用户,预计明年放出 AI 智能体产品。就在生日这天,马斯克还送上了大礼:阻止 OpenAI 全面盈利的一份诉状书。
清华大学打造,人工智能医院年底前正式上线
据央视新闻报道,清华大学智能产业研究院(AIR)团队打造的首家“AI 医院”Agent Hospital 正在进行内测,将于年底正式上线,并于明年上半年对公众开放。
阿里云通义万相推出图像编辑模型 ACE:一句话即可让 AI 修改图片
该工具可应用于风格化写真、分镜制作、室内设计等场景。该模型已面向全球开发者开源,其局部风格化功能已上线通义App。
apk 文件显示,谷歌 Gemini 未来将支持代码文件夹 AI 分析功能
如果这一功能上线,用户将能够直接向 Gemini 上传代码文件夹。虽然 Gemini 已具备阅读单个代码文件并提供反馈的能力,但实际开发项目往往由多个代码文件组成。
国家管网“管网”大模型正式上线应用,基于华为算力底座和技术栈
据华为官方消息,11 月 29 日,国家管网集团“管网”大模型正式上线应用。“管网”大模型基于华为算力底座和技术栈,打造“管网制度流程 + 数据 + IT + 大模型”体系,构建具有管网特色的大模型方案。
我国生成式人工智能产品用户规模达 2.3 亿人,占整体人口 16.4%
据央视新闻消息,截至 2024 年 6 月,我国生成式人工智能产品的用户规模达 2.3 亿人,占整体人口的 16.4%。
三名高中生,为近百年的分形定理带来了新证明
最近的高中生有点猛。 前有 17 岁高中生证明数学界存在 27 年难题,再有高中生论文入选 AI 领域顶会 NeurIPS,还有高中生用 10 种方法花式证明勾股定理! 本周,量子杂志又介绍了另一个早早就在数学领域展露头角的三人高中生团队:Niko Voth(右上)、Joshua Broden(右下)和 Noah Nazareth(最左)。
首个被人类骗钱的 AI 诞生:近 5 万美元不翼而飞,马斯克转发
11 月 22 日晚 9 点,一个名为 Freysa 的神秘 AI 智能体被发布。这个 AI,是带着使命诞生的。它的任务是:在任何情况下,绝对不能给任何人转账,不能批准任何资金的转移。
陶哲轩:通义千问QwQ奥数真厉害,开源大模型顶流
QwQ 具有神奇的推理能力。 一个刚发布两天的开源模型,正在 AI 数学奥林匹克竞赛 AIMO 上创造新纪录。 本周五,知名数学家、加州大学洛杉矶分校教授、菲尔茨奖得主陶哲轩(Terence Tao)介绍了第二届 AIMO 竞赛的最新进展。
GPT-5涌现能力可预测?UC伯克利仅使用当前模型检查点预测未来模型
LLM 规模扩展的一个根本性挑战是缺乏对涌现能力的理解。 特别是,语言模型预训练损失是高度可预测的。 然而,下游能力的可预测性要差得多,有时甚至会出现涌现跳跃(emergent jump),这使得预测未来模型的能力变得具有挑战性。