资讯列表

分类

标签

Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

耽误业界好多年？「这是有史以来最大、最令人困惑的研究生涯错误，」Andrej Karpathy 感叹道。上个周末，OpenAI 创始成员、研究科学家、原特斯拉前 AI 高级总监、AI 领域的大神 Andrej Karpathy 一直在后悔。

11/18/2024 1:30:00 PM

机器之心

钻石冷却的GPU即将问世：温度能降20度，超频空间增加25%

现阶段这一方案的前景如何？我们尚不得而知。未来 GPU 的发展方向，居然和钻石有关系？

11/18/2024 1:27:00 PM

机器之心

可以实现零代码开发的OPPO智能体平台，到底强在哪？

11 月 16 日，由 OPPO 与浙江大学联合承办的第三届（2024 年）中国高校计算机大赛 —— 智能交互创新赛在浙江省杭州市举行了全国总决赛及颁奖典礼。本届竞赛以 “交互无界，创意无限” 为主题，聚焦人机交互技术，深度挖掘 AI 智能体的应用潜力，推动智能产业的升级和发展。 ▲智能交互创新赛全国总决赛颁奖典礼OPPO 智能体平台强劲助力挖掘智能交互方案创新动能作为赛事承办方之一，OPPO 深度参与竞赛。

11/18/2024 1:25:00 PM

机器之心

继良品率低后，英伟达Blackwell又出过热问题，说好的明年初发货呢？

发言人将「工程迭代」称为「正常且在意料之中」。今年的的 GTC 大会，英伟达将 AI 芯片的标杆推向了难以想象的高度。为了帮助世界构建更大、更智能的 AI，英伟达首先拿出了世界上最先进的 GPU—— Blackwell 系列。

11/18/2024 1:21:00 PM

机器之心

NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强？北大、MIT团队给出理论解释

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

11/18/2024 1:18:00 PM

机器之心

消息称抖音正推进“V”项目，包括直播游戏互动、AI 分身功能等

“V”项目产品包括抖音 App 内已上线的直播游戏互动，以及近期推广的 AI 分身功能。从体验上看，AI 分身输出的内容均由 AI 生成，非创作者本人回复，AI 分身可在创作者设置的场景中与用户互动，可全天 24 小时在线互动。（Tech 星球）

11/18/2024 12:43:24 PM

汪淼

生成式AI对气候变化的影响：既有好处，也有代价

生成式AI是一种强大的工具，有望为包括气候变化在内的诸多现实挑战提供创新解决方案。一方面，它能够模拟复杂场景、优化资源并为环境问题提供创造性的解决方案，为未来勾勒出美好的愿景。但在另一方面，生成式AI在本质上会消耗海量算力和电力资源，因此很可能进一步加剧气候问题。

11/18/2024 12:29:17 PM

印度信实控股机器人公司 Addverb 拟 2025 年推出人形机器人

Addverb 成立于 2016 年，目前在全球设有 15 个办事处，拥有 350 余家客户，目前由亚洲首富穆克什・安巴尼旗下信实集团绝对控股。

11/18/2024 12:05:53 PM

溯波（实习）

视频大模型无损提速：删除多余token，训练时间减少30%，帧率越高效果越好 | NeurIPS

把连续相同的图像块合并成一个token，就能让Transformer的视频处理速度大幅提升。卡内基梅隆大学提出了视频大模型加速方法Run-Length Tokenization（RLT），被NeurIPS 2024选为Spotlight论文。在精度几乎没有损失的前提下，RLT可以让模型训练和推理速度双双提升。

11/18/2024 11:20:00 AM

量子位

人大&港科大揭示大模型重要安全风险漏洞：利用概念激活向量破解大模型的安全对齐｜NeurIPS 2024

利用概念激活向量破解大模型的安全对齐，揭示LLM重要安全风险漏洞。来自人大&港科大的研究人员提出安全概念激活向量（SCAV）框架，通过精确解读大模型的安全机制来指导攻击。基于SCAV的攻击方法能够生成嵌入级和提示级的攻击，自动调整扰动参数，并显著提升了攻击成功率和响应质量。

11/18/2024 11:00:00 AM

量子位

量化能让大模型“恢复记忆”，删掉的隐私版权内容全回来了，SU哈佛亚马逊最新研究引热议

4-bit量化，能让现有反学习/机器遗忘技术失灵！也就是大模型在人类要求下“假装”忘记了特定知识（版权、私人内容等），但有手段能让它重新“回忆”起来。最近，来自宾夕法尼亚州立大学、哈佛大学、亚马逊团队的一项新研究在reddit、Hacker News上引起热议。

11/18/2024 10:50:00 AM

量子位

昆仑万维：国内首款具备中文逻辑推理能力 o1 模型“天工大模型 4.0 O1 版”11 月 27 日启动邀测

据昆仑万维官方介绍，天工大模型 4.0 O1 版是国内第一款具有中文逻辑推理能力的 o1 模型，其在模型输出上支持思考、计划、反思等能力。

11/18/2024 10:25:11 AM

归泷（实习）

14天速成LLM高手！大佬开源学习笔记，GitHub狂揽700星

无论是面试找工作、还是自学创业，甚至想要在圈子内讨论一下AGI的潜力，但凡想要深度参与到AI浪潮中，不可避免的就是学习大型语言模型（LLM）的底层原理。但AI发展这么多年，论文、学习资料多如牛毛，并且更新换代极快，如何快速入门，学习到那些真正的基础知识，对于新手来说都是一个难题。最近，一位AI从业者在网上分享了自己的学习过程，仅用14天就学完了LLM所需要的核心知识，学习笔记在GitHub上斩获了675 星星，并且还在持续上涨。

11/18/2024 10:25:00 AM

新智元

对标o1，Kimi放出了最能打的国产模型

AI 领域正在经历新一轮技术范式的变化，预训练 Scaling Law 放缓之后，推理时间计算成为了新的性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时间，o1 将大模型的能力又往前推了一步。

11/18/2024 10:21:00 AM

机器之心

Scaling Law或将终结？哈佛MIT预警：低精度量化已无路可走，重磅研究掀翻AI圈

就连「量化」也不管用，scaling law真的要终结了吗？一提scaling law，人们重点关注的是参数规模、数据量等因素，却忽视了「精度」这一关键变量。哈佛斯坦福MIT等机构研究人员竟发现，低精度训练会降低模型的「有效参数量」！

11/18/2024 10:15:00 AM

新智元

知乎直答亮相“学术酒吧”开放麦，李开复、刘知远相聚“AI上头俱乐部”

11月15日，知乎于北京举办了一场别开生面的学术酒吧活动—AI上头俱乐部。零一万物 CEO、创新工场董事长李开复，清华大学副教授刘知远，上海交通大学副教授、无问芯穹联合创始人兼首席科学家戴国浩等数十位AI领域领军人物，共同探讨了人工智能的最新发展和未来趋势。此外，知乎直答产品负责人马奎及多位知乎答主登上现场开放麦，在轻松的氛围中交流AI行业背后的故事。

11/18/2024 10:09:00 AM

成妍菁

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

LLM究竟是否拥有类似人类的符合理解和推理能力呢？许多认知科学家和机器学习研究人员，都会认为，LLM表现出类人（或「接近类人」）的语言能力。然而，来自帕维亚大学、柏林洪堡大学、得克萨斯大学休斯顿健康科学中心、纽约大学、巴塞罗那自治大学的研究者却提供了一些最全面的证据，表明目前它们基本没有！

11/18/2024 9:30:00 AM

新智元

「谍战」开启！基建狂魔马斯克122天交付10万卡超算，对手大恐慌派间谍飞机侦查

122天交付10万卡超算，神奇的「马斯克速度」，直接把竞争对手们整崩溃了！消息传出，整个行业都震惊不已。就在今天，The Information甚至曝出内幕大瓜：有人甚至直接租飞机，直接飞到马斯克的数据中心上空侦查。

11/18/2024 9:05:00 AM

新智元

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Figma 推 AI 革命：开发智能应用制作器与网站创建工具即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Persona Engine开源发布，AI虚拟助手与Live2D融合打造交互新体验

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能用户开源学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测百度人形机器人伟达苹果 Transformer 深度学习模态 xAI 字节跳动 Claude 大语言模型搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力视频生成安全干货合集视觉应用大型语言模型科技亚马逊特斯拉 AGI 训练 2024