资讯列表

分类

标签

斯坦福开源学术研究神器STORM再进化，AI智能体像人一样进行圆桌讨论

不仅有主持人，还能得到不同AI专家的解答。今年 4 月，斯坦福大学推出了一款利用大语言模型（LLM）辅助编写类维基百科文章的神器。它就是开源的 STORM，可以在三分钟左右将你输入的主题转换为长篇文章或者研究论文，并能够以 PDF 格式直接下载。

10/27/2024 1:55:00 PM

机器之心

Meta 推出 Llama 3.2 1B / 3B 模型量化版：功耗更低、可适用更多轻量移动设备

继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后，Meta 于 10 月 24 日发布了这两个模型的量化版本，量化后的模型大小平均减少了 56%，RAM 使用量平均减少了 41%，模型速度提高了 2 至 4 倍，同时降低了功耗，使这些模型能够部署到更多移动设备上。 AI在线注：模型量化（Model Quantization）就是通过各种训练方式将浮点模型转为定点模型，可以压缩模型参数，降低模型的复杂性，以便于在更轻量的平台运行。 Meta 表示，他们采用了量化感知训练（Quantization-Aware Training，QAT）和后训练量化（SpinQuant）两种方法对模型进行量化，其中“量化感知训练”更重视模型的准确性，而“后训练量化”更强调模型的可移植性。

10/27/2024 1:53:56 PM

漾仔

深圳一家公司造出世界上最酷机器人，卖2-3万美元

网友：终于不是太奶步伐了。国内惊现「无头」机器人！造出这个机器人的，是一家名叫众擎机器人（EngineAI）的深圳公司。

10/27/2024 1:52:00 PM

机器之心

谷歌这款新概念键盘，治好了我多年的老病

谷歌终于把人机交互给玩明白了？很多整天对着电脑的同学们难免腰酸背疼，有时会发出这样的感叹：我对这键盘受够了！那么问题来了：应该换个机械键盘还是分体式键盘呢？

10/27/2024 1:50:00 PM

机器之心

NeurIPS 2024 | 如何防御对抗性提示攻击？AdvUnlearn让图片生成风险骤降

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

10/27/2024 1:47:00 PM

机器之心

Anthropic 为 Claude 推出 JavaScript 沙盒工具：可 AI 写代码、可上传自有代码运行

Anthropic 现已为 Claude AI 推出了一款 JavaScript 沙盒工具，允许用户利用 Claude 编写 JavaScript 代码、在沙盒环境中上传自己的代码并自动生成运行结果，相应功能目前已作为预览版本向所有用户开放。此外，Anthropic 还提到 Claude AI 新增的这套沙盒工具允许用户加载本地文件，帮助企业快速处理 / 分析客户数据，快速将相关内容进行可视化处理。 ▲ 图源 Claude AIAnthropic 表示，目前他们已进一步提升了 Claude 的代码编写能力，这意味着 Claude 不仅能提供逻辑严谨且经过推敲的答案，还能帮助程序员 / 商务人员调试代码或进行精确高效的运算。

10/27/2024 10:33:44 AM

漾仔

可令 AI 助理同时进行快 / 慢速思考，谷歌 DeepMind 公布具备两种思维模式的 Talker-Reasoner 框架

谷歌 DeepMind 上周公布了一个号称“具备两种思维模式”的 Talker-Reasoner 框架，旨在让 AI 助理能够同时进行快速和慢速思考，目前相关论文已发布于 ArXiv 上（点此访问）。据介绍，这款框架采用“双系统”设计，能够在与用户进行对话的同时并行多步骤推理任务（一边快速回答用户问题，一边高速思考），其中系统 1 Talker LLM 主要负责快速、直觉和合成的语言回应，用于与用户交谈。而系统 2 Reasoner LLM 则负责解决复杂问题，涉及从外界获取信息以增强知识，例如调用工具或从外部数据库检索信息，从而提升系统 1 回应内容的准确度及逻辑性。

10/27/2024 10:20:36 AM

漾仔

北京发布首份教育领域人工智能应用指南

《北京市教育领域人工智能应用指南》于 10 月 26 日发布，明确人工智能在 6 大重点教育领域 29 个典型场景的应用规范，指导学校和师生稳妥有序开展应用实践。两项教育领域人工智能重点任务启动建设，让新技术更“懂”教育。该指南也是由北京市教育行政主管部门委托研制并发布的首份教育领域人工智能应用指南。

10/27/2024 9:11:42 AM

远洋

消息称谷歌将推出“Project Jarvis”：可实现网页任务自动化

据 The Information 报道，谷歌计划在 12 月预览其大型动作模型“Project Jarvis”。知情人士透露，该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。图源 Pexels报道称，“Jarvis”将由未来版本的谷歌 Gemini 驱动，专门针对 Chrome 浏览器进行优化。

10/27/2024 6:47:17 AM

远洋

AI这么厉害，能帮我直接出海报吗？

太肝了！这可能是全网首篇Ideogram系统教程一、智言川语这款 AI 绘画软件 Ideogram，我认为是设计师、运营、自媒体从业人员需要重视起来的，如果你不会或者是不了解它，那么这一篇文章你一定要认真研读一下。阅读文章 .

10/27/2024 12:13:56 AM

58UXD 团队

腾讯研发全球首个大熊猫模型：实时识别、统计、分析大熊猫行为并生成报告

腾讯 10 月 25 日宣布，为了帮助饲养员全方位观察大熊猫，腾讯、中国大熊猫保护研究中心、广东工业大学，联合打造了全球首个大熊猫行为智能识别模型及智慧系统。 AI在线获悉，该模型可以识别大熊猫进食、喝水、睡觉等日常行为，并自动生成日报、周报、月报等可视化数据报表。项目组通过优化 SlowFast 算法，大幅提升了系统在遮挡环境下的行为识别能力，目前室内遮挡场景下的大熊猫行为识别准确率提升到了 80% 以上。

10/26/2024 9:37:06 PM

浩渺

真·开放式游戏，谷歌造出首个无限人生模拟游戏Unbounded

无限游戏真的实现了。如果你是一位开放世界或角色扮演游戏的玩家，你一定梦想过一款无限自由的游戏。没有空气墙，没有剧情杀，也没有任何交互限制。

10/26/2024 3:19:00 PM

机器之心

UCL博士生创业一年，造出最强AI「ML工程师」，OpenAI盖戳认证

重要的事说三遍：Agent 框架很重要。一、被忽略的「Agent 框架」OpenAI 最近又有了新动作，这次他们的野心更大了。鉴于大型语言模型（ LLM ）强大的先验知识和行动/反应能力，让 AI 训练 AI ，可还行？

10/26/2024 3:15:00 PM

机器之心

控制电脑手机的智能体人人都能造，微软开源OmniParser

大模型控制计算机果真就是未来方向？最近这几天，让大模型具备控制计算机（包括电脑和手机）的相关研究和应用如雨后春笋般不断涌现。先是 Anthropic 发布了能控制计算机的新版 Claude 3.5 Sonnet，之后荣耀 MagicOS 9.0 来了个全局智能体，再然后，昨天智谱发布了具备「全栈式工具使用能力」的 AutoGLM，同时华为也公布了一项可让 AI 像人类一样操作手机的新研究成果 LiMAC。

10/26/2024 3:10:00 PM

机器之心

Waymo获得56亿美元融资，有史以来最大一轮

这笔资金将被用于进一步扩展 Waymo 的无人驾驶出租车服务。 Alphabet 旗下的自动驾驶子公司Waymo刚刚完成一轮56亿美元的C轮超额认购融资，以进一步扩大其无人驾驶出租车服务。这是该公司迄今为止筹集的最大一轮融资。

10/26/2024 3:07:00 PM

机器之心

手搓迪士尼同款机器人，总花费不到1500美元

不能拥有迪士尼同款机器人，就自己造一个。还记得迪士尼开发的 BDX 双足机器人吗？这款机器人专为娱乐表演而设计，拥有多项技能，可以跳舞，还可以表演。

10/26/2024 3:06:00 PM

机器之心

无需训练即可创建数字人，字节PersonaTalk视频口型编辑超SOTA

10/26/2024 3:02:00 PM

机器之心

诺贝尔奖是 AI 发展的里程碑时刻！DeepMind 联创 Hassabis 获奖后最新专访

今年的诺奖将物理和化学两个领域的奖项都颁给了 AI 成果，这究竟代表着怎样的含义，又会产生怎样的影响？ Demis Hassabis 在本次专访中提出了自己的见解。 10 月，DeepMind 联合创始人兼 CEO Demis Hassabis 凭借 AlphaFold 成为了诺贝尔化学奖的三位共同获奖者之一。

10/26/2024 2:04:05 PM

清源

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Figma 推 AI 革命：开发智能应用制作器与网站创建工具即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Persona Engine开源发布，AI虚拟助手与Live2D融合打造交互新体验

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测百度人形机器人伟达苹果 Transformer 深度学习模态 xAI 字节跳动 Claude 大语言模型搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力视频生成安全干货合集视觉应用大型语言模型科技亚马逊特斯拉 AGI 训练 2024