应用

全球首次，国星宇航完成卫星在轨运行 AI 大模型技术验证

感谢国星宇航今日宣布完成卫星在轨运行 AI 大模型技术验证，对国星宇航 AI 大模型在轨运行的空间适应性、算力卫星平台可靠性以及高性能算力载荷在轨有效算力进行了验证。时间节点：9 月 24 日 10 时 31 分，国星宇航“一箭三星”在山东海阳成功发射。9 月 25 日 20 时 46 分，试验团队通过地面站以遥控指令形式上注 AI 任务至卫星；9 月 25 日 21 时 11 分，卫星在大西洋北部上空通过星载高性能算力载荷成功启动运行 AI 大模型，AI 大模型太空在轨运行过程及结果通过卫星自带的在轨可视化存证系

10/6/2024 9:19:17 PM

浩渺

安卓版谷歌 Gemini Live 将支持 40 多种语言，提供 AI 语音聊天功能

谷歌公司于 10 月 1 日在 X 平台发布推文，宣布 Gemini 应用现面向所有安卓用户开放 Gemini Live 功能。谷歌官方称，Gemini Live 将支持 40 多种语言，首先推出法语、德语、葡萄牙语、印地语和西班牙语，之后还会推出更多语言。谷歌 Gemini Live 将支持在同一设备上使用最多两种语言进行对话，用户如要使用 Gemini Live，设置中的第一语言必须是以下受支持的语言之一：德语（比利时）德语（德国）德语（瑞士）德语（奥地利）英语（澳大利亚）英语（印度）英语（英国）英语（美国）西

10/6/2024 6:18:28 PM

归泷（实习）

告别CUDA无需Triton！Mirage零门槛生成PyTorch算子，人均GPU编程大师？

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]近日，来自 CMU 的 Catalyst Group 团队发布了一款 PyTorch 算子编译器 Mirage，用户无需编写任何 CUDA 和 Triton 代码就可以自动生成 GPU 内

10/6/2024 4:01:00 PM

机器之心

西班牙马德里动物园为大熊猫配备“AI 保育员”：能用英语、西语答疑，还能不断学习

感谢据央视新闻今日报道，西班牙马德里动物园为两只大熊猫“金喜”“茱萸”配备了一个“AI 保育员”—— 伊雷尼娅，其由网络安全、大数据等方面专家组成的团队创建，以虚拟人类的形象出现在马德里动物园大熊猫馆旁的大屏幕上。AI在线获悉，功能方面，伊雷尼娅能够为游客们提供实时信息并展开互动，且可以以“熊猫养育领域专家”的身份，用英语、西班牙语来回答游客的问题，展示视频和图片。值得一提的是，AI 使伊雷尼娅具有不断学习的能力，其知识库未来还将持续扩大，涵盖园内其余动物，有望使用更多种语言回答问题。马德里动物园营销总监塞尔吉奥・

10/6/2024 3:42:27 PM

清源

最新 AI 生图模型 Flux1.1 隐藏玩法，添加单反相机文件名获得超写实图像

聊天机器人帮你“深入了解”约会对象，Grindr 将推出“AI 僚机”功能

据《华尔街日报》北京时间今天报道，约会平台 Grindr 宣布推出专为用户设计的 AI 助手，预计在 2027 年前后完全上线，届时可为 1400 万名用户提供服务。该 AI 助手可用于跟踪用户与心仪对象的对话，并为其提供适合的长期伴侣、为约会地点提供建议。未来，该助手还将具备更多“AI 智能体”的功能，譬如预定餐厅、与另一个“AI 智能体”进行约会。具体来看，当两名用户匹配之后，用户各自的 AI 助手可以互相交流，以便在实际约会前对彼此有更深入的了解。Grindr 的首席执行官乔治・阿利森表示，机器人之间的对话不

10/6/2024 9:04:34 AM

清源

软银 CEO 孙正义：将重视开发可读取大量学习数据的高性能大型 AI

据共同社报道，软银集团董事长兼 CEO 孙正义于 3 日在公司活动中发表演讲，就生成式 AI 提出了“在竞争中，只有最优秀的才有价值”的观点。孙正义表示，将重视开发能够读取大量学习数据的高性能大型 AI。软银将 AI 作为业务战略的核心，通过旗下的“软银愿景基金”等向相关企业投资。他还提到了日本本土企业正在研发的轻量型生成式 AI（可用于抑制数据和电力消费量），将其评价为“美丽日本式的努力，但仅是小成功”。孙正义提到了 OpenAI 于 9 月发布的最新模型（AI在线注：OpenAI 首款具备“推理”能力的模型 o

10/6/2024 8:12:48 AM

清源

Meta又给OpenAI一记重击，视频生成Movie Gen震撼登场，甚至可以配音、编辑

视频生成领域真是越来越卷且越来越迈向实用性！在 OpenAI Sora 难产的时候，Meta 首次公开展示了自家的「用于媒体的突破性生成式 AI 研究」：Meta Movie Gen。Meta 在相应博客中使用了「premiere」一词，也就是初次展示，因此手痒的用户可能还得再等上一段时间。Meta 表示：「无论是希望在好莱坞大展身手的电影制作人，还是爱好为观众制作视频的创作者，我们相信每个人都应该有机会使用有助于提高创造力的工具。」根据 Meta 的描述，Movie Gen 的功能包括：文本生成视频和音频、编辑已

10/5/2024 3:20:00 PM

机器之心

Claude AI 被曝正研发新功能，突破 20 万 tokens 文件处理上限

科技媒体 testingcatalog 今天（10 月 5 日）发布博文，报道称 Anthropic 公司扩展了 Claude 功能，支持用户处理上下文窗口超过 20 万 tokens 的文件。AI在线注，Claude 当前在处理用户上传、超出限制的文件后，会跳出以下错误，显示当前文件的字符数量超过了 Claude 能处理的上限。不过 Anthropic 正在研发新的功能，通过分块提取内容与其进行交互，从而支持用户上传超过处理上限的文件。图源：testingcatalog这项改进意味着 Claude 扩展了处理文件

10/5/2024 3:16:01 PM

故渊

号称击败Claude 3.5 Sonnet，媲美GPT-4o，开源多模态模型Molmo挑战Scaling law

Molmo，开源多模态模型正在发力！虽然大家一直在期待谷歌、OpenAI 等等拥有无限资金储备和顶尖人才的大厂做出新的 Sota 模型。不过，一家默默耕耘的创业公司 Ai2 发布了一款多模态人工智能模型 Molmo。在下面展示的视频中，我们可以看到 Molmo 就像钢铁侠的「贾维斯」一样万能。想卖自行车，咨询一下 Molmo 的建议，仅靠一张照片，Molmo 就能把自行车的颜色、品牌和二手售价搞清楚，并且帮你写出一句顺口的广告语。它也可以从虚拟世界帮你解决现实世界的问题，说一句：「Molmo，帮我买杯星巴克的南瓜拿

10/5/2024 3:05:00 PM

机器之心

氛围感拉满：微软新专利探索 Copilot AI 应用，匹配视频等生成音乐

科技媒体 Windows Report 昨日（10 月 4 日）发布博文，报道称微软公司获得了一项新的专利，构想 Copilot 在未来能辅助用户创建和视频、文本、PowerPoint 等匹配的音乐或者背景音乐。AI在线注：微软该专利名为《Artificial intelligence model for composing audio scores》，主要探讨了基于输入内容，来创建音乐的方法。该专利主要概述了以下步骤：收集数据：收集大量的训练数据，这些数据包括许多包含视频和音频组件的视听数据集。分析提取：分析数据

10/5/2024 2:32:54 PM

故渊

谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用：腰斩击穿价 0.15 美元买百万 tokens 输出

科技媒体 NeoWin 昨日（10 月 4 日）发布博文，报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型，成为谷歌公司最便宜的 AI 模型。AI在线曾于今年 8 月报道，谷歌公司推出 3 款 Gemini 实验性模型，其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型，拥有 80 亿参数，专为多模态任务而设计，包括大容量任务和长文本摘要任务。相比较原版 Gemini 1.5 Flash，Gemini 1.5 Flash 8B 延迟更低，特别适合聊

10/5/2024 12:40:26 PM

故渊

Meta 发布 AI 视频生成器 Movie Gen：可自动生成含声音的高清视频

Meta 公司今天宣布了一款新的 AI 视频生成器 Movie Gen，该工具能够生成带有声音的高清视频。几个月前，其竞争对手 OpenAI 也推出了其文本转视频模型 Sora。输入文本 Movie Gen 就能自动生成视频，还可以编辑现有的视频或静止图像。据《纽约时报》报道，添加到视频中的音频也是 AI 生成的，通过环境噪音、音效和背景音乐与视频相匹配，视频支持不同的纵横比。Meta 表示，Movie Gen 还可以利用图像作为基础素材来生成特定的视频内容，或更改现有视频中的元素。Movie Gen 还可以用于编

10/4/2024 11:20:58 PM

远洋

AI 赋能游戏开发：Valve 工程师借助 ChatGPT 改进《Deadlock》匹配算法

感谢Valve 工程师 Fletcher Dunn 昨日在社交媒体上分享了他使用 ChatGPT 改进《Deadlock》匹配算法的经历。他表示，ChatGPT 就像一个高级搜索引擎，能够帮助他找到所需的解决方案。Dunn 在《Deadlock》的测试阶段向 ChatGPT 提出了改进匹配算法的需求，ChatGPT 建议他使用匈牙利算法。Dunn 采纳了这个建议，并表示他对 ChatGPT 的强大功能感到惊讶。Dunn 认为，ChatGPT 的强大之处在于能够理解自然语言并提供相关信息。即使在专业领域如游戏开发，C

10/4/2024 6:40:36 PM

远洋

最强文生图 AI 模型 Flux 再进化：出图速度快 6 倍，Elo 评分冲上 1153 傲视群雄

科技媒体 The Decoder 昨日（10 月 3 日）发布博文，报道称 Black Forest Labs 最新推出了 Flux 1.1 Pro，并以 Beta 版的形式推出 BFL API。黑森林实验室（Black Forest Labs）是一家位于德国的初创公司，专注于开发最先进的生成性人工智能模型。Flux 简介Flux 在 AI 文生图领域有着“最强”称号，在多个方面有着卓越表现：生成质量：Flux 在图像生成的质量上表现出色，能够处理多种风格，包括二次元、人像、写实和风景等。用户反馈显示，其生成的图像

10/4/2024 4:09:57 PM

故渊

突发！Sora负责人Tim Brooks离职，还是被谷歌抢走的

最近这些天，OpenAI 很好地诠释了什么是福祸相依。一方面，该公司的高层动荡不停，重要成员纷纷离职；另一方面，它又成功赢得了投资者的青睐，在 1570 亿美元估值的基础上融了一笔 66 亿美元的巨款。今天的情况同样如此，OpenAI 刚刚发布 canvas 后不久，又痛失一员大将：Sora 团队负责人 Tim Brooks 跑了，还加入了竞争对手谷歌 DeepMind。消息公布后，DeepMind 联合创始人 Demis Hassabis 第一时间出来迎接，并称很期待与他一起「将久未实现的创造世界模拟器的梦想变成

10/4/2024 4:06:00 PM

机器之心

刚刚，OpenAI重磅发布交互界面canvas，让ChatGPT成为写作和编程利器

OpenAI 刚刚融资，就迫不及待开始证明自己了。今日凌晨，OpenAI 宣布推出类似 Anthropic 的 Artifacts 的应用 canvas，并称「这是一种使用 ChatGPT 写作和编程的新方式」。在 Claude 中试过 Artifacts 的朋友都知道，这能极大提升 LLM 输出结果的表现力，其支持输出文本文件、代码、网页、SVG 等等。此前风靡一时的「汉语新解」便是基于 Claude 的 Artifacts 功能。但让 ChatGPT 用户感到遗憾的是，Artifacts 上线三个多月了，Ope

10/4/2024 4:04:00 PM

机器之心

Noam Brown早已预示o1强大推理能力，演讲深度解析AI推理研究脉络

不久之前，OpenAI 发布了 o1 系列模型，其强大的推理能力让我们看见了 AI 发展的新可能。近日，OpenAI 著名研究科学家 Noam Brown 一份 5 月的演讲上线网络，或可揭示 o1 背后的研究发展脉络。在这个题为「关于 AI 规划力量的寓言：从扑克到外交」的演讲中， Brown 介绍了扑克、围棋和外交等游戏领域的研究突破，并尤其强调了搜索/规划算法在这些成就中的关键作用。之后，他也指出了搜索/规划研究在改进机器学习模型方面的潜在未来。Noam Brown，如果你还不熟悉这个名字：他是 OpenAI

10/4/2024 4:00:00 PM

机器之心

资讯热榜

Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna AI视频资讯早读！7个产品更新+8个案例精选纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相腾讯混元3D AI引擎2.5即将揭晓，3D生成技术再升级 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放白板+代码编辑器组合工具pad.ws：开发者可在同一界面画图编程，实现边画边写代码

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion Gemini 马斯克算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测人形机器人百度伟达苹果 Transformer 深度学习 xAI 模态字节跳动大语言模型 Claude 搜索驾驶神器推荐文本具身智能 Copilot LLaMA 算力安全视觉视频生成干货合集应用大型语言模型科技亚马逊训练特斯拉 AGI DeepMind

应用

全球首次，国星宇航完成卫星在轨运行 AI 大模型技术验证

安卓版谷歌 Gemini Live 将支持 40 多种语言，提供 AI 语音聊天功能

告别CUDA无需Triton！Mirage零门槛生成PyTorch算子，人均GPU编程大师？

西班牙马德里动物园为大熊猫配备“AI 保育员”：能用英语、西语答疑，还能不断学习

最新 AI 生图模型 Flux1.1 隐藏玩法，添加单反相机文件名获得超写实图像

聊天机器人帮你“深入了解”约会对象，Grindr 将推出“AI 僚机”功能

软银 CEO 孙正义：将重视开发可读取大量学习数据的高性能大型 AI

Meta又给OpenAI一记重击，视频生成Movie Gen震撼登场，甚至可以配音、编辑

Claude AI 被曝正研发新功能，突破 20 万 tokens 文件处理上限

号称击败Claude 3.5 Sonnet，媲美GPT-4o，开源多模态模型Molmo挑战Scaling law

氛围感拉满：微软新专利探索 Copilot AI 应用，匹配视频等生成音乐

谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用：腰斩击穿价 0.15 美元买百万 tokens 输出

Meta 发布 AI 视频生成器 Movie Gen：可自动生成含声音的高清视频

AI 赋能游戏开发：Valve 工程师借助 ChatGPT 改进《Deadlock》匹配算法

最强文生图 AI 模型 Flux 再进化：出图速度快 6 倍，Elo 评分冲上 1153 傲视群雄

突发！Sora负责人Tim Brooks离职，还是被谷歌抢走的

刚刚，OpenAI重磅发布交互界面canvas，让ChatGPT成为写作和编程利器

Noam Brown早已预示o1强大推理能力，演讲深度解析AI推理研究脉络