应用

因 AI 生成的艺术作品注册申请被拒，当事艺术家向美国版权局提出上诉

据 Ars Technica 今晚报道，贾森・艾伦（Jason Allen）是一位合成媒体艺术家，他因通过 Midjourney 创作的作品《太空歌剧院》（“Théâtre D’opéra Spatial”）在州艺术比赛中获奖而引发了广泛的关注和争议。然而在去年秋天，美国版权局拒绝了他对该作品的注册申请，并认为其几乎完全是由 AI 生成的。▲ 图为当事艺术作品美国版权局当时给出的理由是：申请作品必须具有一定的人类创作成分，单纯输入提示词到 Midjourney 并不足以构成创作。目前事情迎来了最新进展：艾伦目前正在

10/7/2024 7:32:56 PM

清源

「世界开源新王」Reflection 70B 跌落神坛？重测跑分暴跌实锤造假

「世界开源新王」Reflection 70B，才坐上王座没几天就被打假，跌落神坛了！甚至有人质疑，它莫不是套壳的 Sonnet 3.5？发布者 Matt Shumer 和 Sahil Chaudhary 经过一番挣扎，已经光速「滑跪」，po 出的复盘长文也是亮点满满。「开源新王」Reflection 70B，才发布一个月就跌落神坛了？9 月 5 日，Hyperwrite AI 联创兼 CEO Matt Shumer 在 X 上扔出一则爆炸性消息 ——用 Meta 的开源 Llama 3.1-70B，团队微调出了 R

10/7/2024 4:06:50 PM

清源

Meta 证实：Ray-Ban 眼镜拍摄的照片和视频会被用于训练 AI 模型

据 TechCrunch 报道，Meta 公司证实，用户用 Ray-Ban Meta 智能眼镜拍摄的照片和视频可能会被用于训练其 AI 模型。Meta 政策传播经理 Emil Vazquez 在一封电子邮件中表示：“在多模态 AI 可用的地区（目前为美国和加拿大），与 Meta AI 共享的图像和视频可能会被用于改进我们的 AI 模型，这符合我们的隐私政策。”此前，Meta 一位发言人澄清称，只要用户不将照片和视频提交给 AI，这些数据就不会被用于训练 Meta 的 AI 模型。然而，一旦用户要求 Meta AI

10/7/2024 9:21:28 AM

远洋

Gartner：到 2027 年，生成式 AI 将促使 80% 的软件工程师提升自身技能

市场调查机构 Gartner 于 10 月 3 日发表预测，到 2027 年，生成式 AI 将在软件工程和运维领域催生新的工作岗位，80% 的工程师将需要进行技能提升。Gartner 高级首席分析师 Philip Walsh 表示：“对 AI 潜力的大胆预测引发了人们的猜测，认为 AI 可能减少对人类工程师的需求，甚至完全取代他们。尽管 AI 将重新定义软件工程师的角色，但人类的专业知识和创造力仍然是开发复杂、创新软件的关键。”AI在线从报告获悉，AI 将在如下三阶段影响软件工程师的工作。短期：AI 仍将在一定范围

10/6/2024 10:56:48 PM

清源

古尔曼：苹果 Apple Intelligence 将于 10 月 28 日与 iOS 18.1 一起推出

彭博社记者马克・古尔曼在最新一期 Power On 节目中透露，Apple Intelligence 功能将于 10 月 28 日与 iOS 18.1 一起推出。AI在线从苹果官方消息获悉，Apple Intelligence 推出后，即可免费提供给 iPhone 15 Pro、iPhone 16 和 iPhone 16 Pro 用户。使用搭载 M1 或更新处理器的 Mac 或 iPad 用户也可以使用 Apple Intelligence 功能。初期，该功能将率先支持美式英语。今年 12 月，澳大利亚、加拿大、新

10/6/2024 9:35:07 PM

浩渺

全球首次，国星宇航完成卫星在轨运行 AI 大模型技术验证

感谢国星宇航今日宣布完成卫星在轨运行 AI 大模型技术验证，对国星宇航 AI 大模型在轨运行的空间适应性、算力卫星平台可靠性以及高性能算力载荷在轨有效算力进行了验证。时间节点：9 月 24 日 10 时 31 分，国星宇航“一箭三星”在山东海阳成功发射。9 月 25 日 20 时 46 分，试验团队通过地面站以遥控指令形式上注 AI 任务至卫星；9 月 25 日 21 时 11 分，卫星在大西洋北部上空通过星载高性能算力载荷成功启动运行 AI 大模型，AI 大模型太空在轨运行过程及结果通过卫星自带的在轨可视化存证系

10/6/2024 9:19:17 PM

浩渺

安卓版谷歌 Gemini Live 将支持 40 多种语言，提供 AI 语音聊天功能

谷歌公司于 10 月 1 日在 X 平台发布推文，宣布 Gemini 应用现面向所有安卓用户开放 Gemini Live 功能。谷歌官方称，Gemini Live 将支持 40 多种语言，首先推出法语、德语、葡萄牙语、印地语和西班牙语，之后还会推出更多语言。谷歌 Gemini Live 将支持在同一设备上使用最多两种语言进行对话，用户如要使用 Gemini Live，设置中的第一语言必须是以下受支持的语言之一：德语（比利时）德语（德国）德语（瑞士）德语（奥地利）英语（澳大利亚）英语（印度）英语（英国）英语（美国）西

10/6/2024 6:18:28 PM

归泷（实习）

告别CUDA无需Triton！Mirage零门槛生成PyTorch算子，人均GPU编程大师？

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]近日，来自 CMU 的 Catalyst Group 团队发布了一款 PyTorch 算子编译器 Mirage，用户无需编写任何 CUDA 和 Triton 代码就可以自动生成 GPU 内

10/6/2024 4:01:00 PM

机器之心

西班牙马德里动物园为大熊猫配备“AI 保育员”：能用英语、西语答疑，还能不断学习

感谢据央视新闻今日报道，西班牙马德里动物园为两只大熊猫“金喜”“茱萸”配备了一个“AI 保育员”—— 伊雷尼娅，其由网络安全、大数据等方面专家组成的团队创建，以虚拟人类的形象出现在马德里动物园大熊猫馆旁的大屏幕上。AI在线获悉，功能方面，伊雷尼娅能够为游客们提供实时信息并展开互动，且可以以“熊猫养育领域专家”的身份，用英语、西班牙语来回答游客的问题，展示视频和图片。值得一提的是，AI 使伊雷尼娅具有不断学习的能力，其知识库未来还将持续扩大，涵盖园内其余动物，有望使用更多种语言回答问题。马德里动物园营销总监塞尔吉奥・

10/6/2024 3:42:27 PM

清源

最新 AI 生图模型 Flux1.1 隐藏玩法，添加单反相机文件名获得超写实图像

聊天机器人帮你“深入了解”约会对象，Grindr 将推出“AI 僚机”功能

据《华尔街日报》北京时间今天报道，约会平台 Grindr 宣布推出专为用户设计的 AI 助手，预计在 2027 年前后完全上线，届时可为 1400 万名用户提供服务。该 AI 助手可用于跟踪用户与心仪对象的对话，并为其提供适合的长期伴侣、为约会地点提供建议。未来，该助手还将具备更多“AI 智能体”的功能，譬如预定餐厅、与另一个“AI 智能体”进行约会。具体来看，当两名用户匹配之后，用户各自的 AI 助手可以互相交流，以便在实际约会前对彼此有更深入的了解。Grindr 的首席执行官乔治・阿利森表示，机器人之间的对话不

10/6/2024 9:04:34 AM

清源

软银 CEO 孙正义：将重视开发可读取大量学习数据的高性能大型 AI

据共同社报道，软银集团董事长兼 CEO 孙正义于 3 日在公司活动中发表演讲，就生成式 AI 提出了“在竞争中，只有最优秀的才有价值”的观点。孙正义表示，将重视开发能够读取大量学习数据的高性能大型 AI。软银将 AI 作为业务战略的核心，通过旗下的“软银愿景基金”等向相关企业投资。他还提到了日本本土企业正在研发的轻量型生成式 AI（可用于抑制数据和电力消费量），将其评价为“美丽日本式的努力，但仅是小成功”。孙正义提到了 OpenAI 于 9 月发布的最新模型（AI在线注：OpenAI 首款具备“推理”能力的模型 o

10/6/2024 8:12:48 AM

清源

Meta又给OpenAI一记重击，视频生成Movie Gen震撼登场，甚至可以配音、编辑

视频生成领域真是越来越卷且越来越迈向实用性！在 OpenAI Sora 难产的时候，Meta 首次公开展示了自家的「用于媒体的突破性生成式 AI 研究」：Meta Movie Gen。Meta 在相应博客中使用了「premiere」一词，也就是初次展示，因此手痒的用户可能还得再等上一段时间。Meta 表示：「无论是希望在好莱坞大展身手的电影制作人，还是爱好为观众制作视频的创作者，我们相信每个人都应该有机会使用有助于提高创造力的工具。」根据 Meta 的描述，Movie Gen 的功能包括：文本生成视频和音频、编辑已

10/5/2024 3:20:00 PM

机器之心

Claude AI 被曝正研发新功能，突破 20 万 tokens 文件处理上限

科技媒体 testingcatalog 今天（10 月 5 日）发布博文，报道称 Anthropic 公司扩展了 Claude 功能，支持用户处理上下文窗口超过 20 万 tokens 的文件。AI在线注，Claude 当前在处理用户上传、超出限制的文件后，会跳出以下错误，显示当前文件的字符数量超过了 Claude 能处理的上限。不过 Anthropic 正在研发新的功能，通过分块提取内容与其进行交互，从而支持用户上传超过处理上限的文件。图源：testingcatalog这项改进意味着 Claude 扩展了处理文件

10/5/2024 3:16:01 PM

故渊

号称击败Claude 3.5 Sonnet，媲美GPT-4o，开源多模态模型Molmo挑战Scaling law

Molmo，开源多模态模型正在发力！虽然大家一直在期待谷歌、OpenAI 等等拥有无限资金储备和顶尖人才的大厂做出新的 Sota 模型。不过，一家默默耕耘的创业公司 Ai2 发布了一款多模态人工智能模型 Molmo。在下面展示的视频中，我们可以看到 Molmo 就像钢铁侠的「贾维斯」一样万能。想卖自行车，咨询一下 Molmo 的建议，仅靠一张照片，Molmo 就能把自行车的颜色、品牌和二手售价搞清楚，并且帮你写出一句顺口的广告语。它也可以从虚拟世界帮你解决现实世界的问题，说一句：「Molmo，帮我买杯星巴克的南瓜拿

10/5/2024 3:05:00 PM

机器之心

氛围感拉满：微软新专利探索 Copilot AI 应用，匹配视频等生成音乐

科技媒体 Windows Report 昨日（10 月 4 日）发布博文，报道称微软公司获得了一项新的专利，构想 Copilot 在未来能辅助用户创建和视频、文本、PowerPoint 等匹配的音乐或者背景音乐。AI在线注：微软该专利名为《Artificial intelligence model for composing audio scores》，主要探讨了基于输入内容，来创建音乐的方法。该专利主要概述了以下步骤：收集数据：收集大量的训练数据，这些数据包括许多包含视频和音频组件的视听数据集。分析提取：分析数据

10/5/2024 2:32:54 PM

故渊

谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用：腰斩击穿价 0.15 美元买百万 tokens 输出

科技媒体 NeoWin 昨日（10 月 4 日）发布博文，报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型，成为谷歌公司最便宜的 AI 模型。AI在线曾于今年 8 月报道，谷歌公司推出 3 款 Gemini 实验性模型，其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型，拥有 80 亿参数，专为多模态任务而设计，包括大容量任务和长文本摘要任务。相比较原版 Gemini 1.5 Flash，Gemini 1.5 Flash 8B 延迟更低，特别适合聊

10/5/2024 12:40:26 PM

故渊

Meta 发布 AI 视频生成器 Movie Gen：可自动生成含声音的高清视频

Meta 公司今天宣布了一款新的 AI 视频生成器 Movie Gen，该工具能够生成带有声音的高清视频。几个月前，其竞争对手 OpenAI 也推出了其文本转视频模型 Sora。输入文本 Movie Gen 就能自动生成视频，还可以编辑现有的视频或静止图像。据《纽约时报》报道，添加到视频中的音频也是 AI 生成的，通过环境噪音、音效和背景音乐与视频相匹配，视频支持不同的纵横比。Meta 表示，Movie Gen 还可以利用图像作为基础素材来生成特定的视频内容，或更改现有视频中的元素。Movie Gen 还可以用于编

10/4/2024 11:20:58 PM

远洋

资讯热榜

纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 Ollama 支持全线的 Qwen 3 模型 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion Gemini 马斯克算法蛋白质芯片生成式代码英伟达神经网络腾讯研究计算 Anthropic Sora 3D AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集应用训练大型语言模型科技亚马逊特斯拉 2024 AGI

应用

因 AI 生成的艺术作品注册申请被拒，当事艺术家向美国版权局提出上诉

「世界开源新王」Reflection 70B 跌落神坛？重测跑分暴跌实锤造假

Meta 证实：Ray-Ban 眼镜拍摄的照片和视频会被用于训练 AI 模型

Gartner：到 2027 年，生成式 AI 将促使 80% 的软件工程师提升自身技能

古尔曼：苹果 Apple Intelligence 将于 10 月 28 日与 iOS 18.1 一起推出

全球首次，国星宇航完成卫星在轨运行 AI 大模型技术验证

安卓版谷歌 Gemini Live 将支持 40 多种语言，提供 AI 语音聊天功能

告别CUDA无需Triton！Mirage零门槛生成PyTorch算子，人均GPU编程大师？

西班牙马德里动物园为大熊猫配备“AI 保育员”：能用英语、西语答疑，还能不断学习

最新 AI 生图模型 Flux1.1 隐藏玩法，添加单反相机文件名获得超写实图像

聊天机器人帮你“深入了解”约会对象，Grindr 将推出“AI 僚机”功能

软银 CEO 孙正义：将重视开发可读取大量学习数据的高性能大型 AI

Meta又给OpenAI一记重击，视频生成Movie Gen震撼登场，甚至可以配音、编辑

Claude AI 被曝正研发新功能，突破 20 万 tokens 文件处理上限

号称击败Claude 3.5 Sonnet，媲美GPT-4o，开源多模态模型Molmo挑战Scaling law

氛围感拉满：微软新专利探索 Copilot AI 应用，匹配视频等生成音乐

谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用：腰斩击穿价 0.15 美元买百万 tokens 输出

Meta 发布 AI 视频生成器 Movie Gen：可自动生成含声音的高清视频