应用

OpenAI 再成“榜一大哥”：o1-preview AI 模型更轻松驾驭数学、编程等任务

科技媒体 The Decoder 昨日（9 月 19 日）发布博文，报道称在聊天机器人竞技场（Chatbot Arena）上，OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一个比较人工智能模型的平台，它利用 6000 多个社区评分对新的 OpenAI 系统进行了评估。结果结果显示，o1-preview 和 o1-mini 尤其在数学任务、复杂提示和编程方面表现出色。Lmsys 提供的数学模型优势图表清楚地显示，o1-preview 和 o1

9/20/2024 10:29:14 AM

故渊

Runway Gen-3的视频转绘功能太牛了！大片制作0门槛！

大家好我是花生~ Runway 在推出 Gen-3 Alpha 视频生成模型后，还一直有一些小的更新，比如推出了新的 Turbo 模型，生成速度比原来快了 7 倍；支持尾帧控制；支持将视频延长至 40s 等，都是非常符合用户需求的优化提升。而它前几天推出的 V2V （Video to Video）功能，更是将 AI 视频在风格转绘上的水平提升到了一个新的高度，再次秀了一波「AI 视频生成王者」的实力。该功能一经推出就受到众多专业 AI 视频创作者的称赞，并迅速衍生出多种玩法，很有潜力成为一个新的流量风口，喜欢

9/20/2024 7:27:24 AM

夏花生

第三波！2024年9月精选实用设计工具合集

大家好，这是 2024 年 9 月的第 3 波干货合集！今天推荐近期发现的一些有用、有意思的设计素材。工具合集类的网站一直是我的最爱，今天的合集当中有一个专注于发掘宝藏设计资源的合集网站，此外，还有 Spotify 出品的创作工具，可以生成 UI 和代码的多功能 AI 工具，还有渐变背景素材，以及非常实用的一套 Midjourney 风格提示词库。当然，在继续阅读下去之前，记得看看往期干货中有没有你感兴趣的素材：下面我们具体看看这一期的干货: 1、宝藏设计资源和工具合集，你的设计速度不够快、效率不够高、效果不

9/20/2024 7:19:26 AM

陈子木

本土自研再上新！安谋科技发布首款“玲珑”DPU和新一代VPU

2024年9月19日，安谋科技（中国）有限公司（以下简称“安谋科技”）正式推出本土自研的首款“玲珑”D8/D6/D2显示处理器，以及新一代的“玲珑”V510/V710视频处理器。聚焦国内前沿技术趋势，安谋科技自研业务产品矩阵持续扩容，全新亮相的处理器新品能够满足多样化智能应用场景的性能功耗配置需求，助力国产芯片厂商在多媒体技术领域实现创新跃进。安谋科技产品研发副总裁刘浩表示：“当前，基于视频图像的数字多媒体技术与各领域的融合正不断提速，由此催生了许多智能化程度更高、人机交互更流畅的新业态和新应用。在‘玲珑’D8/D

9/19/2024 10:39:00 PM

新闻助手

研究称生成式 AI 耗水量巨大：使用 GPT-4 生成 100 字文本需消耗 3 瓶水

据《华盛顿邮报》报道，美国加州大学河滨分校的一项新研究揭示了生成式 AI 的惊人环境成本，尤其是其对水资源的消耗。研究发现，即使只是生成文本，AI 也需要大量的水来冷却服务器。再加上其对电网的巨大压力，进一步凸显了 AI 发展的环境挑战。图源 Pexels研究指出，AI 的用水量因州和数据中心位置的不同而有所差异，但总体而言，水耗与电费成反比。AI在线注意到，得州的水耗最低，生成一封 100 字的电子邮件仅需 235 毫升水，而华盛顿则高达 1,408 毫升，相当于三瓶 16.9 盎司的矿泉水。此外，数据中心本身就

9/19/2024 9:00:16 PM

远洋

谷歌前高管创办的 Brightband 公司获 1000 万美元融资，可用 AI 预测极端天气

据彭博社报道，由谷歌前高管创办的初创公司 Brightband 周四（今日）宣布，其已获得 1000 万美元（AI在线备注：当前约 7089.5 万元人民币）A 轮融资。该轮融资由 Prelude Ventures 领投，参与投资者包括贝恩资本旗下的 Future Back Ventures 和 Slack 联合创始人卡尔・亨德森。图源 Pexels该公司由前谷歌高管朱利安・格林和三位科学家于今年夏天创立，旨在利用 AI 技术改善天气预报。该公司目的是开发一款付费产品，以及一个基于原始天气观测训练的开源 AI 预测

9/19/2024 8:09:28 PM

清源

普渡初代类人形机器人 PUDU D7 发布：算力 200 TOPS、自由度 30 DOF

普渡机器人今日发布初代类人形机器人 PUDU D7，基于仿生双臂和全向移动底盘设计，能够在多个场景中执行复杂任务操作。AI在线注意到，PUDU D7 预计将在 2025 年实现商业化落地。该机器人身高 165 厘米，重量 45 公斤，仿生臂的单臂展达到 65 厘米，整机拥有 30 个自由度，配备灵巧手后，自由度将提升至 50。PUDU D7 具备类人的构型，底部配备通用的移动能力，底盘支持 360 度全向移动，最大速度 2 米 / 秒，能在最大 10 度的斜坡上稳定运行。D7 的电池容量超过 1KWh，可持续工作超

9/19/2024 7:26:13 PM

沛霖（实习）

引领通用具身新时代：普渡发布首款类人形机器人PUDU D7

9月19日，全球服务机器人领军企业普渡机器人正式发布其初代类人形机器人PUDU D7。基于仿生双臂和全向移动底盘设计，PUDU D7能够在多个场景中执行复杂任务操作，更好地满足跨行业客户真实的多样化需求。该款机器人预计将在2025年实现全面商业化落地，为通用具身服务机器人的商业化应用带来突破性变革。普渡初代类人形机器人PUDU D7普渡机器人创始人兼CEO张涛表示：“作为普渡的核心价值观，发明家精神推动我们不断创新与进步。PUDU D7的发布标志着我们在构建专用型机器人、类人形机器人和人形机器人的重要一步。通过推进

9/19/2024 6:43:00 PM

新闻助手

快手可灵 AI 发布 1.5 模型：新增“运动笔刷”，支持生成 1080p 视频

快手可灵 AI 今日面向全球发布可灵 1.5 模型，新增“运动笔刷”功能。据介绍，“运动笔刷”功能为图片中的元素（人或物体等）指定运动轨迹，还支持额外指定静止区域，提升画面可控性。同时，可灵 AI 的视频画质有所提升，支持生成 1080p 视频，同时构图更美观、动作更合理、文本相关性提升。快手高级副总裁盖坤 9 月 13 日在投资者日上披露，截至目前，已有超过 260 万人使用过快手的视频生成大模型可灵 AI，并累计生成超 2700 万个视频。产品发布以来，可灵 AI 已进行了 9 次迭代和升级，近期，可灵 AI

9/19/2024 5:56:27 PM

汪淼

CoT能让模型推理能力无上限？田渊栋、LeCun下场反对：两层MLP还能模拟全世界呢

「这相当于在理论上，两层神经网络在理论上可以拟合任何数据，我们就盲目相信并应用在所有场景中。」大模型新范式 OpenAI o1 一经发布，如何「复刻」出 o1 便成为了 AI 圈最热的话题。由于 OpenAI 对技术细节守口如瓶，想从 AI 那里「套话」，让它复述完整的内部推理过程，多问几句，OpenAI 直接发邮件警告要撤销你的使用资格。想从技术报告中想找出点蛛丝马迹，也同样困难。于是，大家将目光转向了以往类似的研究成果，希望从中找到些线索。比如，Google Brain 推理团队创建者 Denny Zhou 立

9/19/2024 5:51:00 PM

机器之心

阿里云Qwen2.5发布！再登开源大模型王座，Qwen-Max性能逼近GPT-4o

人工智能领域再度迎来重磅消息！ 2023 年 8 月，通义首次开源后迅速引起全球开发者的关注和热议，短短一年时间内，阿里云大模型又迎来了重要升级。在 9 月 19 日的云栖大会上，CTO 周靖人宣布：通义千问发布新一代开源模型 Qwen2.5，开源旗舰模型 Qwen2.5-72B 性能超越 Llama 3.1-405B，再次登上全球开源大模型的王座；通义旗舰模型 Qwen-Max 全方位升级，性能已经逼近 GPT-4o。发布现场，图源：泽南通义千问凭借不

9/19/2024 5:31:00 PM

机器之心

留子们用火星文写避雷帖，AI竟看懂了？我们实测：几乎全军覆没

AI好好用报道编辑：杨文这种用法也是够邪门的。留子们在写一种很新的差评。由于全球点评打卡平台，都有个自动翻译的功能，为了防止被店家骚扰，也为了给同胞避雷，身在海外的国人们，想出各种奇招优雅给差评。例如，打 5 分忽悠老板，再用中文加密：用中文谐音写了一堆差评，然后在结尾给个虚假好评，商家拿翻译器一翻，只看到一个早餐不错。还有人费老大劲儿，用米粒摆出「报吃」的汉字，中国人一看就懂：更有甚者，重启上古火星文，直接干翻各类翻译器。但是，最近有网友发现，这段如同计算机乱码的火星文差评，AI 竟然也能读懂啦。-1-「哈利・波

9/19/2024 5:28:00 PM

AI好好用

SiFive 推出 Intelligence XM 系列 RISC-V 架构 AI 数据流处理器

RISC-V 设计企业 SiFive 当地时间昨日宣布推出 Intelligence XM 系列 AI 数据流处理器。这一系列属于 SiFive 的 Intelligence 智能处理器 IP 核家族，该家族还包括 X390 等产品。SiFive 表示 Intelligence XM 系列搭载同时具有扩展性和高效能的 AI 计算引擎，并延续了 SiFive IP 产品在计算密集型应用中优秀的每瓦性能表现。AI在线了解到，SiFive Intelligence XM 系列的基本单元是 XM 集群，每个 XM 集群包含

9/19/2024 5:26:57 PM

溯波（实习）

型号齐全，智元发布全系列灵巧手，挑战高自由度

8月18日智元年度新品发布会上，智元机器人发布了19自由度（12主动）视触觉灵巧手，至此智元机器人已经形成全系列灵巧手产品，包含12自由度五指灵巧手、6自由度五指灵巧手、二指夹爪、OmniPicker。下面我们来回顾一下这一系列产品。1. 视触觉五指灵巧手，挑战高自由度高自由度五指灵巧手始终是学术界和工业界的关注焦点，结构和功能上与人手相仿，为通用任务而生。智元机器人此次发布的视触觉灵巧手包含19个自由度，其中主动自由度12个，集成基于MEMS原理的触觉感知和视触觉感知技术，升级后的灵巧手在物体操作和感知上都展现出

9/19/2024 5:18:00 PM

新闻助手

阿尔特曼称 o1 仅仅是“推理模型的 GPT-2”，黄仁勋表示“给你加速 50 倍”

AI 界最有影响力的两个人，同时出现在一场活动：OpenAI CEO 阿尔特曼，暗示了 o1 满血版将在接下来几个月发布。英伟达创始人黄仁勋，则表示新一代 Blackwell 架构 GPU 能给 o1 推理提速 50 倍。阿尔特曼把 o1 在推理模型里的地位比作语言模型中的 GPT-2 阶段。几年后人们将看到“推理模型的 GPT-4”，不过最近几个月就会有重大改进，新范式的进步曲线非常陡峭。L2“推理者”与 L1“聊天机器人”非常不同，大家还没找到该怎么用这些模型，我们也没决定该为 App 继续添加什么功能。不过最

9/19/2024 4:41:34 PM

清源

传音与联发科共建人工智能联合实验室，聚焦手机端侧 AI 技术创新

9 月 13 日，传音控股与联发科共建的人工智能联合实验室在深圳揭牌。双方将整合人工智能领域的优势技术资源，加速推进 AI 技术在智能终端的应用和普及。传音控股高级副总裁张祺、TEX AI 中心总经理史团委，联发科技计算与人工智能技术事业群副总经理陆忠立博士、无线产品软件开发部协理李绍鼎共同为实验室揭牌。据传音控股官方介绍，此次成立的人工智能联合实验室，将聚焦大型语言模型、Agent 智能体、AI 语音、影像等领域在手机端的应用创新，提供更多生成式 Al 的端侧部署和优化方案，共同探索面向大众的 AI 智能体服务和

9/19/2024 2:43:55 PM

汪淼

阿里通义万相视觉生成大模型升级，支持文生视频、图生视频等

在今日的 2024 云栖大会上，阿里云发布了通义万相 Wanx 视觉生成大模型的新升级，能力全面进化。通义万相除了此前的文生图能力，现已支持文生视频、图生视频等，还有插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化能力。据阿里云官方透露，通义万相累计创作图片数已达 7500 万，累计用户数已达 93 万。通义万相官网显示，全新发布自研 AI 视频生成大模型，具备“强大的画面视觉动态生成能力”，擅长概念理解与组合生成，优化中式元素表现，同时支持多语言与可变分辨率生成。AI在线附体验链接：

9/19/2024 2:35:09 PM

汪淼

阿里通义千问开源 Qwen2.5 大模型，号称性能超越 Llama

感谢在今天的 2024 云栖大会上，阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5，其中，旗舰模型 Qwen2.5-72B 号称性能超越 Llama 405B。Qwen2.5 涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，每个尺寸都有基础版本、指令跟随版本、量化版本，总计上架 100 多个模型。Qwen2.5 语言模型：0.5B、1.5B、3B、7B、14B、32B 以及 72B;Qwen2.5-Coder 编程模型：1.5B、7B 以及即将推出的 32B;Qwen2.5-Math 数

9/19/2024 2:21:51 PM

汪淼

资讯热榜

纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Ollama 支持全线的 Qwen 3 模型 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion Gemini 马斯克算法蛋白质芯片生成式代码英伟达腾讯神经网络研究计算 Anthropic Sora 3D AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集应用训练大型语言模型科技亚马逊特斯拉 2024 AGI