应用

字节全新发布豆包AI视频模型：再见了Sora，你的时代过去了

刚刚，字节的火山引擎的发布会基本结束了。我现在有点过于激动。虽然发布会结束了，但是我觉得，一个颠覆行业的全新的起点，在这一刻，正式到来了。字节正式发布了他们全新的两款 AI 视频模型：豆包视频生成-PixelDance 模型和 Seaweed 模型。Seaweed 模型下次我再详细来说。这次，我想说这个豆包 PixelDance 模型，因为太屌了，屌炸了，我真的是全程惊叹着看完的。他们正式宣布这玩意的那一刻，现场掌声雷动，我隔着屏幕都感觉快特么把房顶掀翻了。真的，如果要给这个豆包 PixelDance

9/26/2024 1:49:52 AM

用一个实战案例，带你完整掌握AI视频设计流程

我们在上期文章完成了对市面上主流 AI 视频生成类产品的调研，本期我们将结合一个案例，展开说明如何利用 AI 工具快速实现视频制作。工具大盘点！ 11款AI视频生成神器优缺点分析（附打分表）今年 2 月，OpenAI 发布了全新的文生视频模型 Sora，致使 AI 视频生成领域迎来了一系列令人瞩目的突破。

9/26/2024 12:20:26 AM

Infinite AI

惠普报告称生成式 AI 正被用于创建网络攻击恶意软件，可被藏匿在 svg 图像中

当地时间 24 日，惠普发布的《威胁洞察（Threat Insights）》报告指出，不良行为者、黑客和网络犯罪分子正在利用生成式 AI 开发复杂的恶意软件，目标是法语用户。“恶意软件的结构、解释每行代码的注释以及母语函数名和变量都表明，威胁行为者使用生成式 AI 创建了该恶意软件。”受害者通常通过网络钓鱼电子邮件或恶意广告成为攻击目标，从而进入恶意网站。这些网站看似专业可信，通常提供假冒的工具或服务，例如 PDF 转换器。但是，这个 ChromeLoader 活动在用户被引向假冒 PDF 工具后，最终安装了恶意代

9/25/2024 9:18:56 PM

清源

华章廿载新质未来 ——2024第二十届全国高性能计算学术年会在武汉成功举行

“九省通衢达天下，超算之光耀楚天”，9月24日至26日，第20届CCF全国高性能计算学术年会(CCF HPC China 2024)在武汉市中国光谷科技会展中心盛大举行。大会由中国计算机学会主办，中国计算机学会高性能计算专业委员会、华中科技大学、上海交通大学承办，中国地质大学(武汉)、北京并行科技股份有限公司协办。以“华章廿载新质未来”为主题，本届大会由12位院士领衔，携手来自算力领域的400多位顶尖学者，进行学术交流和专题分享。

9/25/2024 7:52:00 PM

朱可轩

李彦宏数千万元投资大模型创业公司鼓励创业者坚持长期主义

李彦宏表示，智能体最明显的特点是门槛足够低，谁都能上手，但同时天花板又足够高，可以做出非常复杂，非常强大的应用。未来，将会有数以百万量级的智能体出现，形成庞大的智能体生态。值得一提的是，在今年文心杯创业大赛中，有超过60%参赛团队聚焦智能体的应用，超过30%参赛团队没有专业程序员。

9/25/2024 6:57:00 PM

成妍菁

百度全面升级百舸 AI 异构计算平台 4.0、千帆大模型平台 3.0

感谢2024 百度云智大会今日在北京召开，百度在大会上宣布全面升级百舸 AI 异构计算平台 4.0、千帆大模型平台 3.0 两大 AI 基础设施，并升级代码助手、智能客服、数字人三大 AI 原生应用产品。百度智能云事业群总裁沈抖表示：“2024 年大模型的产业落地正在加速，目前在千帆大模型平台上，文心大模型日均调用量超过 7 亿次，累计帮助用户精调了 3 万个大模型，开发出 70 多万个企业级应用。过去一年，文心旗舰大模型降价幅度超过 90%，主力模型全面免费。”升级百舸 4.0为满足企业落地大模型从集群创建、开发

9/25/2024 5:48:57 PM

汪淼

百度李彦宏：智能体是我最看好的 AI 应用方向

在今日的 2024 百度云智大会上，“文心杯”创业大赛第二季结果揭晓。百度创始人李彦宏发表颁奖致辞时指出，智能体是他最看好的 AI 原生应用发展方向，相当于 PC 时代的网站和自媒体时代的账号。李彦宏表示，智能体最明显的特点是门槛足够低，谁都能上手，但同时天花板又足够高，可以做出非常复杂，非常强大的应用。未来，将会有数以百万量级的智能体出现，形成庞大的智能体生态。AI在线注意到，在今年文心杯创业大赛中，有超过 60% 参赛团队聚焦智能体的应用，超过 30% 参赛团队没有专业程序员。“百度希望能与所有的创业领域企业共

9/25/2024 5:32:16 PM

远洋

“稚晖君”创业项目，智元自主研发的机器人中间件 AimRT 开源

智元自主研发的机器人中间件 AimRT 开源上线。▲ AimRT 架构图官方表示，AimRT 是一个更现代、轻量易用，且高效稳定的通信开发框架，具备机器人开发流程所必备的许多实用特性，并解决了主流开源中间件的一些痛点：在软件开发效率方面，AimRT 基于现代 C 新标准开发，轻量易部署，将现代化设计模式应用在资源管控、异步编程、部署配置等方面，使得机器人应用的开发更加快捷和高效。在工具链与调测效率方面，AimRT 提供了完善的调试、性能分析工具，以及良好的可观测性支持，有助于快速发现并解决系统中的问题，相比较传

9/25/2024 4:55:32 PM

沛霖（实习）

星纪魅族正在开发星纪战车、机器人等新品

星纪魅族 AI 生态发布会于今日下午举行，在发布会尾声，星纪魅族预热了两款正在研发的新品 —— 星纪战车、机器人。从图中可以看到，星纪战车采用剪刀门设计，整体底盘很高；机器人是人形机器人风格，整体造型犀利，目前尚不清楚是概念图还是实物设计图。据AI在线此前报道，星纪魅族今日还公布了自己的智能生态产品体系：将基于 FlymeAIOS 技术底座，以 Star 和魅族两大品牌承载 AI 终端落地体验。星纪魅族 AI 生态发布会专题

9/25/2024 4:45:00 PM

汪淼

微软发布新工具，检测和纠正 AI 幻觉内容

科技媒体 The Decoder 昨日（9 月 24 日）发布博文，报道称微软以预览版的形式，在 Azure AI Content Safety 中推出 Groundedness Detection，用于“纠正” AI 幻觉。AI 幻觉在人工智能领域中，幻觉是由人工智能生成的一种回应，它含有貌似事实的虚假或误导性资讯。该术语源自幻觉的心理学概念，因为它们具有相似的特征。人工智能幻觉的危险之处之一是模型的输出看起来是正确的，而它实际上是错误的。Groundedness Detection微软的 Groundednes

9/25/2024 3:27:54 PM

故渊

当大模型Scaling Law继续，万卡集群算力释放在「百舸」这里找到一条通途

在电影《天下无贼》中，葛优扮演的黎叔有这样一句经典的台词，「二十一世纪什么最贵？人才！」而随着人工智能行业进入到大模型时代，这一问题的答案已然变成了「算力」。随着模型规模急剧扩张，参数已经飙升到了千亿甚至万亿级，业界开启了千模大战，AI 算力需求不可避免迎来爆炸式增长，无论是前期训练还是后期推理，都是如此。在训练层面，OpenAI 曾在 2018 年做过估算，自 2012 年以来，AI 模型训练算力需求每 3.5 个月翻一番，每年所需算力增幅高达 10 倍，增速远远超出了芯片产业长期存在的摩尔定律（性能每 18 个

9/25/2024 1:56:00 PM

机器之心

终于来了！OpenAI开放GPT-4o高级语音，还用中文说「对不起」

这项高级语音功能，大家可是等了好久。谷歌又被 OpenAI 截胡了。前脚谷歌刚刚升级完两款模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002，后脚奥特曼就直接宣布 GPT-4o 今天起正式开放。「高级语音功能今天推出！（将在本周内完成），希望您的等待值得。」奥特曼表示道，最后还不忘加一个委屈、小桃心的表情。这次，OpenAI 的高级语音功能将向所有的 Plus 和 Team 用户推出。但免费用户是体验不了了，因为 OpenAI 暂时没有这个计划。据了解，Plus 用户每月需支付

9/25/2024 1:53:00 PM

机器之心

文档处理效能飙升！浩鲸科技“文档大模型”核心技术揭秘！

在当今大模型技术日新月异的背景下，数据已跃升为构建企业大模型知识库、优化训练与微调，乃至驱动模型创新不可或缺的核心要素。对于企业来说，积累的宝贵知识广泛散布于形式多样的电子文档之中，这些文档不仅格式多样，其内容质量亦呈现出显著的差异性。对海量数据进行精细化的清洗与预处理工作，已成为提升数据价值、确保模型精准高效的关键一环，如何有效提取并利用这些宝贵的知识资源，成为了摆在所有企业面前的一道难题。9 月 20 日，老牌数字化转型技术服务提供商浩鲸科技在云栖大会期间，成功举行鲸智大模型技术体系发布会，作为企业内部的 “资

9/25/2024 1:48:00 PM

机器之心

英伟达发布 Llama-3.1-Nemotron-51B AI 模型：创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载

英伟达 9 月 23 日发布博文，宣布推出 Llama-3.1-Nemotron-51B AI 模型，源自 Meta 公司的 Llama-3.1-70B，不过创新使用神经架构搜索（NAS）方法，建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-Nemotron-51B AI 模型基于 Meta 公司 2024 年 7 月发布的 Llama-3.1-70B 模型，共有 510 亿参数。该 AI 模型主要采用了神经架构搜索（NAS）技术微调，平衡性能和效率，在高工作负

9/25/2024 1:40:33 PM

故渊

OpenAI o1 AI 模型 PlanBench 规划能力实测：准确率 97.8%，远超 LLaMA 3.1 405B 创造的 62.6% 纪录

来自亚利桑那州立大学的科研团队利用 PlanBench 基准，测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 个来自 Blocksworld 领域的任务，其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blocksworld 任务中，OpenAI 的 o1 模型准确率达到 97.8%，大大超过了之前的最佳语言模型 LLaMA

9/25/2024 12:20:21 PM

故渊

谷歌 Gemini 1.5 AI 模型再进化：成本更低、性能更强、响应更快

科技媒体 The Decoder 昨日（9 月 24 日）发布博文，报道谷歌升级旗下 Gemini 1.5 AI 模型，推出了 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002，相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用，Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%，提高了两种模型的速率限制，并减少了延迟。新定价于 2024 年 10 月 1 日生效。性能更强AI在线援引新闻稿内

9/25/2024 12:08:02 PM

故渊

OpenAI 上线高级语音模式：翻开 AI 语音聊天新篇章，能用中文等 50 多种语言说“抱歉我迟到了”

感谢OpenAI 公司今天（9 月 25 日）发布博文，宣布面向所有 Plus 和 Team 订阅用户，推出高级语音模式（Advanced Voice Mode，简称 AVM），标志着人工智能对话技术向前迈出了重要一步。该功能之前仅邀请部分用户测试，OpenAI 希望通过语音，提供更自然、更像人类的交互体验。AI在线附上 AVM 主要功能如下：改善对话体验：AVM 可实现更流畅、反应更迅速的对话，让用户能够打断人工智能，并对话题的变化做出即时反应。新的声音：新增 Arbor、Maple、Sol、Spruce 和 V

9/25/2024 11:36:21 AM

故渊

大众携手谷歌，率先邀请约 12 万名车主免费使用 Gemini AI

大众汽车昨日（9 月 24 日）发布新闻稿，宣布携手谷歌公司，率先邀请约 12 万名大众 Atlas 和 Atlas Cross Sport 车型车主，免费体验和使用 Gemini AI 助手。Gemini AI 助手功能大众汽车在新闻稿中表示，通过与谷歌云（Google Cloud）的战略合作，在 myVW 移动应用中部署生成式人工智能。大众汽车车主可以通过聊天的方式和 Gemini AI 对话，掌控车辆状态或者请求其提供帮助。例如车主可以询问“如何更换备胎”，Gemini 就会自动调用 YouTube 视频，提

9/25/2024 11:16:51 AM

故渊

资讯热榜

纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Ollama 支持全线的 Qwen 3 模型 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion Gemini 马斯克算法蛋白质芯片生成式代码英伟达腾讯神经网络研究计算 Anthropic Sora 3D AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集应用训练大型语言模型科技亚马逊特斯拉 2024 AGI

应用

字节全新发布豆包AI视频模型：再见了Sora，你的时代过去了

用一个实战案例，带你完整掌握AI视频设计流程

惠普报告称生成式 AI 正被用于创建网络攻击恶意软件，可被藏匿在 svg 图像中

华章廿载 新质未来 ——2024第二十届全国高性能计算学术年会在武汉成功举行

李彦宏数千万元投资大模型创业公司 鼓励创业者坚持长期主义

百度全面升级百舸 AI 异构计算平台 4.0、千帆大模型平台 3.0

百度李彦宏：智能体是我最看好的 AI 应用方向

“稚晖君”创业项目，智元自主研发的机器人中间件 AimRT 开源

星纪魅族正在开发星纪战车、机器人等新品

微软发布新工具，检测和纠正 AI 幻觉内容

当大模型Scaling Law继续，万卡集群算力释放在「百舸」这里找到一条通途

终于来了！OpenAI开放GPT-4o高级语音，还用中文说「对不起」

文档处理效能飙升！浩鲸科技“文档大模型”核心技术揭秘！

英伟达发布 Llama-3.1-Nemotron-51B AI 模型：创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载

OpenAI o1 AI 模型 PlanBench 规划能力实测：准确率 97.8%，远超 LLaMA 3.1 405B 创造的 62.6% 纪录

谷歌 Gemini 1.5 AI 模型再进化：成本更低、性能更强、响应更快

OpenAI 上线高级语音模式：翻开 AI 语音聊天新篇章，能用中文等 50 多种语言说“抱歉我迟到了”

大众携手谷歌，率先邀请约 12 万名车主免费使用 Gemini AI

华章廿载新质未来 ——2024第二十届全国高性能计算学术年会在武汉成功举行

李彦宏数千万元投资大模型创业公司鼓励创业者坚持长期主义