应用 - AI在线

阿里国际推出首个专业版AI Search，为什么它会是下一个B2B谷歌？

经历过「千模大战」的喧嚣，一年半之后，生成式 AI 的应用层创新终于步入爆发期。年初的 Sora 激起一阵 AI 视频生成的浪潮。涟漪未散，OpenAI 新的 SearchGPT 又燃起了 AI 搜索的战火。AI 搜索，这其实是生成式 AI 技术浪潮刚涌现时，大部分人对其应用的想象：改变传统的搜索引擎。这一战场上，Perplexity 在另起炉灶，Google 想着自我革新，Bing 忙着乘势而起。如今，阿里国际也宣布入局，直接带来了一款新产品。但与其它所有人都不同，阿里国际的 AI 搜索切入了一个空白

智谱版Sora开源爆火：狂揽4K Star，4090单卡运行，A6000可微调

智谱AI把自研打造的大模型给开源了。国内视频生成领域越来越卷了。刚刚，智谱 AI 宣布将与「清影」同源的视频生成模型 ——CogVideoX 开源。短短几个小时狂揽 4k 星标。代码仓库：：：月 26 日，智谱 AI 正式发布视频生成产品「清影」，得到大家广泛好评。只要你有好的创意（几个字到几百个字），再加上一点点耐心（30 秒），「清影」就能生成 1440x960 清晰度的高精度视频。官宣即日起，清影上线清言 App，所有用户都可以全方位体验。想要尝试的小伙伴可以去「智谱清言」上体验「清影」生视频的能力。「清影

科大讯飞发布智能办公本Air 2，打造更懂你的办公AI助手

更懂你的AI助手，让办公轻得自在。8月6日，科大讯飞举行“AI懂你，轻得自在”智能办公本新品发布会，正式发布科大讯飞智能办公本Air 2系列。Air 2深度融合了讯飞星火大模型能力，带来会议纪要、笔记分析、AI写作三大AI绝招；Air 2也首次使用了语义转折点识别算法，大幅提升多人会议的分角色转写准确率；此外，Air 2还拥有88.5%超大视觉屏占比，在轻薄便携的同时带来墨水屏视野“大”体验。轻薄超便携，88.5%超大屏占比Air 2采用了8.2英寸E Ink墨水屏，并拥有88.5%超大视觉屏占比，同时依然保持了5

免费！字节这款AI音乐神器，30秒速成抖音神曲

机器之能报道编辑：杨文抖音神曲制造机。近日，字节酝酿许久的 AI 音乐创作神器 —— 海绵音乐，终于向公众开放啦！只需要输入主题或者几句歌词，短短几十秒钟，它就能一口气创作出 3 首神曲。歌词、旋律、演唱一锅出，看来以后抖音上会蹦出一堆 AI 歌曲。例如，我们输入「不想上班了，想回家种地」，不到 30 秒，三首民谣歌曲就出炉了。试听链接：，第一首竟有点赵雷的味道。-1-206 首精选歌曲，总有一款适合你与 Suno 类似，海绵音乐也推出了精选榜单，涵盖 R&B、摇滚、嘻哈、电子、国风等多种音乐风格。我们耐着性子数了

最晚明年上半年落地L3：理想端到端自动驾驶，性能大幅提升

最近一段时间，生成式 AI 技术兴起，众多造车新势力都在探索视觉语言模型与世界模型的新方法，端到端的智能驾驶新技术似乎成为了共同的研究方向。上个月，理想汽车发布了端到端 VLM 视觉语言模型世界模型的第三代自动驾驶技术架构。此架构已推送千人内测，将智能驾驶行为拟人化，提高了 AI 的信息处理效率，增强了对复杂路况的理解和应对能力。李想曾在公开的分享中表示，面对大部分算法难以识别和处理的罕见驾驶环境，VLM（Visual Language Model）即视觉语言模型可以系统地提升自动驾驶的能力，这种方法从理

共探产业第二增长曲线！2024腾讯全球数字生态大会定档9月5日

即日，腾讯宣布2024年腾讯全球数字生态大会定档于9月5日——6日，在深圳国际会展中心举行。大会将以“智启新机，云驱增长”为主题，与海内外客户、生态合作伙伴、技术开发者、政府及社会组织，共同探讨AI等前沿数字技术的新发展，探索数字化助力产业新增长的现实可行路径。腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生表示，增长是企业发展的核心诉求。AI大模型的持续落地，为行业发展、模式创新带来新一轮机遇；以数字化为核心的营销、服务、生产、经营流程的重塑，成为企业实现发展创新、降本增效的切实路径；同时，以“云”为载

OpenAI 宣布 10 月起举办第 2 届 DevDay 开发者大会：无新 AI 模型，聚焦 API 和开发工具

OpenAI 公司宣布将于 2024 年 10 月 1 日起，在旧金山、伦敦和新加坡举办 2024 年度 DevDay 活动，遗憾的是本次活动不会发布新的 AI 前沿模型。OpenAI 计划在旧金山、伦敦和新加坡分别举办活动，AI在线附上具体日程如下：旧金山：10 月 1 日伦敦：10 月 30 日新加坡：11 月 21 日OpenAI 公司于 2023 年 11 月举办了首届 DevDay 开发者大会，公布了具有 128K 上下文和更低价格的 GPT-4 Turbo、新的 Assistants API、GPT-4

图灵奖得主 LeCun 加盟 AI 芯片黑马 Groq，估值 28 亿美元挑战英伟达

英伟达又双叒迎来强劲挑战者了。成立于 2016 年的初创公司 Groq 在最新一轮融资中筹集了 6.4 亿美元，由 BlackRock Inc. 基金领投，并得到了思科和三星投资部门的支持。目前，Groq 的估值已经达到 28 亿美元。公司创始人 Jonathan Ross 曾在谷歌从事 TPU 芯片的开发，而 Groq 目前的顶梁柱 LPU 也是专门用于加速 AI 基础模型，尤其是 LLM。Ross 表示，一旦人们看到在 Groq 的快速引擎上使用大语言模型有多么方便，LLM 的使用量将会进一步增加。以更低的价格

你能分辨 AI 生成的图片和真实照片吗？微软总裁挑战你的眼力

微软副董事长兼总裁布拉德・史密斯推出了一项趣味测试，挑战人们辨别 AI 生成图像和真实照片的能力。他在名为“真或假”网站上线了该测试，每个测试包含 15 张图片，玩家需要判断图片是 AI 生成的还是真实拍摄的。测试中的图片每次都会随机更换，因此玩家可以反复挑战，提高鉴别能力。虽然最初的几道题相对简单，但随着测试的进行，难度逐渐增加。尽管有些图片一眼就能看出真假，但 AI 生成图像的逼真度已经达到令人惊讶的水平。同时，现实世界中也存在许多奇特的场景，足以迷惑人们。经过多次尝试，笔者发现测试难度逐渐增加，前十题相对简单

英伟达神秘视频基础模型「Cosmos」曝光，数据全靠偷

为了这个视频模型，英伟达每天正在疯狂地爬取相当于 80 年时长的视频数据。今天，一则关于英伟达要下场做视频模型的消息引爆了 Reddit。消息源出自外媒 404 Media，据它获得的 Slack 聊天（英伟达的内部聊天平台）、电子邮件和文件显示，英伟达正在从 Youtube 和其他几个来源抓取视频，收集用于其 AI 产品的训练数据。404 Media 查看的英伟达内部对话显示，当参与该项目的员工提出有关使用「禁止商用的研究数据集」和「YouTube 视频」可能产生法律问题时，管理人员告诉他们，他们已获得公司最高层

OpenAI人事地震：奥特曼盟友Brockman长期休假，联创Schulman转投Anthropic，产品负责人已离职

OpenAI 的领导层，再次传来三则人事变动的重要消息。首先，OpenAI 总裁、11 位联合创始人之一 Greg Brockman 将长期休假。这位高管在将 OpenAI 突破性成果转化为大规模 AI 模型和产品（如 ChatGPT）方面发挥了至关重要的作用，而且在山姆・奥特曼被董事会罢免后争取重返公司期间，他还是山姆・奥特曼的重要盟友。Greg Brockman 告诉员工的版本是，自己计划在延长假期后重返公司。不过，身居要职的高管进行长期休假，难免让外界产生一些猜测。此外，另一位联合创始人 John Schul

英伟达被曝未经许可抓取 YouTube、Netflix 平台视频用于训练 AI

科技媒体 404Media 披露的文件显示，英伟达收集了大量受版权包含的内容，用于训练人工智能（AI）。该媒体披露的内部邮件、电子邮件、Slack 对话以及相关文件显示，英伟达从 YouTube 等多个来源收集视频素材，用于扩充训练 AI 的数据集。该媒体披露的对话显示参与该项目的员工曾提出质疑，认为擅自使用 YouTube 视频以及研究目的编译的数据集，在法律层面可能会存在问题。不过项目经理的回复是，这种收集模式已经获得了公司最高层的许可，可以使用这些内容训练 AI，并认为“完全符合版权法的文字描述和精神”。一位

OpenAI 宣布改变开发者大会举办形式，不会公布 GPT-5

8 月 6 日消息，去年，人工智能初创公司 OpenAI 在旧金山举办了首次开发者大会，声势浩大，并推出了包括最终未能成功的 GPT Store（类似苹果应用商店）在内的多款新产品和工具。然而，今年的活动将相对低调。本周一，OpenAI 宣布，将其 DevDay 开发者大会转型为一系列聚焦开发者的参与式会议。公司还确认，在 DevDay 期间不会发布下一代主旗舰模型，而是将重点放在其 API 和开发者服务的更新上。OpenAI 发言人透露：“我们不打算在开发者大会上宣布我们的下一个模型。我们将更多地专注于向开发者介

OpenAI 人事巨变：三位核心人物一个休长假，两个离职

感谢据彭博社报道，OpenAI 公司发言人表示，OpenAI 总裁、公司核心人物之一 Greg Brockman 将休长假，以“放松和充电”。另外，研究员 John Schulman 今日离职，将前往竞争对手人工智能 AI 初创公司 Anthropic。Brockman 在 X 上表示，其将休假到年底，他写道，“自 9 年前共同创立 OpenAI 以来，这是第一次放松。任务还远没有完成，我们仍然有一个安全的 AGI 需要构建。”Schulman 也证实了他的离职，“我做出了离开 OpenAI 的艰难决定。这个选择源

被索赔 500 万美元，OpenAI 遭 YouTube 主播集体诉讼：擅用其内容训练 AI

感谢一位 YouTube 主播上周五向美国加利福尼亚州北区地方法院递交集体诉讼文件，指控 OpenAI 公司在未告知通知视频所有者或向其提供补偿的情况下，擅自抓取数百万个 YouTube 视频脚本，用于训练 AI 生成模型。该主播名为大卫・米莱特（David Millette），来自美国马萨诸塞州，指控 OpenAI 公司抓取其和其他主播创作者的视频，用于训练 AI 模型，涉及的产品包括 ChatGPT、Sora 等等。集体诉讼文件认为 OpenAI 收集这些数据，并得到了“丰厚的回报”，但这种做法违反了版权法和

智谱 AI 开源 CogVideoX 视频生成模型：“清影”同源，单张 4090 显卡可推理

感谢智谱 AI 今日宣布，将与“清影”同源的视频生成模型 ——CogVideoX 开源。据介绍，CogVideoX 开源模型包含多个不同尺寸大小的模型，目前将开源 CogVideoX-2B，它在 FP-16 精度下的推理需 18GB 显存，微调则需要 40GB 显存，这意味着单张 4090 显卡即可进行推理，而单张 A6000 显卡即可完成微调。CogVideoX-2B 的提示词上限为 226 个 token，视频长度为 6 秒，帧率为 8 帧 / 秒，视频分辨率为 720*480。官方表示，性能更强参数量更大的模

“神笔马良版 Sora”，阿里团队推出视频 AI 生成框架 Tora：画圈操控物体运动轨迹

阿里团队最新推出了 AI 视频生成框架 Tora，同时集成了文本、视觉和轨迹条件用于生成视频，是基于轨迹导向的扩散变换器（DiT）技术。Tora 由一个轨迹提取器（TE）、一个时空 DiT 和一个运动引导融合器（MGF）组成：TE 使用 3D 视频压缩网络将任意轨迹编码为分层时空运动补丁。MGF 将运动贴片集成到 DiT 模块中，以生成遵循轨迹的连贯视频。Tora 无缝契合 DiT 设计，支持制作最长 204 帧、720P 分辨率的视频，可以精确控制不同持续时间、宽高比和分辨率的视频内容。大量实验证明，Tora 在

OpenAI 又一位联创离职，公司动荡仍在持续？

北京时间8月6日早上八点，OpenAI联合创始人John Schulman在twitter发文，宣布从OpenAI离职，加入Anthropic深入研究AI对齐。在twitter发布的这封离职信中，John Schulman表示从OpenAI离职只是出于个人职业发展需要，希望能够集中精力专注AI对齐研究，重返技术工作，并不是因为OpenAI缺乏对对齐研究的支持。 John Schulman回忆了过去九年在OpenAI的经历，表达了对Sam Altman、Greg Brockman邀请他加入初创团队的感谢，也表示对OpenAI的未来发展充满信心。