应用

初探谷歌 Gemini 的 Google Photos 扩展：帮用户回忆过往、记录信息

科技媒体 Android Authority 今天（9 月 13 日）报道，谷歌目前正在 Gemini 应用中测试 Google Photos 扩展，在最新 15.36.40.29 测试版 Google 应用中初步体验了该扩展。根据 Google 的官方描述，该扩展主要提供两种使用方式：“回忆过往活动，如首次品尝的美食照片”以及“利用摄影来记录信息”。这强烈暗示扩展将主要运用即将登陆 Google Photos 的“Ask Photos”和自然语言搜索功能。谷歌已推出自然语言搜索功能，支持用户使用随意的对话式描述来

9/13/2024 3:11:36 PM

故渊

Adobe 预告 Firefly 文生视频 AI 模型年内登场，可通过提示词 / 静帧生成动态片段

继去年 3 月推出 Firefly 文生图 AI 模型后，Adobe 计划在今年内推出 Firefly 文生视频模型，允许用户使用文字描述或图像静帧生成动态视频。▲ Adobe 去年 3 月推出的 Firefly 文生图 AI 模型▲ Adobe 预告的 Firefly 文生视频 AI 模型Adobe 表示，当前全球短视频市场需求不断增长，这意味着编辑、电影制作人或内容创作者需要在更短的时间内完成更多工作。常见的编辑任务包括修剪片段长度、删除场景中不必要的内容、设置转场，同时还要寻找完美的节奏。虽然 Adobe 已

9/13/2024 3:01:21 PM

漾仔

昆仑万维发布奖励模型 Skywork-Reward，登顶 RewardBench 排行榜

昆仑万维发布了两款全新的奖励模型 Skywork-Reward-Gemma-2-27B 和 Skywork-Reward-Llama-3.1-8B。在奖励模型评估基准 RewardBench 上，这两款模型分别位列排行榜上的第一和第三位。奖励模型（Reward Model）是强化学习（Reinforcement Learning）中的核心概念和关键组成，它用于评估智能体在不同状态下的表现，并为智能体提供奖励信号以指导其学习过程，让智能体能够学习到在特定环境下如何做出最优选择。奖励模型在大语言模型（Large Lan

9/13/2024 3:00:14 PM

沛霖（实习）

首次运用 AI 技术助力搜救，2024 年国际邮轮大规模综合应急演习在天津举行

据央视新闻报道，2024 年国际邮轮大规模综合应急演习在天津举行，这也是今年以来全国规模最大的一次国际邮轮搜寻救助综合实战演练，并首次运用 AI 技术等科技手段助力搜寻救助。报道称，演习模拟满载旅客的“梦想”号邮轮在靠泊码头进入航道时与一艘失控的集装箱船舶发生碰撞。邮轮多名旅客落水，多名旅客受伤，且邮轮进水倾斜；集装箱船上多个装载着新能源汽车的集装箱着火，需要紧急救援救助。此次演习还首次采用了多项科技手段。数据中心通过 AI 算法和技术快速对现场事故的受伤人数、落水人员位置等关键信息进行分析研判，智能生成多套救援方

9/13/2024 2:55:36 PM

浩渺

OpenAI o1深夜炸场，核心贡献者有哪些？我们看到了大量华人的名字

这篇文章系统梳理了 OpenAI o1模型背后的核心人才。今天凌晨，OpenAI 震撼发布 o1 大模型，酝酿已久的「草莓」终于面世。新模型能够进行复杂推理，具备真正的通用推理能力，可解决比以往的科学、代码和数学模型所能处理的更难的问题。它在一系列高难基准测试中展现出了超强实力，相比 GPT-4o 有巨大提升，甚至能在博士级别的科学问答环节上超越人类专家（详情请参见《刚刚，OpenAI 震撼发布 o1 大模型！强化学习突破 LLM 推理极限》）。虽然 o1 很强，但有趣的是，它并不会尝试去推理和解答「黎曼猜想」这类

9/13/2024 1:06:00 PM

机器之心

元象发布中国最大MoE开源大模型落地应用登顶港台榜

元象XVERSE发布中国最大MoE开源模型：XVERSE-MoE-A36B，加速AI应用低成本部署，将国产开源提升至国际领先水平。该模型总参数255B，激活参数36B，达到100B模型性能的「跨级」跃升，同时训练时间减少30%，推理性能提升100%，使每token成本大幅下降。元象「高性能全家桶」系列全部开源，无条件免费商用，让海量中小企业、研究者和开发者能按需选择。

9/13/2024 11:58:00 AM

朱可轩

AI蛋白大模型推动生物产业变革，分子之心完成A轮融资

编辑 | ScienceAI在生物经济智能化升级的浪潮中，业界领先的AI蛋白质设计平台公司分子之心宣布于近期完成 A 轮融资。本轮融资额达数亿元人民币，由谢诺投资、深创投联合领投，商汤国香资本、久奕投资跟投。作为具有行业标杆地位的 AI 生物大分子设计平台公司，分子之心本轮融资将进一步提速 AI 生物基础设施建设。分子之心创始人、国际知名计算生物学家许锦波表示，本轮融资将用于进一步扩大顶级复合型人才团队，深入完善AI蛋白质基础大模型、AI 蛋白质优化设计平台 MoleculeOS 等生物经济共性技术平台，加速AI蛋

9/13/2024 11:53:00 AM

ScienceAI

国内最大MoE开源大模型来了，还基于此搞出个火遍港台的AI聊天应用

元象 XVERSE 发布中国最大 MoE 开源模型：XVERSE-MoE-A36B，加速 AI 应用低成本部署，将国产开源提升至国际领先水平。该模型总参数 255B，激活参数 36B，达到 100B 模型性能的「跨级」跃升，同时训练时间减少 30%，推理性能提升 100%，使每 token 成本大幅下降。元象「高性能全家桶」系列全部开源，无条件免费商用，让海量中小企业、研究者和开发者能按需选择。MoE（Mixture of Experts）是业界最前沿的混合专家模型架构，将多个细分领域的专家模型组合成一个超级模型

9/13/2024 11:34:00 AM

机器之心

我想给她完整的一生：“全球首个通用智能人”北大小女孩“通通”亮相

9 月 1 日，中央广播电视总台大型公益节目 2024 年《开学第一课》播出，北京大学智能学院、人工智能研究院院长、计算机视觉专家、人工智能专家朱松纯教授携全球首个通用智能人 —— 小女孩（Little Girl）“通通”亮相节目现场。据北京大学介绍，这位名叫“通通”的小女孩拥有三四岁的心智，是一个有“心”的人工智能。她所做的事情不受人为控制，而是由自己“心”里的价值所驱动。在随机的场景中，“通通”会自主地捡起地上的玩具放进收纳盒中，拿起抹布擦去地上的污渍，搬起板凳清洗抹布。通过一系列的行为可以发现，“干净”是她的

9/13/2024 10:47:13 AM

汪淼

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理极限

大模型领域的技术发展，今天起再次「从 1 开始」了。大语言模型还能向上突破，OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览版 ——o1-preview。除了 o1，OpenAI 还展示了目前正在开发的下次更新的评估。o

9/13/2024 8:47:00 AM

机器之心

面向软件工程的AI智能体最新进展，复旦、南洋理工、UIUC联合发布全面综述

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本篇综述的作者包括来自复旦大学 CodeWisdom 团队的研究生刘俊伟、王恺欣、陈逸轩和彭鑫教授、娄一翎青年副研究员，以及南洋理工大学的陈震鹏研究员和伊利诺伊大学厄巴纳 - 香槟分校（U

9/13/2024 8:37:00 AM

机器之心

安卓版谷歌 Gemini Live 免费上线，开启在线 AI 语音畅聊

科技媒体 9to5Google 昨日（9 月 12 日）发布博文，报道谷歌在 1 个月前面向 Advanced 订阅用户推出后，正逐步面向所有安卓用户免费开放 Gemini Live。AI在线曾于 8 月报道，谷歌在 Pixel 9 系列手机发布会上，发布了 Gemini Live，该服务提供了一种移动对话体验，让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式（限量 Alpha 测试），采用了增强型语音引擎

9/13/2024 8:33:38 AM

故渊

边缘智能的新时代：端侧大模型的研究进展综述

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected] Xu : Meta AI科学家，专注大模型和智能眼镜开发。南加州大学博士，Linkedin Top AI Voice，畅销书作家。他的AI科普绘本AI for Babies

9/13/2024 8:33:00 AM

机器之心

文生图 AI Midjourney 雄心：7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域

科技媒体 The Decoder 昨日（9 月 12 日）发布博文，报道称在最近的“Office Hours”活动中，Midjourney 创始人兼首席执行官 David Holz 在 Discord 分享了当前项目的最新进展，并回答了社区的提问。Midjourney 7.0 版本Holz 更新了 Midjourney 7.0 版本时间表，表示将会在未来 1-2 月内发布。让更多人体验 MidjourneyHolz 表示公司并不急于推出新的 AI 模型，而是提高现有技术的易用性，让工具深入融入到专业人士的日常工作中

9/13/2024 7:36:39 AM

故渊

安卓和 iOS 版谷歌 Gemini AI 应用新增 Gems 及管理器

科技媒体 testingcatalog 昨日（9 月 12 日）发布博文，报道称 iOS 和安卓版 Gemini 应用新增支持 Gem 和 Gem 管理器。用户现可在主屏幕上查看常规聊天及与 Gems 相关的聊天，此外用户可进入 Gem 管理器，界面采用标签式布局，首屏展示所有 Gems，分为用户自定义 Gems 和谷歌预制的 Gems 两部分。用户如果要编辑或创建新 Gems，用户会被引导打开网页版，该网页版会在同一应用内的网页视图中打开。Gemini 简介AI在线附上官方介绍如下：Gemini 应用是一款实验性

9/13/2024 7:24:34 AM

故渊

效率暴涨！100万人都在关注的多合一 AI 搜索神器 SeekAll！

大家好我是花生~ 随着 AI 技术的发展成熟，我现在查资料基本都在用 AI 搜索引擎，比如 KimiChat、腾讯元宝、Perplexity AI 等，它们真的极大提高了我的信息获取效率。不过现在各种 AI 搜索引擎太多了，为了获得更全面的信息，我常常不得不在多个引擎之间来回切换使用，有时也会觉得麻烦。但最近我发现了一款宝藏工具刚好可以解决我的这个烦恼，它将多个 AI 搜索引擎及知识平台都聚合到了一起，我只需要发送一次提问，就能同时获得多个网站的答案，简直不要太方便！今天就为大家详细介绍这款多合一的 AI 搜索

9/13/2024 7:19:03 AM

夏花生

谷歌推出 DataGemma：基于可信数据源提高 AI 准确度，减少幻觉

科技媒体 maginative 昨日（9 月 12 日）发布博文，报道谷歌公司基于谷歌数据共享（Data Commons）中的真实世界统计数据，推出了开放权重 Gemma 模型的新版本 DataGemma。语言模型当前面临的一大难题就是幻觉（Hallucinations），尤其是大语言模型（LLMs）在处理数值或统计数据时，这一问题变得尤为棘手，因此精确性至关重要。谷歌的 Data Commons 是一个存储库，汇集了来自联合国和疾病控制与预防中心等可信组织收集的超过 2400 亿个数据点。通过利用这一庞大的统计

9/13/2024 7:11:53 AM

故渊

OpenAI o1 模型登场：开启 AI 通用复杂推理新篇章，国际奥数正确率 83%

感谢OpenAI 传闻中的“草莓”（Strawberry）AI 模型现已面世，正式名称为“o1”，是该公司首款具备“推理”能力的模型。o1 和 o1-miniOpenAI 表示对该模型进行特殊训练，能够比人类更快地回答更复杂的问题。与之同时发布的还有 o1-mini，一个更小、成本更低的版本。OpenAI 表示 o1 模型的发布，是其迈向类人 AI 宏伟目标的关键一步。AI在线注：o1 模型目前处于“预览”阶段，官方强调该模型相关开发尚处于初期阶段，相比较 GPT-4o 模型，使用成本更高且速度更慢，但在编写代码和

9/13/2024 6:56:28 AM

故渊

资讯热榜

Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Ollama 支持全线的 Qwen 3 模型即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 AI视频资讯早读！7个产品更新+8个案例精选 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集训练应用大型语言模型科技亚马逊智能体 DeepMind 特斯拉

应用

初探谷歌 Gemini 的 Google Photos 扩展：帮用户回忆过往、记录信息

Adobe 预告 Firefly 文生视频 AI 模型年内登场，可通过提示词 / 静帧生成动态片段

昆仑万维发布奖励模型 Skywork-Reward，登顶 RewardBench 排行榜

首次运用 AI 技术助力搜救，2024 年国际邮轮大规模综合应急演习在天津举行

OpenAI o1深夜炸场，核心贡献者有哪些？我们看到了大量华人的名字

元象发布中国最大MoE开源大模型 落地应用登顶港台榜

AI蛋白大模型推动生物产业变革，分子之心完成A轮融资

国内最大MoE开源大模型来了，还基于此搞出个火遍港台的AI聊天应用

我想给她完整的一生：“全球首个通用智能人”北大小女孩“通通”亮相

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理极限

面向软件工程的AI智能体最新进展，复旦、南洋理工、UIUC联合发布全面综述

安卓版谷歌 Gemini Live 免费上线，开启在线 AI 语音畅聊

边缘智能的新时代：端侧大模型的研究进展综述

文生图 AI Midjourney 雄心：7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域

安卓和 iOS 版谷歌 Gemini AI 应用新增 Gems 及管理器

效率暴涨！100万人都在关注的多合一 AI 搜索神器 SeekAll！

谷歌推出 DataGemma：基于可信数据源提高 AI 准确度，减少幻觉

OpenAI o1 模型登场：开启 AI 通用复杂推理新篇章，国际奥数正确率 83%

元象发布中国最大MoE开源大模型落地应用登顶港台榜