Project

谷歌 CEO 桑达尔・皮查伊：努力在明年推出具有可视化功能的 AI 助理

北京时间今天凌晨，谷歌 CEO 桑达尔・皮查伊在公司第三季度财报电话会议上透露了“Project Astra”计划的最新进展。他表示，谷歌正在构建能够识别和推理用户周围环境的 AI 体验，“‘Project Astra’代表了这种未来的初步探索。我们正力争在 2025 年尽早推出类似体验。

10/30/2024 7:24:46 AM

清源

Adobe 推出多款 AI 工具：可构建 3D 场景、消除路人、清洁镜头

据 The Verge 今天凌晨报道，Adobe 近期展示了多款实验性的 AI 工具，可用于动画制作、图像生成、照片及视频的优化等领域，未来有望被整合到 Creative Cloud 中。Project Scenic：该工具可让用户在使用 Firefly 模型生成图像时拥有更大的控制权。其能够生成一个完整的 3D 场景，用户可以自由添加、移动、调整场景中的物体大小，最终结果会根据 3D 场景生成相应的 2D 图像。

10/16/2024 7:04:50 AM

清源

Adobe 推出 AI 头脑风暴工具：激发无限灵感，让创意自由飞翔

科技媒体 Maginative 昨日（10 月 14 日）发布博文，报道称在年度 MAX 会议上，Adobe 预览推出了 Project Concept 项目，是一款基于 AI 的创意头脑风暴工具。该工具的目标是生成更快速、更富想象力和更具协作性的创意，让设计师能够专注于探索更广泛的创意可能性。该项目是为每个创造性旅程的早期时刻打造的，设计师能够快速生成创意、混合资产、转换特定区域以及重新混合风格和元素。

10/15/2024 3:08:04 PM

故渊

谷歌发布 Oscar 服务，帮助开发者通过 AI 智能体掌控开源软件项目

感谢谷歌公司今天发布新闻稿，宣布推出 Project Oscar 项目，帮助开源开发团队使用和创建 AI 智能体（Agent）来管理软件项目。谷歌在印度班加罗尔举办了 2024 I / O Connect 开发者活动，旗下 Go 语言开发团队推出了 Project Oscar 项目，通过构建 AI 智能体开源平台，可以帮助软件产品团队监控开发过程中的问题或错误。这些 AI 智能体可部署在开发、规划、运行或者售后支持等方面，开发者无需重新编写任何代码，可以通过自然语言进行交互。谷歌开源编程语言 Go 的产品经理卡梅隆

7/18/2024 7:50:09 AM

故渊

亚马逊推出“侦探”项目：AI 火眼金睛确保商品发货前无瑕疵

为了让顾客收到满意的商品，亚马逊祭出利器 ——“Project PI”（侦探项目）。这项结合生成式 AI 和计算机视觉技术的系统，能够在商品运送给顾客之前，就找出损坏、颜色错误或尺寸不对的产品。具体工作流程是这样的：即将送达的商品会通过一个装有扫描装置的隧道。计算机视觉程序 (一种能分析图像内容的 AI 技术) 会检查商品是否存在瑕疵。如果发现问题，系统就会将这件商品分离出来，并进行缺陷评估，同时检查是否有类似问题存在于其他批次商品中，以便追根溯源。据亚马逊介绍，Project PI 目前已在美国多个仓库投入使用，

6/4/2024 9:56:45 AM

远洋

对轰 GPT-4o，谷歌推出 Astra 项目：手机镜头内低延迟聊天交互

谷歌公司在今天召开的 2024 年 I / O 开发者大会上，推出了全新的 Project Astra 项目，基于 Gemini，可以本地运行在 Pixel 手机上，可以说是对标 OpenAI GPT-4o 的最新模型。谷歌表示 Project Astra 是最新的多模态 AI 项目，用户打开摄像头，该多模态项目可以直接解释用户画面中物品。该公司刚刚用一段令人印象深刻的视频演示了它的功能，在一个不间断的镜头中，它能正确识别几件物品，回忆起它在哪里看到了主人的眼镜（靠近桌子上的一个红苹果），还能解释屏幕上的代码。IT

5/15/2024 2:13:49 AM

故渊

“面对面通话”指日可待，谷歌、惠普明年将推动全息视频聊天技术商业化

谷歌今日通过新闻稿宣布，将与惠普于 2025 年开始推动全息视频聊天技术 Project Starline 的商业化。谷歌表示，Project Starline 是一个突破性的技术项目，可以让朋友、家人和同事在任何距离都感觉对方近在咫尺。该项目利用先进的 AI、三维成像和其他技术，可以使用户在通话时就像与对方“同处一室”一样。未来，这项技术将会走出实验室，将从明年开始在 Google Meet 或 Zoom 等视频会议服务中启用这种体验。惠普个人系统总裁 Alex Cho 表示，“一半以上的意义和意图是通过肢体语

5/13/2024 10:56:53 PM

清源

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练