Project
谷歌 CEO 桑达尔・皮查伊:努力在明年推出具有可视化功能的 AI 助理
北京时间今天凌晨,谷歌 CEO 桑达尔・皮查伊在公司第三季度财报电话会议上透露了“Project Astra”计划的最新进展。 他表示,谷歌正在构建能够识别和推理用户周围环境的 AI 体验,“‘Project Astra’代表了这种未来的初步探索。 我们正力争在 2025 年尽早推出类似体验。
10/30/2024 7:24:46 AM
清源
Adobe 推出多款 AI 工具:可构建 3D 场景、消除路人、清洁镜头
据 The Verge 今天凌晨报道,Adobe 近期展示了多款实验性的 AI 工具,可用于动画制作、图像生成、照片及视频的优化等领域,未来有望被整合到 Creative Cloud 中。Project Scenic:该工具可让用户在使用 Firefly 模型生成图像时拥有更大的控制权。其能够生成一个完整的 3D 场景,用户可以自由添加、移动、调整场景中的物体大小,最终结果会根据 3D 场景生成相应的 2D 图像。
10/16/2024 7:04:50 AM
清源
Adobe 推出 AI 头脑风暴工具:激发无限灵感,让创意自由飞翔
科技媒体 Maginative 昨日(10 月 14 日)发布博文,报道称在年度 MAX 会议上,Adobe 预览推出了 Project Concept 项目,是一款基于 AI 的创意头脑风暴工具。该工具的目标是生成更快速、更富想象力和更具协作性的创意,让设计师能够专注于探索更广泛的创意可能性。该项目是为每个创造性旅程的早期时刻打造的,设计师能够快速生成创意、混合资产、转换特定区域以及重新混合风格和元素。
10/15/2024 3:08:04 PM
故渊
谷歌发布 Oscar 服务,帮助开发者通过 AI 智能体掌控开源软件项目
感谢谷歌公司今天发布新闻稿,宣布推出 Project Oscar 项目,帮助开源开发团队使用和创建 AI 智能体(Agent)来管理软件项目。谷歌在印度班加罗尔举办了 2024 I / O Connect 开发者活动,旗下 Go 语言开发团队推出了 Project Oscar 项目,通过构建 AI 智能体开源平台,可以帮助软件产品团队监控开发过程中的问题或错误。这些 AI 智能体可部署在开发、规划、运行或者售后支持等方面,开发者无需重新编写任何代码,可以通过自然语言进行交互。谷歌开源编程语言 Go 的产品经理卡梅隆
7/18/2024 7:50:09 AM
故渊
亚马逊推出“侦探”项目:AI 火眼金睛确保商品发货前无瑕疵
为了让顾客收到满意的商品,亚马逊祭出利器 ——“Project PI”(侦探项目)。这项结合生成式 AI 和计算机视觉技术的系统,能够在商品运送给顾客之前,就找出损坏、颜色错误或尺寸不对的产品。具体工作流程是这样的:即将送达的商品会通过一个装有扫描装置的隧道。计算机视觉程序 (一种能分析图像内容的 AI 技术) 会检查商品是否存在瑕疵。如果发现问题,系统就会将这件商品分离出来,并进行缺陷评估,同时检查是否有类似问题存在于其他批次商品中,以便追根溯源。据亚马逊介绍,Project PI 目前已在美国多个仓库投入使用,
6/4/2024 9:56:45 AM
远洋
对轰 GPT-4o,谷歌推出 Astra 项目:手机镜头内低延迟聊天交互
谷歌公司在今天召开的 2024 年 I / O 开发者大会上,推出了全新的 Project Astra 项目,基于 Gemini,可以本地运行在 Pixel 手机上,可以说是对标 OpenAI GPT-4o 的最新模型。谷歌表示 Project Astra 是最新的多模态 AI 项目,用户打开摄像头,该多模态项目可以直接解释用户画面中物品。该公司刚刚用一段令人印象深刻的视频演示了它的功能,在一个不间断的镜头中,它能正确识别几件物品,回忆起它在哪里看到了主人的眼镜(靠近桌子上的一个红苹果),还能解释屏幕上的代码。IT
5/15/2024 2:13:49 AM
故渊
“面对面通话”指日可待,谷歌、惠普明年将推动全息视频聊天技术商业化
谷歌今日通过新闻稿宣布,将与惠普于 2025 年开始推动全息视频聊天技术 Project Starline 的商业化。谷歌表示,Project Starline 是一个突破性的技术项目,可以让朋友、家人和同事在任何距离都感觉对方近在咫尺。该项目利用先进的 AI、三维成像和其他技术,可以使用户在通话时就像与对方“同处一室”一样。 未来,这项技术将会走出实验室,将从明年开始在 Google Meet 或 Zoom 等视频会议服务中启用这种体验。惠普个人系统总裁 Alex Cho 表示,“一半以上的意义和意图是通过肢体语
5/13/2024 10:56:53 PM
清源
- 1
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
韩国初创公司 RLWRLD 获 1480 万美元融资,致力于机器人基础模型开发
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
AI视频
模态
人形机器人
驾驶
xAI
文本
搜索
字节跳动
大语言模型
Copilot
Claude
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练