谷歌
谷歌最强文生图 AI 模型 Imagen 3 再进化:多样艺术风格、构图更平衡
谷歌公司昨日(12 月 16 日)发布博文,在发布 Veo 2 视频生成模型之外,还增强了 Imagen 3 文生图 AI 模型,为用户带来更多花样的艺术风格。
12/17/2024 10:01:08 AM
故渊
谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图
谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。
12/17/2024 9:16:36 AM
远洋
谷歌 NotebookLM 新功能上线:用户可与 AI 主播进行互动
谷歌也提醒,这仍是一个“实验性功能”,主持人在回答时可能会有“尴尬的停顿”,甚至偶尔出现不准确的回答,所以初期使用体验可能并不完美。
12/14/2024 10:21:18 AM
清源
哈佛大学、谷歌发布 100 万本公共领域书籍,为 AI 训练提供合法数据
早在今年3月,哈佛大学就曾透露其“机构数据计划(IDI)”,并表示这一计划旨在为AI提供“合法数据的可信通道”。直到正式启动后,该计划才确认得到了微软和OpenAI的资金支持。
12/13/2024 9:02:21 AM
清源
谷歌发布多模态直播 API:解锁看、听、说,开启 AI 音视频交互新体验
谷歌昨日在发布 Gemini 2.0 的同时,还发布了全新的多模态直播(Multimodal Live)API,帮助开发人员开发具有实时音频和视频流功能的应用程序。
12/13/2024 8:44:18 AM
故渊
谷歌最强大模型Gemini 2.0被抬上来了,网友:好科幻
能搜网页、写代码,还能教你打游戏。 OpenAI 接连几天的「轰炸」,已经让人审美疲劳。 作为应对,周三,谷歌推出新一代至强 AI 大模型 Gemini 2.0 Flash 。
12/12/2024 5:17:00 PM
机器之心
谷歌发布智能体原型 Mariner,能帮用户操作表格、在线购物
美国时间周三,谷歌发布了一款可以自主浏览网站的智能体(A.I. agent)。这种实验性工具能够浏览电子表格、购物网站以及其他在线服务,然后代表用户执行操作。
12/12/2024 3:14:44 PM
辰辰
谷歌量子芯片Willow炸翻了科技圈:攻克30年量子难题,网友:谷歌又行了!
出品 | 51CTO技术栈(微信号:blog51cto)12月10日,谷歌一项发布震惊了整个AI圈,谷歌 CEO 皮查伊激动地宣布,谷歌最新的量子计算芯片 Willow 已经问世! 基准测试中,Willow 取得了惊人的成绩:在不到 5 分钟内完成了一项标准计算,而这需要顶尖超算超过 10^25 年——比宇宙年龄还长! 消息一出,连马斯克都惊叹:“Wow!
12/12/2024 3:09:26 PM
谷歌Gemini再添猛将!GPA 5.0毕业即DeepMind高级科学家,开挂博士给科研新人7点建议
就在Gemini 2.0发布之前几天,一位新晋华人博士宣布加入Google DeepMind,作为高级研究科学家致力于Gemini预训练和多模态研究。 薛复昭,博士毕业于新加坡国立大学师从尤洋教授,2021年以5.0的GPA成绩硕士毕业于南洋理工大学,师从庄永聪教授和孙爱欣教授。 在新加坡国立大学攻读博士期间,曾在Google Brain与谷歌天才科学家Yi Tay和Mostafa Dehghani一起实习,并在NVIDIA GEAR与Jim Fan和Yuke Zhu一起实习。
12/12/2024 2:00:00 PM
新智元
OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1
OpenAI Day 5,风头被谷歌再一次抢了。 就在刚刚,谷歌CEO劈柴、DeepMind CEO哈萨比斯、DeepMind CTO Kavukcuoglu三位大佬联手官宣:新一代原生多模态模型Gemini 2.0 Flash正式发布! 至此,Gemini正式进入2.0时代!
12/12/2024 11:29:51 AM
新智元
谷歌:“AI 概览”功能计划明年面向更多国家、更多语言开放
谷歌首席执行官桑达尔·皮查伊表示,会将Gemini 2.0的高级推理能力融入AI Overviews(AI概览),未来将能够处理“更复杂的主题”以及“多模态”和“多步骤”的搜索,包括高级数学问题和编程问题。
12/12/2024 10:57:08 AM
清源
谷歌推出“深度研究”AI 工具,可一键生成调研报告
谷歌今日推出了一款名为“深度研究”(Deep Research)的全新人工智能工具,该工具能够利用其 Gemini 大型语言模型进行网络信息检索,并为用户生成详细的调研报告。
12/12/2024 9:43:11 AM
远洋
抢跑OpenAI!谷歌Gemini 2.0震撼登场:全面转向Agent,多模态输入输出,免费随便玩
Gemini 2.0 Flash是2.0家族第一个模型,主推原生多模态输入输出 Agent,速度比 1.5 Pro 快两倍,关键性能指标甚至超过了 1.5 Pro! 支持原生工具调用、以及实时音视频流输入等新功能谷歌CEO劈柴哥,谷歌DeepMind CEO 诺奖获得者Demis Hassabis,谷歌DeepMind CTO罕见齐下场共同撰文为Gemini 2.0 Flash的推出当啦啦队重点功能:更强性能: 速度更快,多模态、文本、代码、视频、空间理解和推理能力全面提升! 新能力比如空间理解,视频理解等可以通过Googele AI Studio 的Starter Apps来体验例如1,Gemini 2.0对空间的理解,利用Spatial Understanding,上传一张图片,Gemini快速进行图像中的物体检测(2D和3D形式都可以)和标注,并生成结构化的数据(JSON格式)。
12/12/2024 9:09:24 AM
AI寒武纪
谷歌测试 Gemini AI 游戏助手:实时分析屏幕以提供游戏建议
谷歌今日发布了 Gemini 2.0,并透露正在探索如何利用该模型构建 AI 游戏助手来理解视频游戏规则,从而为用户提供帮助。谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在一篇博文中表示,这些 AI 助手能够“仅基于屏幕上的画面对游戏进行推理,并通过实时对话为玩家提供后续操作建议。”他们还提到,这些助手还可以“利用谷歌搜索,将玩家与网络上丰富的游戏知识连接起来。”
12/12/2024 9:02:04 AM
远洋
谷歌推出 AI 代码助手 Jules,可帮助开发者修复代码错误
谷歌今日宣布推出一款名为“Jules”的实验性 AI 代码助手,旨在帮助开发者自动修复代码错误。该工具今日与 Gemini 2.0 一同发布,其使用更新后的谷歌人工智能模型来创建多步骤计划,以解决问题、修改多个文件,并为 GitHub 工作流中的 Python 和 Javascript 编码任务准备拉取请求。
12/12/2024 8:30:42 AM
远洋
谷歌称 Project Astra 将开启测试,部分人员通过智能眼镜体验 AI 助手
在 Gemini 2.0 发布前的媒体简报会上,谷歌 DeepMind 团队的产品经理 Bibo Xu 透露,“一小部分人将通过原型眼镜测试 Project Astra,我们认为这是体验此类 AI 最强大、最直观的方式之一。”这部分测试人员将隶属于谷歌的 Trusted Tester 项目,该项目通常能够接触到这些早期原型,其中许多原型最终并不会公开发布。据悉,部分测试人员将通过安卓手机使用 Astra,而另一部分则通过眼镜进行体验。
12/12/2024 8:19:47 AM
远洋
谷歌深夜炸场:Gemini 2.0 正式发布,号称迄今智能体时代最有能力的 AI 模型
谷歌正式发布Gemini 2.0,号称迄今为止为智能体时代最有能力的AI模型,带来了增强的性能、更多的多模态性和新的原生工具使用。
12/11/2024 11:55:14 PM
问舟
YouTube 自动配音功能推广至更多知识类频道,借助 AI 生成视频多语言配音
YouTube当地时间周二宣布,其自动配音功能已开始推广至更多的频道,创作者可为其视频生成多种语言的翻译音频。此前,这项功能仅限于少数创作者进行测试。
12/11/2024 11:21:50 AM
清源
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
人形机器人
苹果
深度学习
AI视频
模态
字节跳动
xAI
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
大型语言模型
训练