Flash

谷歌超低价AI模型Gemini 2.0 Flash-Lite正式上线

日前，Google 推出了其最经济的模型 Gemini2.0Flash-Lite，并且正式可用于生产用途。 Gemini2.0Flash-Lite 是 Google Gemini 系列的一部分，定位为成本效率最高的选择，该模型在 Google AI Studio 和 Vertex AI 上提供公共预览，目标是服务于需要高性价比 AI 解决方案的开发者。它的设计强调轻量化，适合预算有限的团队和初创公司，特别是在处理大规模文本输出任务时表现出色。

2/26/2025 11:51:00 AM

AI在线

谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用：腰斩击穿价 0.15 美元买百万 tokens 输出

科技媒体 NeoWin 昨日（10 月 4 日）发布博文，报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型，成为谷歌公司最便宜的 AI 模型。AI在线曾于今年 8 月报道，谷歌公司推出 3 款 Gemini 实验性模型，其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型，拥有 80 亿参数，专为多模态任务而设计，包括大容量任务和长文本摘要任务。相比较原版 Gemini 1.5 Flash，Gemini 1.5 Flash 8B 延迟更低，特别适合聊

10/5/2024 12:40:26 PM

故渊

谷歌升级 Gemini 1.5 Flash 模型，AI 聊天响应速度最高提 50%

谷歌公司于今年推出 Gemini 1.5 Flash AI 模型，官方承诺提供更快的响应速度、能应对更复杂的用户查询。在最新版本更新中，谷歌宣布采用 Gemini 1.5 Flash 的 Gemini 大幅提升响应速度，增幅最高可以达到 50%。AI在线附上谷歌官方支持文档内容如下：Gemini 给出回答的速度大幅提升更新内容：过去几周以来，我们在改善延迟方面取得了重大进步，采用 1.5 Flash 模型的 Gemini 给出回答的速度现在大幅提升，升幅最高达 50%。更新原因：通过让 Gemini 快速给出回答，

9/4/2024 11:41:51 AM

故渊

智谱 AI 宣布 GLM-4-Flash 大模型免费开放：支持中文、英语、日语、韩语、等 26 种语言

智谱 AI 今日宣布，GLM-4-Flash 大模型免费开放，通过智谱 AI 大模型开放平台调用。GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务，生成速度能达到 72.14 token/s，约等于 115 字符/s。GLM-4-Flash 具备多轮对话、网页浏览、Function Call（函数调用）和长文本推理（支持最大 128K 上下文）等功能，同时支持包括中文、英语、日语、韩语、德语在内的 26 种语言。官方表示，通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法

8/27/2024 4:59:12 PM

沛霖（实习）

AI 大语言模型价格战将启？谷歌本月下调 Gemini 1.5 Flash 费用：降幅最高 78.6%

大语言模型的价格战要来了吗？谷歌公司昨日（8 月 2 日）更新价格页面，宣布将于 2024 年 8 月 12 日开始，Gemini 1.5 Flash 模型每百万输入 tokens 成本为 0.075 美元、每百万输出 tokens 成本为 0.3 美元（AI在线备注：当前约 2.2 元人民币）。这让 Gemini 1.5 Flash 模型的使用成本，比 OpenAI 的 GPT-4o mini 便宜近 50%。根据计算，Gemini 1.5 Flash 模型费用输入费用比此前降低 78.6%，输出费用比此前降低

8/3/2024 2:44:56 PM

故渊

大模型厂商密集发力，谷歌也开“卷”了：Gemini 聊天机器人换上新模型，还能一键核查输出内容

Meta、OpenAI 等大模型厂商密集发力之际，谷歌也宣布了一项重磅更新 ——即日起，Gemini 聊天机器人将改由 Gemini 1.5 Flash 驱动。与之前的版本相比，窗口长度提高到了 4 倍，响应速度也更快了。按照谷歌的介绍，新版聊天机器人背后的 1.5 Flash 模型，主打的就是轻量化和速度提升。当然模型回复的质量也有提升，上下文窗口也从原先（基于 1.0 Pro）的 8k 提升到了 32k。此外新版聊天机器人还增加了“事实核查”功能，可以一键检测生成的内容是否属实，减轻模型幻觉带来的不良影响。有网

7/26/2024 10:36:43 PM

清源

谷歌 Gemini 家族添 Flash 新成员：平衡规模和能力、支持多模态，单次可分析 3 万行代码

谷歌公司今天扩充 Gemini 家族成员，推出了全新的 Gemini 1.5 Flash 模型，重点优化了该模型的速度和效率。谷歌 DeepMind 首席执行官德米斯・哈萨比斯（Demis Hassabis）在一篇博客文章中写道：Gemini 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。哈萨比斯补充说，谷歌之所以创建 Gemini 1.5 Flash，是因为开发人员需要一个比谷歌今年 2 月发布的 Gemini 1.5 Pro 更轻便、更便宜的模型。IT之家注：Gemini

5/15/2024 1:47:17 AM

故渊

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型