谷歌打磨 Gemini AI 技能:扩充支持文件类型、提高文档洞察力

谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持更多类型的文件,通过分析、摘录、洞察文档内容,为用户提供更优质的 AI 服务。谷歌表示拥有 Gemini Business、Enterprise、Education 或 Education Premium 许可证的 Google Workspace 用户,现在可从 Google Drive 或本地设备上传各种文件到 Gemini(gemini.google.com):电子表格:Gemini AI 现在可以处理 CSV、XLSX 和 ODS 等格式的

谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持更多类型的文件,通过分析、摘录、洞察文档内容,为用户提供更优质的 AI 服务。

谷歌打磨 Gemini AI 技能:扩充支持文件类型、提高文档洞察力

谷歌打磨 Gemini AI 技能:扩充支持文件类型、提高文档洞察力

谷歌表示拥有 Gemini Business、Enterprise、Education 或 Education Premium 许可证的 Google Workspace 用户,现在可从 Google Drive 或本地设备上传各种文件到 Gemini(gemini.google.com):

电子表格:Gemini AI 现在可以处理 CSV、XLSX 和 ODS 等格式的电子表格,使用户能够分析数字数据、跟踪趋势,并从财务模型、销售报告等生成洞察力。

演示文稿:用户现在可以上传 PPTX、PDF 和 KEY 等格式的演示文稿,让 Gemini AI 可以提取要点、总结内容并识别图表和图像等视觉元素。

图像:Gemini AI 现在可以分析 JPEG、PNG 和 GIF 等格式的图像,提取文本、识别对象并为视觉内容提供上下文。

音频:用户现在可以上传 MP3、WAV 和 FLAC 等格式的音频文件,让 Gemini AI 能够转录语音、识别发言人,并总结访谈、播客和讲座中的要点。

视频:Gemini AI 现在可以处理 MP4、MOV 和 AVI 等格式的视频文件,从演示文稿、纪录片和培训视频中提取脚本、识别场景并总结关键事件。

AI在线援引新闻稿,Gemini 可以根据用户输入的提示词,更有针对性地分析用户上传文件,总结复杂的主题、识别趋势和洞察力,以及改进写作和文档组织的建议,帮助用户提高理解、研究和写作能力。

相关资讯

谷歌 Gemini 被曝今日起推出多项新功能:定制 GPT、记忆或个性化回复等

根据反向工程师 @testingcatalog 的发现,谷歌将在近期为其 Gemini 人工智能助手带来几项更新。从该工程师发布的截图来看,这一轮更新原计划在 7 月 11 日、7 月 18 日分批推送,但他又声称 7 月 11 日的更新已经推迟至 7 月 15 日(AI在线注:日期即今日,但以具体时区为准),预计当天将带来 1 项功能。而在 7 月 18 日,谷歌计划发布 4 项 Gemini 新功能。媒体 Testing Catalog 披露了近期即将发布的新功能,但未说明这些功能的具体上线日期。文生图工具 I

移动版谷歌 Gemini 将迎诸多新特性:分析 PDF 文件内容等

感谢消息源 AssembleDebug 近日挖掘安卓版 Gemini 应用程序,发现隐藏了诸多新功能 / 新特性,包括上传 PDF 等文件,引入 Live Prompts、Select text 功能等。上传并分析 PDF 格式文件安卓版 Gemini 现阶段仅支持上传图片,而在最新版中相关代码已经出现了上传 PDF 等文件描述,可以分析文档中的内容,只是该功能目前尚未生效。Select text安卓版 Gemini 此前提供的回答只能全文复制,用户需要复制粘贴到其它地方再进行优化。而在最新选项中新增了“Selec

OpenAI 推出 meta-prompt 工具,AI 时代让你掌握提示词艺术

AI 时代,你和他人的差异可能直接体现在如何提出合适的提示词(Prompt)上。科技媒体 The Decoder 昨日(10 月 11 日)发布博文,报道称 OpenAI 更新提示词优化功能 Playgound,新增引入“元提示”(meta-prompt)工具。“元提示”(meta-prompt)工具主要帮助用户更高效地创建、改进针对大型语言模型(LLMs)的提示,节省开发高质量 AI 提示的时间。