Android Studio集成Gemini新增多模态功能，开发者可上传图像获取UI代码

2025-03-14 02:45

谷歌最新宣布，Android Studio中的Gemini助手已升级支持多模态输入功能，开发者现在可以直接将图像附加到提示中，以获取应用程序开发过程中的视觉辅助。这项多模态功能最初在I/O2024大会上亮相，升级后的Gemini现能够"理解简单的线框，并将其转换为可用的Jetpack Compose代码"。在Android Studio Narwal的Canary版本中，Ask Gemini字段新增了"附加图像文件"（支持JPEG或PNG格式）选项。

谷歌最新宣布，Android Studio中的Gemini助手已升级支持多模态输入功能，开发者现在可以直接将图像附加到提示中，以获取应用程序开发过程中的视觉辅助。

这项多模态功能最初在I/O2024大会上亮相，升级后的Gemini现能够"理解简单的线框，并将其转换为可用的Jetpack Compose代码"。在Android Studio Narwal的Canary版本中，Ask Gemini字段新增了"附加图像文件"（支持JPEG或PNG格式）选项。谷歌建议用户使用具有"强烈色彩对比"的图像并提供"清晰的提示"以获得最佳效果。

开发者可以上传从简单线框到高保真模型的各类屏幕截图和用户界面，并能指定预期功能。例如，在计算器设计示例中，可以要求"使交互和计算按预期工作"。

将视觉设计转化为功能性UI代码的典型提示包括:1."针对所提供的此图像，编写Android Jetpack Compose代码以制作尽可能接近此图像的屏幕。确保包含导入、使用Material3并记录代码。"2."对于提供的这张图片，编写Android Jetpack Compose代码以制作尽可能接近此图片的屏幕，在颜色上发挥创意。使交互和计算按预期进行。确保包含导入、使用Material3并记录代码。"

谷歌将Gemini定位为提供"初始设计框架"的工具，生成的代码通常需要进一步编辑和调整。常见的改进包括确保正确导入可绘制对象和图标。谷歌建议将生成的代码视为高效起点，从而加速UI开发工作流程。

此外，Gemini的视觉分析功能还可用于识别和解决错误，开发者可以"上传有问题的UI的屏幕截图，Gemini将分析该图像并提出潜在的解决方案"。开发者还可以附加相关代码片段以获得更精确的帮助。

Android Studio中的Gemini还支持上传架构图并获取解释或文档，类似于此前在I/O大会上展示的Gemini Astra眼镜功能。

百度文心一言将于4月1日起全面免费并上线深度搜索功能

文心大模型官方宣布了两个重要更新，为用户带来更为便捷和高效的使用体验。据悉，随着文心大模型的持续迭代与成本优化，文心一言将于4月1日零时起实现全面免费。届时，无论是在PC端还是APP端，用户均可无门槛地体验文心系列最新模型。

2/13/2025 10:22:00 AM

AI在线

调查：超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告，企业在人工智能（AI）领域的投资高达2.5亿美元，尽管在证明投资回报率(ROI)方面面临挑战。商业领袖们正努力提高生产力，但新技术的集成往往需要重构现有应用、更新流程并激励员工学习，以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查，以揭示 AI 采用的现实情况，探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。

3/18/2025 10:02:00 AM

AI在线

降低门槛，全平台应用，昇腾还会手把手地教你如何用AI

机器之心报道作者：泽南如何才能做到 AI 应用一次开发，全场景部署？昇腾给出了答案。如今的大多数 AI 应用程序都需要跑在多种类型的处理器上，覆盖数十个版本的操作系统，运行在从端侧到云计算集群的各种设备上。这样复杂的环境，对软件的适应性和模型的可裁剪、可伸缩性提出了极高要求。AI 开源框架也在顺应这股潮流，昇腾发布的 CANN、MindSpore、MindX 等工具，可以让开发者实现「统一端边云，全端自动部署」，开启了机器学习开发的新时代，一直被人们寄予厚望。昇腾的 AI 全栈软件平台。其中，基础架构作为连接硬件与

3/19/2021 11:23:00 AM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OPPO 小布助手网页版上线，接入满血版 DeepSeek 本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

Android Studio集成Gemini新增多模态功能，开发者可上传图像获取UI代码

相关资讯

百度文心一言将于4月1日起全面免费 并上线深度搜索功能

调查：超72% 的企业选择 AI 工具时最看重易用性

降低门槛，全平台应用，昇腾还会手把手地教你如何用AI

百度文心一言将于4月1日起全面免费并上线深度搜索功能