AI图像生成

字节跳动开源项目UNO：图片生成可以保持角色、物体一致性

人工智能（AI）在图像生成领域取得了显著的进展，但如何让AI在生成不同场景或进行多次创作时，保持图像中特定角色或物体的一致性，一直是行业内的重要挑战。近日，字节跳动旗下的智能创作团队发布了其最新的开源项目 UNO，旨在通过创新技术，解锁更强的生成可控性，尤其是在保持图像主体一致性方面，为AI图像生成领域带来了新的突破。 AI作图“脸盲症”?UNO帮你记住“主角”在以往的AI图像生成过程中，即使输入相同的描述，每次生成的人物、物品也可能在外观上存在显著差异，这使得在需要保持角色或物体在不同图像中形象统一的应用场景中面临诸多不便。

4/14/2025 10:01:22 AM

AI在线

ChatGPT图像生成功能上线，免费用户迎来创作新机遇

在科技快速发展的时代，人工智能（AI）正以惊人的速度渗透到我们生活的方方面面。近期，ChatGPT 迎来了一项备受期待的新功能 ——AI 图像生成。这一功能不仅满足了广大用户的创意需求，还以其独特的 “吉卜力风格” 受到热烈欢迎。

3/31/2025 4:21:00 PM

AI在线

Midjourney新研究发力创意文本生成，让LLM写作更具创意

以AI图像生成技术闻名遐迩的Midjourney，正悄然展现其在人工智能领域的更广阔野心。这家拥有庞大用户群体的科技公司，在自研计算和AI硬件的消息之后，近期携手纽约大学（NYU）的机器学习专家，发布了一项关于训练文本生成大语言模型(LLMs)的最新研究成果。该研究聚焦于提升LLM在创意写作方面的能力，旨在使AI模型能够像Meta的Llama和Mistral等开源模型一样，写出更具创造性的文本。

3/25/2025 10:21:00 AM

AI在线

字节推文生图框架InfiniteYou ：可保持人脸特征，场景随便换

字节跳动悄悄咪咪推出了一款名为 InfiniteYou （InfU），的图像生成神器。简单的说，这是一款文本到图像的生成模型，它的厉害之处在于，能够根据你输入的文字描述，生成带有你个人身份特征的高质量图像。这可不是简单的换脸App能比的，它更注重的是在灵活变换场景和内容的同时，精准保留你的身份特征。

3/21/2025 3:13:00 PM

AI在线

谷歌Gemini 2.0 Flash引发争议：AI轻松去除图片水印引发版权担忧

一场关于AI边界的新争议正在科技圈掀起波澜。谷歌最新推出的人工智能模型Gemini2.0Flash被发现具有令人担忧的能力——它可以轻松去除图片水印，包括来自盖蒂图片社等知名图库的专业水印，这一功能引发了创作者和版权持有者的广泛关注。上周，谷歌扩大了Gemini2.0Flash模型图像生成功能的访问范围，使更多用户能够体验其强大的图像生成和编辑能力。

3/17/2025 9:27:00 AM

AI在线

谷歌Gemini 2.0 Flash放出原生图像生成功能：支持多轮对话式实时编辑编辑

继Gemma3之后，谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash，而且人家这次是带着独门绝技来的:原生图像生成! 要知道，以前的AI图像生成，很多时候都是大型语言模型（LLM）先理解你的文字，然后再把意思“翻译”给专门生成图像的扩散模型。这中间难免会有些“失真”，就像隔着好几个人传话，最后意思都变味儿了。

3/13/2025 9:50:00 AM

AI在线

Luma AI 开源的图像预训练技术IMM实现图像生成十倍提速

你们有没有觉得，辛辛苦苦用海量数据喂养出来的图像模型，在生成高质量图片时，总像蜗牛爬树般慢吞吞?别急，Luma AI 最近开源了一项名为 Inductive Moment Matching （IMM）的图像模型预训练技术，据说能让模型以前所未有的“闪电”速度生成高质量图像，简直是炼丹炉里的涡轮增压!算法停滞?Luma AI 怒砸“天花板”近年来，AI 社区普遍感受到，生成式预训练似乎遇到了瓶颈。尽管数据量持续攀升，但算法创新却相对停滞。 Luma AI 认为，这并非数据不够，而是算法没能充分挖掘数据的潜力，这如同手握金矿却只会用锄头挖土，效率实在堪忧。

3/12/2025 3:16:00 PM

AI在线

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练