图片
DPG-Bench榜首!智谱开源文生图模型CogView4:支持中英文输入和生成,免费商用授权!
在图像生成技术的浪潮中,智谱开源再次引领潮流,推出了全新的文生图模型——CogView4。 这款模型不仅支持中英双语提示词输入,更擅长理解和遵循中文指令,让创意表达无界限。 尤为值得一提的是,CogView4开创了先河,成为首个能在画面中直接生成汉字的开源文生图模型,让文字与图像的融合更加自然流畅。
3/11/2025 10:00:00 AM
AIGC Studio
一条神奇的指令,DeepSeek直接文生图
最近又发现一条神奇的提示词指令,借助Markdown的image标签可以直接在DeepSeek当前窗口得到我们想要的图片。 效果预览我们先看看这条指令的效果:图片这是岳哥在DeepSeek官网直接生成的一辆高铁行驶在海面上生成的图片,可以在DeepSeek上直接预览和下载图片。 提示词指令这条提示词指令具体如下:复制提示词解读这条这里分为3部分第一部分的描述性内容是告诉DeepSeek要生成AI图片,并且指出要如何生成第二部分的url则是具体的AI图片生成的指令,通过替换Prompt的内容来生成第三部分则是希望DeepSeek将AI绘画的提示词以中文的形式显示出来虽然是在DeepSeek当前窗口直接输出,但其实上这里还是借助了第三方AI绘画网站生成图片的功能。
3/11/2025 12:22:00 AM
、平凡世界
网页多模态建模思考
1.综述网页本质上是一种超文本,一般由超文本标记语言来定义(例如HTML)。 HTML是一种基础技术,常与CSS、JavaScript一起被众多网站用于设计网页、网页应用程序以及移动应用程序的用户界面 。 网页浏览器内核通过解释HTML文件,通过视觉引擎将其渲染成可视化网页。
12/26/2024 1:20:53 AM
百度Geek说
豆包支持带有指定文字的图片生成,App已开启测试
近日,字节跳动旗下智能AI助手豆包升级文生图能力,支持一键生成指定文本。 用户可以在生图提示词中加入文本要求,如“一张带有「新年快乐」的图”,即可生成带有指定文字的图片。 目前该功能已经在豆包APP开启测试,即梦也已小范围测试。
12/5/2024 3:49:00 PM
新闻助手
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
比PS更懂你的AI图片编辑工具——MagicQuill(魔法羽毛)来了! 1分钟出图:不用打字、简单勾画几笔就能编辑图片。 还支持直接在iPad上在线编辑!
11/20/2024 2:30:00 PM
量子位
Meta 用 AI 生成北极光图片,遭网友怒喷
社交媒体巨头 Meta 昨日在 Threads 平台上发布了一组使用人工智能生成的北极光图片,并建议用户用 AI 来“假装”看到了这一自然奇观。然而,这一建议遭到了众多网友的批评。AI在线注意到,Meta 的帖子旨在借势周四晚上美国罕见地出现北极光现象,宣传自家的 AI 服务,图片展示了北极光在金门大桥、城市天际线和摩天轮上方的景象。
10/13/2024 9:30:34 AM
远洋
文生图 AI 工具 Midjourney 开放网页版,新用户附赠 25 张免费试用额度
感谢Midjourney 官方账号在 X 平台发布推文,宣布向所有用户开放网页界面,并重新推出免费试用图像生成功能。Midjourney 此前因其文生图 AI 工具被滥用而暂停免费使用,现在重新向用户开放。科技媒体 The Decoder 认为 Midjourney 此举可能是针对最新上线的 Ideogram 2.0 工具。AI在线附上官方宣传视频如下: 用户无需使用 Discord 即可注册网页版并在网页版中生成图片,Midjourney 还准备了一些常见的提示词帮助以及图片示例,用户可以根据浏览其他用户生成的图
8/23/2024 11:34:25 AM
故渊
谷歌发布 Pixel Studio 本地 AI 文生图应用:基于 Imagen 3 模型,2 秒内生成
谷歌公司在今天召开的 Pixel 9 系列手机发布会上,推出名为 Pixel Studio 的全新图像生成应用,并表示将预装在每台 Pixel 9 系列手机上。用户可以在 Pixel Studio 应用中输入提示词,要求其生成图片。谷歌 Pixel Studio 应用采用本地运行生成,基于谷歌自己的 Imagen 3 模型,主要生成艺术风格的图片,而写实风格的图片效果比较差。以生成下面这张小猫为例,生成时间不超过 2 秒。谷歌 Pixel Studio 应用依赖谷歌 Tensor G4 SoC 芯片来生成图片,如果
8/14/2024 2:44:16 AM
故渊
AI在用 | 微软总裁疯狂安利的AI小游戏,虐我千千万万遍
机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。天啊噜,AI 真的成精了。最近,AI 生图真假难辨这事儿,闹得那叫一个沸沸扬扬。(查看详情,请移步:AI在用 | 三步速成AI美女,又被AI一秒打回原形)除了火爆全网的 AI 谷歌小姐姐,社交平台上又冒出了形形色色的 FLUX 生
8/13/2024 6:11:00 PM
机器之能
AI 美女全军覆没:赛博照妖镜下集体变“鬼”,AI 代码拆台 AI 生图
赛博照妖镜下,AI 美女全变鬼。来看它的牙。把图像饱和度拉满,AI 人像的牙齿就会变得非常诡异,边界模糊不清。整体图片的颜色也正常,麦克风部分更是奇怪。对比真实人类照片,则应该是这样的。牙齿是清晰的,图片色块都是均匀一致的。这个工具已经开放,人人都能拿着照片去试试。AI 生成视频中的某一帧,也难逃此大法。不漏牙的照片也会暴露问题。不过 BTW,这个工具出自 Claude 之手。用 AI 破解 AI,奇妙的闭环。有一说一,最近 AI 人像太逼真又引发了不小讨论,比如一组大火的“TED 演讲者视频”,其实没有一个是真人
8/12/2024 12:37:45 PM
汪淼
OpenAI 宣布 DALL-E 3 模型向 ChatGPT 免费用户开放,但每天只能生成两张图片
北京时间今天凌晨,OpenAI 宣布 ChatGPT 免费用户可以每天使用其 DALL-E 3 模型生成图片。AI在线注:DALL-E 3 于去年 9 月推出,起初只面向 ChatGPT Plus 付费订阅用户提供。用户可以直接在 ChatGPT 的输入框中键入生成图片相关指令,但经过实测,这项功能每天只能免费生成两张图片,否则 ChatGPT 会提示“您已达到图片创建上限,升级至 ChatGPT Plus 或于明天 XX:XX 后重试”。▲ AI在线实测生成的图片,下同今年 4 月,OpenAI 宣布 DALL-
8/9/2024 7:08:27 AM
清源
亚马逊文生图 AI 模型 Titan Image Generator 升至 V2 版:可修改 / 编辑细节
亚马逊 AWS 于 8 月 6 日发布博文,宣布文生图 AI 模型 Titan Image Generator 正升级到 V2 版本,该 AI 模型主要生成专业品质的营销图片。Titan Image Generator 并非调用库存图片或网络上的内容,而是基于亚马逊公司自己的内容训练出来的,因此可以使用徽标、图像和产品来训练该工具。AI在线从报道中获悉,V2 升级版主要改进是在生成图片之后,支持用户进一步细化,例修改和编辑特定区域等。AWS 云首席开发者倡导者 Channy Yun 说,亚马逊升级版图片生成器支持用
8/8/2024 1:26:51 PM
故渊
在线设计平台 Canva 可画发布一站式 AI 创作套件“魔力工作室”:支持生成花字、转场动画
感谢在 8 月 6 日的“Canva Connect 连接你我,可画未来”主题活动中,在线视觉传播和协作平台 Canva 可画宣布,一站式 AI 创作套件“魔力工作室”在中国正式上线。该套件号称“人人可用的一站式 AI 创作套件”,功能包括基于 AIGC 的文案生成、图片生成、花字特效生成、图片编辑、转场动画设计生成等。用户仅需输入简单的文字描述,即可快速生成图片插画、花字特效和演示文稿等等。此外,该套件内置“魔力橡皮擦”“魔力抓取”,用户可去除图片中的指定元素或提取、移动图片主体。官网显示,智能抓取、魔力特效、魔
8/7/2024 11:39:58 AM
清源
你能分辨 AI 生成的图片和真实照片吗?微软总裁挑战你的眼力
微软副董事长兼总裁布拉德・史密斯推出了一项趣味测试,挑战人们辨别 AI 生成图像和真实照片的能力。他在名为“真或假”网站上线了该测试,每个测试包含 15 张图片,玩家需要判断图片是 AI 生成的还是真实拍摄的。测试中的图片每次都会随机更换,因此玩家可以反复挑战,提高鉴别能力。虽然最初的几道题相对简单,但随着测试的进行,难度逐渐增加。尽管有些图片一眼就能看出真假,但 AI 生成图像的逼真度已经达到令人惊讶的水平。同时,现实世界中也存在许多奇特的场景,足以迷惑人们。经过多次尝试,笔者发现测试难度逐渐增加,前十题相对简单
8/6/2024 2:20:18 PM
远洋
特朗普遇刺照,用一张2100元?! 文章标题、配图,AI免费给你来一打
机器之能报道编辑:Sia大模型替代编辑小助理,比萝卜快跑替代司机,靠谱得多。据说,自媒体使用特朗普遇刺照片作为配图,一张付费 2100 元!随便下一张图片给文章配图的日子,一去不复返咯。不过,创作者们的麻烦并未到此为止。写完一篇公众号文章,接下来的十几分钟最让人抓耳挠腮:标题铺位,黄金地段,寸土寸金。除了突出内容亮点,还要确保标题足够吸引人点开看,这可比写文章难多了!啥?酒香不怕巷子深?在红海的公众号圈子里,这条行不通。也别灰心!磨合一段时间,我们发现,大模型在解决这两个日常挑战上,还挺管用。-1-最短时间起一个合
7/17/2024 3:20:00 PM
机器之能
AI 在用 | 用了AI做的表情包,我的班味终于消掉了
机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。年轻人不能失去表情包,就像西方不能失去耶路撒冷。在这个「提笔忘字、张嘴词穷」的年代,表情包成了我们交流的「暗号」。于是,我们四处搜刮搞笑表情包,一有新库存,就忍不住拉出来遛遛。今天咱们就来挑战,用 AI 制作动态表情包,让你感受一
6/5/2024 5:35:00 PM
机器之能
AI 在用 | 花半小时,你也能主演《龙猫》
机器之能报道编辑:Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。把自己变成一个动漫演员,很难吗?就像这样:视频链接: lowfi boy:)视频链接:::视频链接::视频链接: AIGC 工具,再花上半小时,你能成为任何动漫世界的主角。过程有多复杂?和炒一盘西红柿炒鸡蛋差不多:)先
5/31/2024 10:44:00 AM
机器之能
AI生图、扩图、去水印……全免费!「Sora 平替」Viva 玩了把大的
机器之能报道编辑:山茶花通通免费!AI功能「大杂烩」Viva,抢了美图秀秀的饭碗。话接上回。(查看详情请移步:「Sora 平替」来了!一键生成 5 秒视频,还免费,我们实测:很顶!)国内的美图秀秀有 AI 视觉设计「大杂烩」之称,只要是市面上比较火的图片处理功能,都能在美图秀秀上找到身影。而 Viva 堪称国外版「美图秀秀」,除了视频生成功能外,还有文生图、图生文、智能抠图、AI 扩图等,而且是把免费进行到底!文生图:Midjourney 被「偷家」Viva 野心不小,既想和 Sora 一较高下,又要抢 Midjo
5/23/2024 6:48:00 PM
机器之能
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
韩国初创公司 RLWRLD 获 1480 万美元融资,致力于机器人基础模型开发
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
AI视频
模态
人形机器人
驾驶
xAI
文本
搜索
字节跳动
大语言模型
Copilot
Claude
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练