生成

特朗普持枪火拼、哈里斯扮作小丑……发布不到一天的Grok 2，摊上大事了！
机器之能报道编辑：杨文Grok 2，你是懂如何背刺自家老板的。Grok 2 刚发布不到一天，就摊上事了。事情是这样的：昨天，马斯克旗下的 xAI 发布新一代大模型 Grok 2，并称已与初创公司 Black Forest Labs 展开合作，试验他们的 FLUX 模型。本来是强强联合的一件好事，但由于 FLUX 模型对于生成的图像没有严格的限制，导致 X 上充斥着大量让人瞠目结舌的图像。例如，扮作…
应用
- 13
- 0
机器之能8月15日
谷歌发布 Pixel Studio 本地 AI 文生图应用：基于 Imagen 3 模型，2 秒内生成
谷歌公司在今天召开的 Pixel 9 系列手机发布会上，推出名为 Pixel Studio 的全新图像生成应用，并表示将预装在每台 Pixel 9 系列手机上。用户可以在 Pixel Studio 应用中输入提示词，要求其生成图片。谷歌 Pixel Studio 应用采用本地运行生成，基于谷歌自己的 Imagen 3 模型，主要生成艺术风格的图片，而写实风格的图片效果比较差。以生成下面这张小猫为例…
应用
- 42
- 0
故渊8月14日
豆包上线音乐生成，用户可一键生成词曲
8月8日，字节跳动旗下智能AI助手豆包上线音乐生成功能。用户在豆包的“音乐生成”中输入主题或自己写的歌词，设定音乐风格、情绪及音色，便能快速生成一首约1分钟的词曲，每个人都能体验音乐创作和表达的乐趣。目前，豆包音乐生成功能提供民谣、嘻哈、R&B等11种音乐风格，其中还涵盖了爵士、雷鬼、电音等相对小众的曲风，用户可选择男声或女声演唱。生成的声音，在吐字清晰度和流畅性上表现很好。同时，为让AI…
应用
- 13
- 0
新闻助手8月13日
号称 Elo 评分“凌驾竞品”，Black Forest Labs 推出文生图 AI 模型 FLUX.1
美国初创公司黑森林实验室（BlackForestLabs）在 8 月 1 日推出了 AI 文生图模型 FLUX.1，该模型据称在“潜在扩散、稳定扩散及对抗性扩散蒸馏”方面较为突出，能够即时根据用户提示词生成各种图像。官方将该模型与其他友商产品进行比拼，结果显示系列模型的 Elo 评分（AI在线注：Elo 评分系统是一种在国际象棋等竞技游戏中广泛使用的评分方法，主要用于计算比赛对手实力等级）“凌驾”…
应用
- 14
- 0
漾仔8月12日
AI 美女全军覆没：赛博照妖镜下集体变“鬼”，AI 代码拆台 AI 生图
赛博照妖镜下，AI 美女全变鬼。来看它的牙。把图像饱和度拉满，AI 人像的牙齿就会变得非常诡异，边界模糊不清。整体图片的颜色也正常，麦克风部分更是奇怪。对比真实人类照片，则应该是这样的。牙齿是清晰的，图片色块都是均匀一致的。这个工具已经开放，人人都能拿着照片去试试。AI 生成视频中的某一帧，也难逃此大法。不漏牙的照片也会暴露问题。不过 BTW，这个工具出自 Claude 之手。用 AI 破解 AI…
应用
- 13
- 0
汪淼8月12日
2024年7月全球AI网站流量排行榜
AI在线发布 2024年7月全球和国内AI网站流量排行榜、全球AI网站增长率排行榜，并联合哥飞的朋友们出海社群发布出海AI网站流量排行榜！
AI榜单
- 6
- 0
admin8月9日
2024年7月国内AI网站流量排行榜
AI在线发布 2024年7月全球和国内AI网站流量排行榜、全球AI网站增长率排行榜，并联合哥飞的朋友们出海社群发布出海AI网站流量排行榜！
AI榜单
- 6
- 0
admin8月9日
2024年7月出海AI网站流量排行榜
AI在线发布 2024年7月全球和国内AI网站流量排行榜、全球AI网站增长率排行榜，并联合哥飞的朋友们出海社群发布出海AI网站流量排行榜！
AI榜单
- 6
- 0
admin8月9日
2024年7月全球AI网站增长排行榜
AI在线发布 2024年7月全球和国内AI网站流量排行榜、全球AI网站增长率排行榜，并联合哥飞的朋友们出海社群发布出海AI网站流量排行榜！
AI榜单
- 4
- 0
admin8月9日
美国 FCC 提议 AI 生成电话语音必须“自报”AI 身份，以打击骚扰、欺诈信息
AI“模仿”人类声音的能力日渐成熟，已经有部分用户开始无法凭借第一反应来判断说话者是人类还是人工智能。当前，AI 生成的语音被越来越多地用在语音通话中，例如广告宣传或推销等领域。据 TechRadar 北京时间今天报道，美国联邦通信委员会（AI在线注：下文简称 FCC）正试图打击一些利用 AI 生成通话语音的不法行为和恶意企图，并提出一项提案旨在加强对消费者的保护，使消费者免受“不受欢迎的”AI …
应用
- 6
- 0
清源8月9日
OpenAI 宣布 DALL-E 3 模型向 ChatGPT 免费用户开放，但每天只能生成两张图片
北京时间今天凌晨，OpenAI 宣布 ChatGPT 免费用户可以每天使用其 DALL-E 3 模型生成图片。AI在线注：DALL-E 3 于去年 9 月推出，起初只面向 ChatGPT Plus 付费订阅用户提供。用户可以直接在 ChatGPT 的输入框中键入生成图片相关指令，但经过实测，这项功能每天只能免费生成两张图片，否则 ChatGPT 会提示“您已达到图片创建上限，升级至 ChatGPT…
应用
- 14
- 0
清源8月9日
字节跳动旗下豆包上线音乐生成功能，用户可一键“撰写”词曲
字节跳动旗下智能 AI 助手豆包今日上线音乐生成功能。用户在豆包的“音乐生成”中输入主题或自己写的歌词，设定音乐风格、情绪及音色，便能快速生成一首约 1 分钟的词曲。目前，豆包音乐生成功能提供民谣、嘻哈、R&B 等 11 种音乐风格，其中还涵盖了爵士、雷鬼、电音等相对小众的曲风，用户可选择男声或女声演唱。生成的声音，在吐字清晰度和流畅性上表现很好。同时，为让 AI 音乐更好贴合普通用户的情…
应用
- 32
- 0
浩渺8月8日
AI在用 | AI制作独居女孩生活Vlog，3天狂揽上万点赞量
机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。视频链接：，独居女孩的生活 Vlog 在小红书上走红。一个插画风格的动画，再配上几句治愈系文案，短短几天就能轻…
基础
- 59
- 0
机器之能8月7日
在线设计平台 Canva 可画发布一站式 AI 创作套件“魔力工作室”：支持生成花字、转场动画
感谢在 8 月 6 日的“Canva Connect 连接你我，可画未来”主题活动中，在线视觉传播和协作平台 Canva 可画宣布，一站式 AI 创作套件“魔力工作室”在中国正式上线。该套件号称“人人可用的一站式 AI 创作套件”，功能包括基于 AIGC 的文案生成、图片生成、花字特效生成、图片编辑、转场动画设计生成等。用户仅需输入简单的文字描述，即可快速生成图片插画、花字特效和演示文稿等等。此外…
应用
- 9
- 0
清源8月7日
腾讯元宝上线深度阅读模式：原生支持最长近 50 万字输入，可提炼论文、生成杜邦分析图等
感谢腾讯元宝宣布，在最新版本的腾讯元宝中，当用户上传论文、财报、研报等专业内容的 URL 链接或文件，除获得文字概括总结外，还可进入深度阅读模式，对长文进行精读。该模式可提供核心内容概览及模块化解析，生成总结性图表，辅助用户快速理解关键信息。据介绍，深度阅读模式可原生支持最长近 50 万字的输入，能够在理解专业内容的基础上，生成图文并茂的内容，不仅可以引用输入内容的原图，还能通过代码绘制高阶的分析…
应用
- 7
- 0
沛霖（实习）8月7日
你能分辨 AI 生成的图片和真实照片吗？微软总裁挑战你的眼力
微软副董事长兼总裁布拉德・史密斯推出了一项趣味测试，挑战人们辨别 AI 生成图像和真实照片的能力。他在名为“真或假”网站上线了该测试，每个测试包含 15 张图片，玩家需要判断图片是 AI 生成的还是真实拍摄的。测试中的图片每次都会随机更换，因此玩家可以反复挑战，提高鉴别能力。虽然最初的几道题相对简单，但随着测试的进行，难度逐渐增加。尽管有些图片一眼就能看出真假，但 AI 生成图像的逼真度已经达到令…
应用
- 45
- 0
远洋8月6日
最强开源文生图模型一夜易主：SD 原班人马打造，要发 SOTA 视频生成模型
感谢AI在线网友刺客的线索投递！最强开源文生图模型一夜易主！昨日晚间，开源文生图模型霸主 Stable Diffusion 原班人马，宣布推出全新的图像生成模型 FLUX.1。FLUX.1 包含专业版、开发者版、快速版三种模型，其中前两款模型击败 SD3-Ultra 等主流模型，较小规模的 FLUX.1 [schnell] 也超越了 Midjourney v6.0、DALL・E 3 等更大的模…
应用
- 20
- 0
汪淼8月2日
Stable Diffusion 原班人马新公司官宣！新模型一夜刷新 AI 绘画格局，已获 3200 万美元融资
刚刚，Stable Diffusion 原班人马官宣创业新公司！3 月宣布从 Stability AI 出走的 Robin Rombach，就是 Stable Diffusion 的两个主要作者之一，和十来个原公司小伙伴，正式宣布了组团创业的消息。新公司名叫 Black Forest Lab，黑森林实验室。一亮相就 kuku 发了一个系列、共 3 款图片生成模型，其中有 2 个开源。而且支持中文输…
应用
- 30
- 0
清源8月2日
一键生成PPT！Kimi ：让「PPT民工」先浪起来
Kimi：一句话，十几秒钟，一份PPT就新鲜出炉了。PPT 这玩意儿，可太招人烦了！开个碰头会，要有 PPT；写个周报，要做 PPT；拉个投资，要展示 PPT；就连控诉出轨，都得发个 PPT。大学更像是学了个 PPT 专业，上课看 PPT，下课做 PPT。或许，37 年前丹尼斯・奥斯汀发明 PPT 时也没想到，有一天 PPT 竟如此泛滥成灾。吗喽们做 PPT 的苦逼经历，说起来都是泪。「一份二十多…
基础
- 52
- 0
机器之能7月31日
Getty 携手英伟达升级 AI 文生图服务：6 秒生成 4 张照片、提示词最多 250 个单词
Getty Images 和英伟达公司昨日（7 月 29 日）发布声明，联合推出安全的商业文生图 AI 模型，能够在 6 秒时间内生成 4 张照片，比以前的模型性能提高了一倍，速度处于行业领先水平。图源：英伟达Getty Images 表示全新文生图 AI 模型部分基于英伟达 Edify 模型架构，该架构隶属于英伟达 Picasso，主要为视觉设计搭建和部署生成式 AI 模型。英伟达 Edify …
应用
- 19
- 0
故渊7月30日
英伟达最新技术分享：手把手教你用 Llama 3.1 合成数据改进模型！附代码
适逢 Llama 3.1 模型刚刚发布，英伟达就发表了一篇技术博客，手把手教你如何好好利用这个强大的开源模型，为领域模型或 RAG 系统的微调生成合成数据。Epoch AI 上个月刚刚发文预言「数据墙」迫近，结果英伟达转头就甩出了 340B 开源巨兽 Nemotron。真实数据稀缺可能不再是问题了，Nemotron 9T token 的预训练预料中，98% 都是合成数据。也许你还对合成数据存在顾虑…
应用
- 16
- 0
清源7月29日
为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下
让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗？不知道 9.11 和 9.9 哪个大，数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点，大模型都只能接受人们的无情嘲笑。嘲笑之后，大家也冷静了下来，开始思考：低级错误背后的本质是什么？大家普遍认为，是 Token 化（Tokenization）的锅。在国内，Tokenizatio…
应用
- 22
- 0
机器之心7月27日
智谱 AI CEO 张鹏谈文生视频：当前可用来做影视辅助工作，若要改变电影制作仍需距离
据新浪科技报道，智谱 CEO 张鹏今日接受采访，谈到了基于生成式 AI 的文生视频技术对影视行业的冲击等话题。他表示，从 OpenAI 的 Sora 出现之后，有关话题就一直在讨论。在国外，这件事已经引起很大影响，包括好莱坞罢工等。张鹏透露，自己有一次在北京电影学院与教师一同讨论此事，众人得出了一致的看法：从技术发展角度来看，大家都认为 AI 的发展“是很好的事情”，也是“很重要的方向”，对影视行…
应用
- 7
- 0
清源7月26日
智谱 AI 发布视频生成工具“清影”：30 秒快速生成，免费开放体验
感谢智谱 AI 今日宣布，对视频生成模型进行全新升级，并正式推出新一代产品 ——CogVideoX。CogVideoX 模型目前已在智谱清言的 PC 端、移动应用端以及小程序端正式上线。所有 C 端用户均可通过智谱清言的 AI 视频生成功能「清影」（Ying），免费体验 AI 文本生成视频和图像生成视频的服务。据介绍，CogVideoX 的核心技术特点如下：针对内容连贯性问题，智谱 AI 自主研发…
应用
- 43
- 0
汪淼7月26日