ChatGPT 新图像生成功能火爆,OpenAI 因算力不足限制访问速度

近日,OpenAI 在其 ChatGPT 平台上推出了全新升级的图像生成功能,吸引了大量用户的关注与使用。 然而,这一火爆的功能也让 OpenAI 面临了一些新挑战。 OpenAI 的创始人 Sam Altman 透露,由于需求激增,公司的 GPU 算力几乎不堪重负,他形象地表示 “GPU 冒烟了”,这迫使他们在一定程度上对图像生成功能引入速率限制。

近日,OpenAI 在其 ChatGPT 平台上推出了全新升级的图像生成功能,吸引了大量用户的关注与使用。然而,这一火爆的功能也让 OpenAI 面临了一些新挑战。OpenAI 的创始人 Sam Altman 透露,由于需求激增,公司的 GPU 算力几乎不堪重负,他形象地表示 “GPU 冒烟了”,这迫使他们在一定程度上对图像生成功能引入速率限制。

新功能 “Images in ChatGPT” 是基于 GPT-4o 模型开发的,用户可以通过简单的自然语言指令生成和编辑图片,并进行多轮迭代优化。这一功能的推出,标志着 ChatGPT 在文本、图像、代码等多模态能力上的深入整合,成为了一个真正的全能智能体。用户只需轻松输入指令,就能将普通的照片转化为吉卜力风格的艺术作品,这种便利性迅速引发了广泛的热潮。

image.png

不过,随着用户数量的激增,OpenAI 意识到原定的向所有用户推广这一功能的计划需要延后,特别是对免费用户的开放时间。Altman 表示,尽管他们拥有强大的 GPU 资源,但处理如此庞大的请求量还是显得力不从心。

图像生成的过程要求 AI 逐像素计算,这需要大量的计算资源。为了解决 GPU 算力的瓶颈,OpenAI 正在探索两条主要路径:一是提升 GPU 的性能,二是通过算法优化提高 AI 模型的效率。这其中,后者希望通过改进算法,使得相同的计算资源能够处理更多任务,从而更高效地使用现有资源。

值得注意的是,OpenAI 背后的 GPU 储备是业内顶尖的,微软作为主要投资者,为 OpenAI 提供了强有力的支持,购入了大量的英伟达 Hopper 芯片,使其在算力方面占据了竞争优势。尽管如此,AI 应用对算力的需求依然巨大,行业对技术迭代和资源利用效率的呼声也在不断增强。

OpenAI 在多模态技术的发展中,正面临着资源与需求之间的平衡挑战。

相关资讯

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场

据国外媒体报道,知情人士透露微软工程师团队正加速部署服务器资源,为OpenAI即将推出的GPT-4.5和GPT-5模型做技术储备。 尽管OpenAI CEO山姆·阿尔特曼(Sam Altman)近期确认GPT-4.5将在几周内亮相,但微软内部预计最快下周即可完成新模型的托管部署,这一动作暗示着生成式AI领域的技术竞赛已进入冲刺阶段。 代号为Orion的GPT-4.5被视作当前技术路线的“收官之作”。

研究显示,AI 用户可与双人团队媲美,提升工作效率

最近的一项研究显示,使用人工智能(AI)的个人在工作表现上可与传统的双人团队相媲美。 此次研究由776名洁(Procter & Gamble)专家参与,他们在一天的工作坊中为多个业务单位开发产品创意。 研究将参与者分成两组,分别是由一名商业专家和一名技术专家组成的团队,和单独的个人,其中一半的团队和个人都获得了 GPT-4和 GPT-4o 的访问权限。

国内首个!商汤科技发布“日日新5o”,实时多模态流式交互对标GPT-4o

2024 年 7 月 5 日,上海 ——2024 世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)战略合作伙伴商汤科技召开 “大爱无疆・向新力” 人工智能论坛,发布国内首个所见即所得模型 “日日新 5o”,交互体验对标 GPT-4o,实现全新 AI 交互模式。通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,国内首个所见即所得模型 “日日新 5o” 带来一种全新的 AI 交互模式,即实时的流式多模态交互。现场也为大家展示了这种创新交互模式 ——工作人员刚开始仅是和 “日日新 5o” 打个招