应用

神秘GPT模型引爆社区,GPT-4.5、GPT-5谣言满天飞,奥特曼在线围观

这场等待「GPT-5」的游戏啥时候才能结束?GPT-5 啥时候来?估计是 AI 领域最关心的问题之一了。是像 Sora 一样毫无预兆的发布,还是我们可以从边角料的爆料中得知一点点信息,大家对未来将要发布的这一模型充满了期待。但奥特曼在一次访谈中表示,OpenAI 现在采用迭代部署的方式进行研发,而不是秘密进行直到完成 GPT-5 才公布,他们的目标不是给世界带来震惊性的更新,恰恰相反,OpenAI 希望自己研发的成果不会给人一种跳跃式的发展趋势,如果大家有那种感觉的话,OpenAI 会更加快速迭代地发布他们的产品,

具身智能最佳形态是什么?它是通往AGI必由之路?八位头部玩家、学者现身说法

ChatGPT-4 被认为是人工智能技术发展的重要节点,语言大模型之后的多模态大模型初步显现了世界模型的影子。大模型最终将通过硬件与物理世界产生交互。人工智能的应用实现从数字世界到物理世界的扩展,具身智能是非常关键的技术方向。那么,具身智能应该依循何种发展路径,当前的技术水平处在什么阶段,发展过程中遇到了哪些瓶颈和难题,在应用场景上如何切入,离未来规模应用还有多远,身处在技术变革浪潮中的我们又该何去何从?4 月 27 日,北京智源人工智能研究院院长王仲远在中关村论坛年会未来「人工智能先锋论坛」上,和七位具身智能领域

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

前段时间,微软搞了个乌龙:隆重地开源了 WizardLM-2,又在不久后撤回得干干净净。据现在可以查到的 WizardLM-2 发布信息,这是一个「真正媲美 GPT-4」的开源大模型,在复杂聊天、多语言、推理和代理方面的性能得到了提高。该系列包括三个模型:WizardLM-2 8x22B、WizardLM-2 70B 和 WizardLM-2 7B。其中:WizardLM-2 8x22B 是最先进的模型,也是对高度复杂任务进行内部评估后得出的最佳开源 LLM。WizardLM-2 70B 具备顶级推理能力,是同等规

Python团队还没解散完,谷歌又对Flutter、Dart动手了

谷歌在开发者大会前,对多个关键技术团队进行裁员。上周,「谷歌解雇 Python 基础团队」的消息引发热议。谷歌 Python 指导委员会成员 Thomas Wouters 的一条动态让所有人感到惊讶:「当与你直接共事的每个人,包括你的主管,都被裁员 —— 哦,是职位被削减,而你被要求安排他们的替代者入职,这些人被告知在不同的国家担任同样的职位,但他们并不为此感到高兴,这是很艰难的一天。」就在人们讨论谷歌裁撤 Python 团队的原因时,谷歌再度传来「解雇 Flutter、Dart、Python 等关键团队的员工」的

清华出品!AI视频神器 Vidu 横空出世,效果直追 Sora!

大家好,这里是和你们一起探索 AI 的花生~ 这两天一款名为 Vidu 的视频生成模型火爆网络,它由北京生数科技与清华大学联合发布,能直接通过文本生成 16 秒 1080P 的高清视频,且视频质量与 OpenAI Sora 不相上下, 因此被认为是 Sora 目前最有力的竞争对手。 Vidu 内测名额申请: shengshu.feishu.cn当视频在手机上无法加载,可前往PC查看。相关推荐:Vidu 是中国首个具备长时长、高一致性及高动态性的视频大模型,从官方的演示视频中也可以切实感受到其强大的生成能力。对于 “

超全合集!2024 年 UX/UI 设计师都必须尝试的 21 款 AI 工具

编者按:设计师对于 AI 工具的需求其实还是蛮旺盛的,针对不同的设计环节、不同需求的细分 AI 工具往往能够很好地满足不同需求点。对于设计师来说,要想在这个崇尚速度、效率和创新的行业中脱颖而出,用好 AI 已不再是一种选择,而是一种必然地趋势。这篇文章来自设计师 Yulia Lápicus,总结梳理了 21 款目前主流、好用、专业的 AI 工具。以下是正文: 在当今数字化为主的生活环境中,设计任务变得越来越复杂和繁重。在设计工作流程中集成 AI ,可以帮助我们更好应对这些挑战。它使设计师能够快速测试、迭代创意,相比

掌握这3个技巧,学会用Midjourney绘制连环漫画

前言 相信大家在使用 Midjourney(以下简称 MJ)在生成角色人物时,都遇到过相同的难题:很难保持角色的一致性!当然 MJ 也在努力优化这个问题,例如,近期推出的“风格一致性”功能,即 cref,官方宣称是一个可以解决角色一致性的方案。但是经过测评后发现,此功能仍需完善,比如无法独立控制姿态或发型、技术精度有限、发挥不稳定等。因此,我们通过在实际工作中不断尝试和对比,发现了 3 个控制角色一致性的隐藏技巧!接下来,我们将通过分享一个连环漫画实战项目的制作流程,来揭秘如何生成角色与画风高度一致的技巧,希望可以

OpenAI 增强内容合作,签署使用英国《金融时报》资料库训练 AI 模型

感谢OpenAI 近日和英国新闻媒体《金融时报》签署协议,利用后者的资料库内容训练人工智能模型。OpenAI 此前已经与美联社等四家媒体达成了类似协议。IT之家从双方协议中获悉,英国《金融时报》将其内容授权给 OpenAI,帮助后者开发生成式人工智能技术,可以创建接近于人类创作的文本、图像和代码等。根据双方的合作内容,ChatGPT 用户能够看到精选的摘要、引述以及《金融时报》新闻的链接,此外可以就某条新闻展开聊天。英国《金融时报》已成为 ChatGPT Enterprise 的客户,为所有《金融时报》员工购买访问

OpenAI 向 ChatGPT Plus 用户开放“记忆”功能

感谢OpenAI 公司今天宣布,面向所有 ChatGPT Plus 用户开放“记忆”(Memory)功能,可以让 ChatGPT 记住用户在聊天中讨论过的事情,并避免重复信息。用户可以控制 ChatGPT 需要记住的内容,可向 ChatGPT 发出明确指令使其记住指定内容,同时也可以询问 ChatGPT“你记住了什么”。用户也可以完全关闭该功能,或者通过对话、设置来让 ChatGPT“忘记”此前要求记住的内容。ChatGPT 的记忆能力将会随着使用次数的增加而逐渐提升,OpenAI 总结了如下场景,IT之家附上示例

别再说国产大模型技术突破要靠 Llama 3 开源了

Meta 表示,Llama 3 已经在多种行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型。 根据Meta的测试结果,Llama 3 8B模型在语言(MMLU)、知识(GPQA)、编程(HumanEval)等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct,70B 模型则超越了名声在外的闭源模型 Claude 3的中间版本 Sonnet,和谷歌的 Gemini Pro 1.5 相比三胜两负。 Meta还透露,Llama 3的 400B 模型仍在训练中。

AI在用|视频风格,一键七变,用Pika玩出新高度

机器之能报道编辑:山茶花以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。   我们也欢迎读者投稿亲自实践的创新型用例。Pika 又又又上新了!近日,Pika 在 X 上宣布,新推出「风格生成」功能,并向所有人开放。在其宣传视频中,用户可以在不改变画面的情况下随意切换相框中小狗的风格,黑白风、动漫风、自然风等均可一键实现。网友评价称「Pika 的

GTC大会开完一个月,英伟达的Omniverse Cloud API正在快速落地

今年的 GTC 大会上,英伟达宣布利用生成式 AI 等技术构建了业内领先的元宇宙、工业数字孪生、机器人训练软件体系。新技术基于英伟达实时模拟和协作平台 Omniverse。随着 Omniverse Cloud API 的推出,模拟现实环境的工具已经扩大了覆盖范围,现在已经被很多公司用于创建工业数字孪生应用程序和工作流程。在 3 月,共有五个新的 Omniverse Cloud 应用程序编程接口被引入,使开发人员能够轻松地将核心 Omniverse 技术直接集成到数字孪生的现有设计和自动化软件应用程序中,或者用于测试

“不服请自删照片”:摄影平台 EyeEm 声称将默认使用摄影师作品训练 AI 模型

摄影分享平台 EyeEm 近日变更其服务条款,宣布将默认使用平台上的照片来训练 AI 模型,如果用户不同意条款,需要自行删除自己的所有作品。据介绍,EyeEm 摄影平台创立于 2011 年,该平台在 2015 年上线 EyeEm Market 照片交易市场,允许用户出售自己的摄影作品,在 2021 年以接近 4000 万美元的价格被瑞士社交网站 Talenthouse 收购,不过自 2022 年夏天开始,EyeEm 平台上的摄影师开始对外抱怨没有收到应有的报酬,该平台也在 2023 年 4 月申请破产,而在 202

老黄最新采访出炉!自述 61 年坚持成就了英伟达,AI 革命点燃全世界

【新智元导读】过去一年的时间,英伟达市值突破 2 万亿美元,一举成为 21 世纪的 AI 巨头。在老黄的最新采访中,向我们展示了即将到来的工业革命是怎样的。全球进入 2 万亿美元俱乐部的公司,仅有 4 家 —— 微软、苹果、谷歌,以及英伟达。在过去一年中,位于加利福尼亚的计算机芯片制造商英伟达,市值从 1 万亿,飙升到 2 万亿美元。这得益于大模型掀起的 AI 狂潮,急剧放大了全世界对算力的需求。从 Grace 架构,到全新的 Blackwell,英伟达的创新为生成式 AI 和加速计算,带来了突破性的进步。那么,这

人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora

在 4 月 27 日召开的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎隆重发布全新的多模态大模型 Awaker 1.0,向 AGI 迈出至关重要的一步。相对于智子引擎前代的 ChatImg 序列模型,Awaker 1.0 采用全新的 MOE 架构并具备自主更新能力,是业界首个实现 “真正” 自主更新的多模态大模型。在视觉生成方面,Awaker 1.0 采用完全自研的视频生成底座 VDT,在写真视频生成上取得好于 Sora 的效果,打破大模型 “最后一公里” 落地难的困境。Awaker 1.0 是一个将视

首届AI方程式大赛,8圈开了一个小时

好消息:大多数 AI 赛车都完赛了。在阿布扎比的 F1 赛道上,8 辆赛车使用相同的轮胎,相同的发动机,完全一样的车身,唯一不同之处就是自动驾驶代码。全球第一场自动驾驶大奖赛开战了。上周日,阿布扎比自动驾驶赛车联赛 A2RL 的第一场比赛在 Yas Marina 阿布扎比一级方程式赛道上举行;这场比赛汇集了来自世界各地的技术娴熟的科学家、工程师和开发者团队,并将尖端技术融入赛车中,所有这些都是为了通过极限运动重塑移动性的未来。智能驾驶技术在量产汽车上一直处于正在发展,以及「即将覆盖城区」的阶段。因为 AI 技术的快

Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果

「不怕 AI 消灭人类,就怕用 AI 的人太聪明。」今年 2 月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片段,掀起了 AI 生成视频浪潮。目前,Sora 仍未进行公测,只有一些视觉艺术家、设计师、电影制作人等获得了 Sora 的访问权限。他们发布了一些 Sora 生成的视频短片,其连贯、逼真的生成效果令人惊艳。最近,被誉为「朋克摇滚皮克斯」的加拿大多媒体制作公司 Shy Kids 发布了一段借助 Sora 制作的视频短片《Air Head》,在社交媒体上迅速引起广泛关注。据悉,这

因生成错误信息,ChatGPT 在奥地利遭投诉

总部位于维也纳的隐私权倡导组织 NOYB (None of Your Business) 周一表示,将针对聊天机器人 ChatGPT 在奥地利提起投诉。他们指控这款由 OpenAI 开发的人工智能工具会“编造错误信息”,而 OpenAI 公司也无法纠正这些错误答案。NOYB 组织表示,目前没有办法保证 ChatGPT 提供的信息准确无误。“ChatGPT 一直在编造信息,OpenAI 甚至都无法阻止它,” 他们在声明中写道。该组织称,OpenAI 公司已经公开承认它们无法纠正其生成式 AI 工具产生的不准确信息,并