资讯列表

YouTube 新规上路:上传视频需标注是否为 AI 制作,包括合成配音 / 换脸等

感谢YouTube 日前宣布,即日起任何人在上传、发布视频时,都需要标注“篡改或合成”的逼真内容,包括生成式 AI。YouTube 将“逼真内容”定义为“任何观众容易误认为是真实的人事物或地点”的内容。若视频创作者使用真人声音的合成版本来为视频配音,或发布“AI 换脸”主题的视频,就需要附上标签。此举的本质目的是防止 AI 生成内容可能导致的虚假信息传播,而非反对创作者通过 AI 制作内容。IT之家注:美颜滤镜、背景模糊等特效以及动画等不属于此次涉及的 AI 制作内容的范畴。官方表示,创作者必须披露存在以下情况的内

荣耀发布Magic6至臻、AIPC笔记本:全新AI战略引领行业创新

3 月 18 日晚,荣耀在春季旗舰新品发布会上宣布 AI 使能的全场景战略,并发布了一系列新产品,包括 Magic6 系列新成员荣耀 Magic6 至臻版、荣耀 Magic6 RSR 保时捷设计、AI PC 笔记本等产品。其中,作为荣耀 Magic 系列顶级旗舰的荣耀 Magic6 至臻版凭借对科技边界的再次突破,让旗舰手机的技术实力再上新台阶,实现了至臻的影像、屏幕、续航、通信、性能和 AI 体验,为追求极致创新与卓越品质的消费者,提供了更高端的产品选择。秉承双轮驱动的产品开发理念,荣耀坚持以领先科技提升用户体验

OpenAI CEO 阿尔特曼:GPT-4“有点糟糕”,今年将推出新模型

OpenAI 首席执行官萨姆・阿尔特曼 (Sam Altman) 在周一发布的与列克斯・弗里德曼 (Lex Fridman) 的访谈中表示,他们公司的人工智能模型 GPT-4 其实“有点糟糕(kinda sucks)”,阿尔特曼更期待即将到来的 GPT-5 能够真正配得上大家的期待。“我认为它有点糟糕,” 当被问及 GPT-4 及其最令人印象深刻的能力时,阿尔特曼说道,“展望未来几年,我们应该意识到我们现在拥有的工具将来看来会非常落后,这正是鞭策我们不断进步、创造更美好的未来的动力。”“别误会,我既不想贬低 GPT

Stability AI 开源上新:3D 生成引入视频扩散模型,质量一致性 up,4090 可玩

Stable Diffusion 背后公司 Stability AI 又上新了。这次带来的是图生 3D 方面的新进展:基于 Stable Video Diffusion 的 Stable Video 3D(SV3D),只用一张图片就能生成高质量 3D 网格。Stable Video Diffusion(SVD)是 Stability AI 此前推出的高分辨率视频生成模型。也就是说,此番登场的 SV3D 首次将视频扩散模型应用到了 3D 生成领域。官方表示,基于此,SV3D 大大提高了 3D 生成的质量和视图一致性。

英伟达进军人形机器人领域,推出 Project GR00T 项目

感谢英伟达 CEO 黄仁勋表示:“为通用人形机器人构建基础模型是当今人工智能领域最令人兴奋的难题之一。” 人形机器人是当下机器人领域最火热的话题之一,一方面吸引了大量风险投资,另一方面也引发了巨大的质疑。英伟达自然不会错过这块蛋糕。作为人工智能领域当之无愧的硬件巨头,英伟达一直通过 Isaac 和 Jetson 等项目推动机器人创新。在今日举办的年度 GTC 开发者大会上,英伟达宣布通过 Project GR00T(Generalist Robot 00 Technology)项目正式进军人形机器人领域。 英伟达将

英伟达最新AI超级算力Blackwell GPU平台即将登陆亚马逊云科技

今天凌晨,英伟达在 GTC 大会上推出了最新一代 GPU 架构 Blackwell 及整套系统。在 Keynote 上,黄仁勋表示,已有多家科技公司和传统企业正在引入新一代产品。在发布活动后,亚马逊云科技宣布将提供基于英伟达 Grace Blackwell GPU 的 Amazon EC2 实例和 英伟达 DGX Cloud,以提高在数万亿参数 LLM 上构建和运行推理的性能。亚马逊云科技表示,英伟达的超强算力芯片系统与亚马逊云科技强大的 Elastic Fabric Adapte (EFA) 网络连接能力、高级虚

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

编辑 | X通道之间的正交性在光复用中扮演着关键的角色。它确保了不同通道之间的信号不会相互干扰,从而实现了高效的数据传输。因此,光复用系统可以同时传输多个通道的数据,提高了光纤的利用率。然而,它不可避免地施加了复用容量的上限。在此,广东工业大学通感融合光子技术教育部重点实验室开发一种基于深度神经网络的多模光纤(MMF)上的非正交光复用,称为散斑光场检索网络(Speckle light field retrieval network,SLRnet),它可以学习包含信息编码的多个非正交输入光场与其对应的单强度输出之间的

英伟达 GTC 大会不仅有 AI 芯片,还有 AI for Science

编辑 | 萝卜皮北京时间 2024 年 3 月 18 日上午,NVIDIA  在 GTC 大会的媒体吹风会上透露,NVIDIA 有众多 AI for Scinece 领域的战略内容在布局,包括健康医疗、生命科学、物理学、地球科学等多个 AI 交叉领域。系统的集成与合作全球云服务提供商(CSPs),如 AWS 和 Microsoft Azure,正在整合 Nvidia 的 Nims(神经建模系统)和Nvidia Healthcare 相关的微服务到自家平台,提供诸如医疗基因组学、医疗成像等高级健康数据分析服务。例如,

阿里大模型产品“通义听悟”升级:超长视频自由问,还会做思维导图

感谢今日阿里大模型产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。通义听悟接入通义千问大模型,融合了十多项 AI 功能,包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT 提取等,并支持标重点、记笔记。通义听悟本次升级上新了六大功能点,其中最重磅的是音视频问答助手“小悟”,关键信息直接“问”出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问

英伟达推出新一代 X800 系列网络交换机,支持 800Gb / s 超高端到端吞吐量

在今天的 GTC 开发者大会上,英伟达推出了新一代的 X800 网络交换机平台。这些平台在业界率先实现 800Gb / s 端到端吞吐量,可进一步突破人工智能和计算工作负载的网络性能限制。具体而言,X800 系列包括适用于 InfiniBand 的 Quantum-X800 和适用于标准以太网的 Spectrum-X800 两大平台。▲ 英伟达 X800 系列网络交换平台。左侧为 Spectrum-X800 平台Quantum-X800 平台专为人工智能基础设施提供最高性能设计,其包括英伟达 Quantum Q34

美国 FTC 已就 Reddit 向 AI 公司分享用户生成内容发起非公开调查

据 Reddit 证券文件披露,美国联邦贸易委员会(FTC)正就该社交平台将内容向 AI 公司授权一事进行非公开调查。据外媒 Axios 透露,还有其他公司也收到了 FTC 的调查信函。Reddit 于上月申请 IPO,以每股 31~34 亿美元的价格募集最多 7.48 亿美元,总估值接近 65 亿美元(IT之家备注:当前约 468 亿元人民币)。图源 Pexels这一社交平台表示,FTC 此次调查的重点是 Reddit 将用户生成的内容作为 AI 训练素材向第三方出售、许可与共享的行为。FTC 未来将要求这家社交

联想与NVIDIA合作推出混合AI解决方案,提供量身定制的生成式AI

2024 年 3 月 18 日 – 今天,全球AI盛会GTC(GPU Technology Conference)2024正式开幕,联想集团与NVIDIA宣布合作推出全新混合人工智能解决方案,帮助企业和云提供商获得在人工智能时代成功所需的关键的加速计算能力,将人工智能从概念变为现实。这些混合解决方案是双方共同工程合作的结晶,旨在用户最需要的地点和时间里,无论是口袋还是云端,高效地将人工智能带入客户数据中。此举将推进联想集团AI for All的愿景,并为下一代大规模生成式人工智能的创新架构迅速进入市场提供了支持。联

完美世界端游《诛仙世界》接入英伟达 Audio2Face 技术,可根据音频生成角色表情

感谢完美世界游戏官宣,完美世界游戏旗下仙侠 MMORPG 端游 《诛仙世界》 接入了英伟达 Audio2Face 技术(生成式 AI 将音频转为动画技术)。《诛仙世界》是完美世界游戏旗下首款由虚幻引擎 5 打造的仙侠 MMORPG 端游,本次展示的游戏画面片段,实装了英伟达 Audio2Face 技术,借助生成式 AI 将音频转为面部动画。完美世界游戏官方表示,英伟达 Audio2Face 技术“提高了开发效率,呈现了更为真实的智能化游戏体验”,该技术特性如下:具有接入难度低且高自动化的特点,提高开发效率;支持多种

开发者再分享 OpenAI Sora 生成的短视频:树叶大象、彩虹瀑布等

OpenAI 今年 2 月推出 Sora 模型之后,迅速成为 AI 圈内头条,能够基于用户的一句话,生成最长 1 分钟的视频,效果接近实拍。OpenAI 目前并未向公众发布 Sora,不过开发者 @LinusEkenstam 近日发布系列推文,展示了由 Sora 生成的 9 段新视频,包括被树叶覆盖的大象、蜜蜂视角飞跃花丛,以及彩虹颜色的瀑布等等。提示词:“An elephant made of leaves running in the jungle”(树叶做的大象在丛林中奔跑) 提示词:“An adorable

英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍

「这才是我理想中的 GPU。」—— 黄仁勋。「这不是演唱会。你们是来参加开发者大会的!」老黄出场时,现场爆发出了巨大的欢呼声。今天凌晨四点,加州圣何塞,全球市值第三大公司英伟达一年一度的 GTC 大会开始了。今年的 GTC 大会伴随着生成式 AI 技术爆发,以及英伟达市值的暴涨。相对的是,算力市场也在升温,硬件和软件方面的竞争都在加剧。而英伟达带来的产品,再次将 AI 芯片的标杆推向了难以想象的高度。「通用计算已经失去动力,现在我们需要更大的模型,我们需要更大的 GPU,更需要将 GPU 堆叠在一起。」黄仁勋说道。

一口气读完甄嬛传剧本、大部头医书:月之暗面200万字上下文Kimi开启内测

半年时间,月之暗面把 AI 模型支持的上下文长度提升了一个数量级,实现了 200 万字上下文的「无损压缩」。一个能读 200 万字的 AI 助手是什么概念?这意味着,它可以一口气读完整个《甄嬛传》剧本,然后和你讨论剧情。或者一口气读完一本厚厚的中医诊疗手册,给你提出诊疗建议。对于人类来说,成为某个领域的专家可能需要 10000 个小时的学习,但对于这个 AI 来说,只需要 10 分钟就够了。将甄嬛传全集几十万字的剧本传给 AI 助手,然后提问剧本中有哪些细节表明甄嬛的孩子是果郡王的。它能在不同时间段、各个场景的故事

支持百亿参数大模型、卢伟冰现场官宣小米首发,高通骁龙8s Gen3发布

高通又往中高端手机市场扔下一颗「重磅炸弹」。高通最强手机芯片骁龙 8 Gen3 迎来了一款与它同源的「旗舰级」产品。3 月 18 日,高通正式推出了第三代骁龙 8s 移动平台(骁龙 8s Gen3),凭借旗舰级的 CPU、GPU 和 AI 性能,全方位支持了强大的终端侧生成式 AI 功能、始终感知的 ISP、超沉浸的移动游戏体验、突破性连接能力和无损高清音频。当然,大家最为关心的恐怕是哪家手机厂商会率先搭载这款旗舰芯片。在活动现场,小米集团总裁、小米品牌总经理卢伟冰官宣小米 Civi 4 Pro 将全球首发骁龙 8

ICLR 2024 | 连续学习不怕丢西瓜捡芝麻,神经形态方法保护旧知识

以脉冲神经网络(SNN)为代表的脑启发神经形态计算(neuromorphic computing)由于计算上的节能性质在最近几年受到了越来越多的关注 [1]。受启发于人脑中的生物神经元,神经形态计算通过模拟并行的存内计算、基于脉冲信号的事件驱动计算等生物特性,能够在不同于冯诺依曼架构的神经形态芯片上以低功耗实现神经网络计算。然而,神经网络模型在持续学习新任务时通常存在对旧任务的灾难性遗忘的问题,这和人脑通过终生的连续学习(continual learning)来不断积累知识非常不同。如何能够通过神经形态的计算形式解