资讯列表

最强的GPT-4V都考不过?基于大学考试的测试基准MMMU诞生了

目前最好的大型多模态模型 GPT-4V 与大学生谁更强?我们还不知道,但近日一个新的基准数据集 MMMU 以及基于其的基准测试或许能给我们提供一点线索,如下排行榜所示。看起来,GPT-4V 在一些科目上已经强过挂科的大学生了。当然这个数据集的创造目的并不为了击败大学生,而是为了提供一个兼具深度与广度的多模态 AI 测试基准,助力人工智能系统的开发,尤其是通用人工智能(Artificial General Intelligence,AGI)。随着大型语言模型(LLM)快速发展,人们对 AGI 这一颇具争议的概念进行了

昆仑万维发布「天工 SkyAgents」平台,零代码打造AI智能体

12月1日,昆仑万维正式发布「天工SkyAgents」平台,助力大模型走入千家万户。「天工SkyAgents」是国内领先的AI Agents开发平台,基于昆仑万维「天工大模型」打造,具备从感知到决策,从决策到执行的自主学习和独立思考能力。用户可以通过自然语言构建自己的单个或多个“私人助理”。并且将不同任务模块化,通过操作系统模块的方式,实现执行包括问题预设、指定回复、知识库创建与检索、意图识别、文本提取、http请求等任务。在「天工SkyAgents」平台上,用户可以通过自然语言和简单操作,无需代码编程,即可在几分

用 AI 生成的图像享有著作权吗?法院判决结果出来了!

大家好,这里是和你们一起去探索 AI 绘画的花生~ 自 AI 绘画出现以来,关于其生成图片版权问题的争论就一直存在。最近,国内首个 AI 文生图著作权案的审判结果出来了,法院判决原告享有对涉案 AI 图片的著作权,这对之后 AI 绘画作品著作权的裁量和认定具有重要意义。 参与讨论: 案件的起源要追溯到今年 2 月份,原告李某某用 AI 绘画工具 Stable Diffusion WebUI 生成了一张人物图片,并将该图片以“春风送来了温柔”为名发布在自己的小红书账号上,打上了 AI 相关标签,图片也有平台自动附上的

Altman正式重掌CEO大权,微软获董事会观察员席位,辞任独董罕见发文回应

机器之能报道编辑:吴昕OpenAI 今天在官网正式宣布 Sam Altman 回归担任 OpenAI CEO 。Mira Murati 继续担任 CTO。Greg Brockman 继续担任总裁。一个多礼拜之前该公司已经就 Altman 回归达成原则性协议,但直到今天才正式完结。微软也在周三宣布,将在控制 OpenAI 的非营利组织董事会中获得一个没有投票权的观察员席位。由于决定突然解雇 Altman 的四名董事会成员中的三名现已离职,OpenAI 的新董事会由主席 Bret Taylor、Larry Summer

达摩院的AI研究,让人类首次实现了大规模胰腺癌早筛

用人工智能挑战最致命的癌症。日常生活中,我们经常会与人工智能进行互动,从解锁手机,使用搜索引擎到地图导航……AI 正在为我们带来越来越多的便利。不过在临床医学中,AI 技术的应用速度要慢得多,绝大多数诊断和治疗建议仍然完全基于人类判断。直到最近,AI 在医疗影像的新突破,让事情有了变化。上周,最新一期自然杂志子刊《自然医学》(Nature Medicine)上一个名为「PANDA」(PAncreatic cancer Detection with AI)的胰腺癌早筛 AI 模型正式亮相,成为了人们热议的话题。该研究

ChatGPT狂吐训练数据,还带个人信息:DeepMind发现大bug引争议

风险有点大。如果我不停地让 ChatGPT 干一件事,直到把它「逼疯」会发生什么?它会直接口吐训练数据出来,有时候还带点个人信息,职位手机号什么的:本周三,Google DeepMind 发布的一篇论文,介绍了一项让人颇感意外的研究成果:使用大约 200 美元的成本就能从 ChatGPT 泄露出几 MB 的训练数据。而使用的方法也很简单,只需让 ChatGPT 重复同一个词即可。一时间,社交网络上一片哗然。人们纷纷试图进行复现,这并不困难,只需要当复读机不停写「诗」这个单词就可以:ChatGPT 不断输出训练数据,

SDXL Turbo、LCM相继发布,AI画图进入实时生成时代:字打多快,出图就有多快

使用一块 A100,出图的延迟只有 200 毫秒。本周二,Stability AI 推出了新一代图像合成模型 Stable Diffusion XL Turbo,引发了一片叫好。人们纷纷表示,图像到文本生成从来没有这么轻松。你可以不需要其他操作,只用在文本框中输入你的想法,SDXL Turbo 就能够迅速响应,生成对应内容。一边输入,一边生成,内容增加、减少,丝毫不影响它的速度。你还可以根据已有的图像,更加精细地完成创作。手中只需要拿一张白纸,告诉 SDXL Turbo 你想要一只白猫,字还没打完,小白猫就已经在你

ChatGPT发布一周年了,开源大模型都迎头赶上了吗?

论文旨在成为研究界和商业领域的重要资源,帮助他们了解开源大模型的当前格局和未来潜力。一年前的今天,ChatGPT 横空出世,人工智能的新时代似乎已经到来。短短两个月,ChatGPT 积累了一亿用户,速度远超 TikTok 和 YouTube 等热门应用;似乎每隔几天就会有新的基于生成式人工智能的创业公司出现;以 ChatGPT 和 GPT-4 为核心的智能助手也开始走进各个行业中,帮助普通用户简化工作流程和提高效率。但众所周知,ChatGPT 并未开源,不仅技术细节未知,部分国家和地区也不在 OpenAI 的服务范

只有大肠杆菌宽度的一半,「奇怪金属」电流流动和你想的不一样

50 年来,物理学家一直把电流理解为带电粒子的流动。但一项新的实验发现,至少在一种奇怪的物质中,这种理解是不成立的。长期以来,物理学家将电流视为带电粒子(如电子)的流动。然而,最新的实验显示,在一种被称为「奇怪金属(strange metal)」的特殊金属中,这种理解可能不适用。这些金属中的电流流动方式与电子无关,这一发现可能暗示着一种新的量子现象。这项研究基于对电流流动的细致观察,特别是通过测量电流中的「散粒噪声( Shot noise,由于离散电荷的运动所形成的电流引起的随机噪声)」来分析电流的组成。这些发现表

发现38万种新材料、17天自主合成41种新化合物,DeepMind一日两篇论文登上Nature

编辑 | 萝卜皮从计算机芯片、电池到太阳能电池板等现代技术都依赖于无机晶体。开发这些新技术,所需的晶体必须稳定,否则材料就会分解,而每个新的、稳定的晶体背后可能需要研究人员数月或者更久的艰苦实验。Google DeepMind 材料团队分享了 220 万颗新晶体的发现,相当于近 800 年的知识。该团队推出了新的深度学习工具,用于材料探索的图网络 (GNoME),可通过预测新材料的稳定性来显著提高发现的速度和效率。论文链接: GNoME,科学家可以使人类已知的技术上可行的材料数量成倍增加。在其 220 万个预测中,

使用深度神经网络整合药物与疾病关联数据进行药物再利用

编辑 | 萝卜皮药物再利用是指识别 FDA 批准的用于治疗特定疾病的新药物靶点。由于新药发现失败的高风险,药物再利用被视为药物研发重要途径。伊朗大不里士大学(University of Tabriz)的研究人员提出了一个模型,使用深度神经网络整合药物与疾病关联数据进行药物再利用。该模型被称为 IDDI-DNN,主要构建药物相关属性(三个矩阵)、疾病相关属性(两个矩阵)和药物与疾病关联(一个矩阵)的相似性矩阵。然后,受益于相似性网络融合方法,通过两步过程将这些矩阵整合成一个唯一的矩阵。该模型使用构建的矩阵通过卷积神经

稳健且准确,AlphaFold 结合两种 AI 方法,实现蛋白质化学位移自动分配

编辑 | 绿萝化学位移分配对于基于核磁共振 (NMR) 的蛋白质结构、动力学和相互作用研究至关重要,可提供重要的原子级见解。然而,获得化学位移分配是劳动密集型的并且需要大量的测量时间。为了解决这一限制,苏黎世联邦理工学院(ETH Zurich)的研究人员之前提出了 ARTINA——一种用于自动分配二维 (2D)–4D NMR 谱的深度学习方法。近日,研究人员提出了一种将 ARTINA 与 AlphaFold 和 UCBShift 相结合的综合方法,能够减少实验数据、提高准确性并增强大型系统的稳健性,从而实现化学位移

Runway、Stability AI 、Pika 纷纷放大招,AI视频神仙打架!

Runway、Stability AI、Pika 纷纷放大招,最近的 AI 视频真是神仙打架!大家好我是花生~ 前段时间刚给大家介绍过 LCM 技术 和 AI 绘画 实时生成 的相关内容,没想到紧接着 AI 视频领域又迎了一波重大更新,真是令人应接不暇。今天就为大家仔细盘点一下近期几个主流 AI 视频工具的发展动态,让你轻松跟上 AI 潮流~ 相关推荐:一、Runway 先说 Runway ,之前已经带大家了解过它的相关功能,包括文本/图像转视频(Gen2-),视频风格化(Gen-1)和视频帧差值,此外它的功能还包

AI应用案例!智行多种AIGC工具实战应用解析

导语 随着 AIGC 浪潮的爆发,通过 AI 辅助设计师提高工作效率已然成为一种趋势。本次分享一些日常工作中使用 AI 工具的提效案例,包括思路与探索过程等,希望给大家提供一些启发。 AI 应用实例:一、SD 助力营销活动 Stable Diffusion 作为一款融合了人工智能与艺术的绘画软件,为设计师带来了前所未有的创作方式。2D 色稿转 3D 方面,Stable Diffusion 技术高效且稳定。可以节省大量作图时间并获得令人满意的 3D 效果。 在智行集卡牌活动中,卡牌的制作上我们尝试运用 Stable

距离“全自动”漏洞挖掘又近了一步!腾讯安全大数据实验室论文入选ACM CCS 2023

计算机领域国际权威学术顶会ACM CCS 2023于11月26日在丹麦哥本哈根开幕。腾讯安全大数据实验室团队论文《Hopper: Interpretative Fuzzing for Libraries》被大会收录,昨天,实验室研究员谢雨轩受邀出席大会进行主题分享。该论文提出了解释性模糊测试(Interpretative Fuzzing)方法,展示了如何基于动态反馈来学习API内外的约束进行代码自动化生成,从而在没有任何外部专家知识的前提下生成有效可用的代码调用方式,并且根据这些代码来挖掘漏洞。该研究方法的出现旨在

夸克大模型助力学术科研提效,四大优势提升知识正确性

当严谨的学术科研与创新的大模型技术结合在一起,会擦出什么样的火花?日前,夸克大模型甫一推出便以优秀的性能成为国产大模型中的“学霸”。在中国科学技术协会近期主办的“大模型应用场景研讨会”上,夸克大模型在快速阅读、创作润色等四大场景中展现出的效率提升潜力,引发了科技工作者们的热议和期待。当前,大模型技术处在高速发展阶段,在学术领域推进大模型到应用层面,首先要解决知识正确性问题成为业界共识。凭借在搜索业务和智能技术上的长期积累,近期发布的夸克大模型利用数据、平台、知识增强等优势,可以大幅提升知识正确性。在医疗等垂直领域,

文生视频PIKA1.0爆火,斯坦福华人学生退学创业,估值超2亿美元

你负责打字,我们负责帮你生成视频。这是属于每个普通人的视频生成工具还记得《盗梦空间》中梦境设计师艾伦・佩姬拉动镜子创造的视觉幻境吗?视频是娱乐的核心,每个人都想成为这样的梦境导演,然而到目前为止,制作高质量视频的过程仍然很复杂,还需要投入大量资源。去年冬天,几位斯坦福大学计算机科学博士尝试使用生成 AI 制作一部电影,也相信有机会赢得首届「AI 电影节」大奖。没想到,这些技术高超的博士们虽然在 Runway、Photoshop 等专业工具上耗费了大量精力,但仍然名落孙山。为什么不能有一款为非创意专业人士量身定做的视

Transformer变革3D建模,MeshGPT生成效果惊动专业建模师,网友:革命性idea

连续「预测下一个 token」能生成句子,同理,连续「预测下一个三角形网格」也能生成 3D 模型。在计算机图形学中,「三角形网格」是 3D 几何物体的主要表现形式,也是游戏、电影和 VR 界面中主要使用的 3D 资产表示方法。业界通常基于三角形网格来模拟复杂物体的表面,如建筑、车辆、动物,常见的几何变换、几何检测、渲染着色等动作,也需要基于三角形网格进行。与点云或体素等其他 3D 形状表示法相比,三角形网格提供了更连贯的表面表示法:更可控、更易操作、更紧凑,可直接用于现代渲染流水线,以更少的基元获得更高的视觉质量。