资讯列表

Nature封面:AI训练AI,越训越离谱

训练数据是用 GPT-4o 生成的?那质量不好说了。我们知道,大模型面临的三大挑战是算法、算力和数据。前两者靠优化升级,后者靠积累。随着技术的不断发展,高质量数据已经逐渐成为最大的瓶颈。在很多新模型上,人们为了提升模型能力,都采用了使用 AI 生成数据来训练的方式。人们普遍认为,使用合成数据可以显著提升模型质量。不过,最新的研究认为,使用 AI 生成的数据并不是什么好办法,反而可能会让模型陷入崩溃。今天发表在学术顶刊《自然》杂志的封面研究认为,如果放任大模型用自动生成的数据训练自己,AI 可能会自我退化,在短短几代

育碧 7 月 27 日分享最新研究成果:游戏 AI 的可见性测试计算

育碧中国工作室今日宣布,在 ChinaJoy 期间举办的 2024 中国游戏开发者大会(CGDC)上,育碧 La Forge 中国团队的研发工程师应治将分享育碧一项最新研究成果 —— 游戏 AI 的可见性测试计算。AI在线获悉,神经表示是一系列利用神经网络来表示三维信息的新兴技术,已经应用于新视角合成、三维重建、三维生成和编辑等领域。在游戏 AI 领域,育碧研究员们作出了首次尝试。研发工程师应治将会为与会者展示利用神经表示解决游戏 AI 可见性测试计算瓶颈的第一个方法。该项技术有望在游戏领域得到更多应用以提升玩家的

只需两步,让大模型智能体社区相信你是秦始皇

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文由上海交通大学与百川智能共同完成,第一作者鞠天杰是上海交通大学网络空间安全学院三年级博士生。他的研究方向是大模型与智能体安全。论文地址::,由斯坦福大学和谷歌的研究团队开发的“AI小镇

RLHF不够用了,OpenAI设计出了新的奖励机制

OpenAI 的新奖励机制,让大模型更听话了。自大模型兴起以来,使用强化学习从人类反馈(RLHF)中微调语言模型一直是确保 AI 准确遵循指令的首选方法。为了确保 AI 系统安全运行并与人类价值观保持一致,我们需要定义期望行为并收集人类反馈来训练「奖励模型」。这种模型通过发出期望的动作来指导 AI。但是,收集这些常规和重复任务的人类反馈通常效率不高。此外,如果安全政策发生变化,已经收集的反馈可能会过时,需要新的数据。我们能否构建一种新的机制来完成这些任务?近日,OpenAI 公布了一种教导 AI 模型遵守安全政策的

TPAMI 2024 | ProCo: 无限contrastive pairs的长尾对比学习

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本论文第一作者杜超群是清华大学自动化系 2020 级直博生。导师为黄高副教授。此前于清华大学物理系获理学学士学位。研究兴趣为不同数据分布上的模型泛化和鲁棒性研究,如长尾学习,半监督学习,迁

加大调整力度,教育部支持高校布局集成电路、AI 等专业

7 月 23 日,教育部高等教育司公布《关于开展 2024 年度普通高等学校本科专业设置工作的通知》,提出加大本科专业调整力度,着力优化同新发展格局相适应的专业结构和人才培养结构。《通知》要求“服务国家战略需求”,支持高校面向集成电路、人工智能、量子科技、生命健康、能源、绿色低碳、涉外法治、国际传播、国际组织、金融科技等关键领域布局相关专业,有的放矢培养国家战略人才和急需紧缺人才。《通知》提出“推动专业优化升级”,支持高校深化新工科、新医科、新农科、新文科建设,对现有专业进行改造,培育交叉融合的新兴专业,打造特色优

AI 生产力罗生门:96% 老板力推,77% 员工认为增加工作量

研究机构 Upwork Research Institute 公布的最新报告指出,AI 正在增加全职员工的工作量。研究发现,77% 的员工表示,AI 增加了他们的工作量,阻碍了工作效率,并导致倦怠;此外,47% 使用 AI 的员工表示,他们不知道如何实现预期的生产力提升。另一方面,96% 的企业领导者对 AI 提高生产力寄予厚望。Upwork 研究院常务董事凯利・莫纳汉(Kelly Monahan)表示:我们的研究表明,在过时的工作模式和系统中引入新技术,并不能完全释放 AI 的预期生产力价值。AI 当然有可能同时

MAIA 新系统亮相:洞悉 AI 模型内在机制,审查其安全性

麻省理工学院计算机科学与人工智能实验室的研究人员开发了一种名为“MAIA”的多模式自动化可解释性代理系统,该系统可以使用视觉语言模型来自动执行各种神经网络可解释性任务。麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)最新研发了名为 MAIA 系统,可以使用视觉语言模型来自动执行各种神经网络可解释性任务。MAIA 的全称是 Multimodal Automated Interpretability Agent,直译过来为“多模态自动可解释性代理”,主要利用视觉语言模型,自动执行各种神经网络可解释性任务,

Reddit 被曝屏蔽多个搜索引擎和 AI 爬虫,官方称与谷歌合作无关

感谢今年 2 月,谷歌宣布与 Reddit 达成一项新协议,Reddit 数据将用于训练谷歌的 AI 模型,并在谷歌搜索结果中着重显示 Reddit 结果。彭博社报道称,这笔交易的金额约为 6000 万美元。从那时起,Reddit 在谷歌搜索中的展示次数也大幅增加。而最新消息称,Reddit 已禁止其他搜索引擎检索其网站内容。外媒 404 Media 最先报道了此行为,并指出 Reddit 已更新其 robots.txt 文件(AI在线注:网站与爬虫的协议文件),阻止所有机器人抓取网站的任何内容。AI在线查询 Re

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

AI 竞赛正以前所未有的速度加速,继 Meta 昨天推出其新的开源 Llama 3.1 模型之后,法国 AI 初创公司 Mistral AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后,Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来,而这一模型的特点是 ——「足够大」。具体来

AI 法律公司 Clio 获 9 亿美元融资;阿里云、腾讯云推出 Llama3.1 训练推理服务;可灵国际版上线丨AI科技评论

今日融资快报AI 法律公司 Clio 完成 F 轮 9 亿美元融资AI 法律科技公司 Clio 宣布完成 F 轮 9 亿美元融资,估值达到 30 亿美元。 Clio 的正式名称为 Themis Solutions Inc.,销售律师事务所用来管理其业务运营的一套云应用程序。 旗下产品 Clio Accounting 是一款应用程序,可帮助律师事务所的财务团队更高效地开展日常工作。

每小时1200张素材图!保姆级教程帮你搭建批量生图的SOP工程

AI 起来以后,很多公司都在寻找 AI 的落地应用场景,都在思考项目工程的流程节点怎么用 AI 去做提效。随着人工智能技术的快速发展,图像生成需求在许多行业中迅速增长。目前,许多企业已经开始广泛使用 Stable Diffusion(SD)技术进行图像生成。例如创作 IP 的延展,或应用于广告、产品设计、游戏开发等多个领域。然而,面向企业的大规模图像生成需求,批量化是一种刚需。 企业在使用 SD 进行图像生成时,往往需要处理大量的图像素材。这一过程中包括编写 CSV 需求单、审核素材、打标和命名等步骤,传统的手工操

设计素材不用愁!12 组高质量运动主题 Midjourney 提示词

大家好,这里是和你们一起探索 AI 的花生~ 巴黎奥运会马上就要开始了,肯定有小伙伴在准备相关的设计物料。今天就为大家推荐一波运动主题的 Midjourney 提示词,包含人物、场景及相关小元素,非常适合用在海报、banner 的设计中。 相关推荐:一、人物角色 A young chinese short distance runner, in a red and white sports uniform, sprint to the finish line. in the style of 3D Pixar ca

1230 亿参数,Mistral 发布 Large 2 旗舰 AI 模型:支持 80 多种编程语言,增强代码生成、数学和推理能力

AI 竞赛日益激烈,Meta 公司昨日推出开源 Llama 3.1 模型之后,法国人工智能初创公司 Mistral 也加入了竞争行列,推出了新一代旗舰模型 Mistral Large 2。模型简介该模型共有 1230 亿个参数,在代码生成、数学和推理方面比其前身功能更强大,并提供更强大的多语言支持和高级函数调用功能。Mistral Large 2 拥有 128k 的上下文窗口,支持包括中文在内的数十种语言以及 80 多种编码语言。该模型在 MMLU 上的准确度达到了 84.0%,并在代码生成、推理和多语言支持方面有

ComfyUI 进阶 (一):超实用的 Comfyroll 插件+8个优质节点推荐

前言: 学习 ComfyUI 是一场持久战,而 Comfyroll Studio 是一款功能强大的自定义节点集合,专为 ComfyUI 用户打造,旨在提供更加丰富和专业的图像生成与编辑工具。借助这些节点,用户可以在静态图像的精细调整和动态动画的复杂构建方面进行深入探索。Comfyroll Studio 的节点设计简洁易用,功能强大,是每个希望提升 ComfyUI 使用体验的用户的必备选择。祝大家学习顺利,早日成为 ComfyUI 的高手!一、安装 方法一: ① 直接在 ComfyUI 界面打开 Manager 管理

马斯克的“世界最强大 AI 数据中心”目前由 14 台移动发电机供电,引环保担忧

埃隆・马斯克的孟菲斯超级计算集群(Memphis Supercluster)已上线,据马斯克介绍称,该集群在单个 RDMA fabric 上使用 10 万张液冷 H100,是“世界上最强大的 AI 训练集群”。如此庞大的算力自然需要惊人的电力供应,每个 H100 GPU 至少消耗 700 瓦电力,这意味着整个数据中心同时运行需要超过 70 兆瓦的电力,这还不包括其他服务器、网络和冷却设备的耗电量。令人惊讶的是,由于与当地电网的供电协议尚未敲定,马斯克目前使用 14 台大型移动发电机为这个巨型设施供电。AI 和半导体

北京今年上半年累计上线大模型 71 款,占全国总量超四成

据新京报消息,北京市上半年经济形势和政策解读新闻发布会今日召开。北京市在人工智能领域取得了显著成就,上半年,全市累计上线大模型 71 款,占全国总量超过四成。北京市发改委高技术处副处长蒋海峰在发布会上指出,2024 年上半年,北京市创新和高技术产业表现强劲,特别是在人工智能领域取得了重要进展,全市数字经济的增加值同比增长 7.8%,其中信息服务业实现增加值 4944.6 亿元,同比增长 12.4%,拉动 GDP 增长 2.6 个百分点。据AI在线此前报道,北京市经信局去年宣布,北京市将形成人工智能产业发展新突破,助

马斯克与扎克伯格终于对上眼了:AI 大模型 Llama 3.1 开源值得赞扬

周二,Meta 发布了最新的 AI 模型 Llama 3.1。Meta 声称,该模型优于 OpenAI 的 GPT-4o,并且是开源的,已向公众免费提供。随后,马斯克罕见地向扎克伯格致敬。马斯克在回应特斯拉前 AI 总监 Andrej Karpathy 关于该模型的帖子时表示:“这令人印象深刻,扎克(伯格)的开源决定确实值得赞扬。”对此,Meta 代表尚未发表评论。对于主导 AI 的野心,扎克伯格和马斯克一直都直言不讳。早在一月份,扎克伯格在接受媒体采访时曾表示,Meta 一直在从英伟达储备 AI 芯片。扎克伯格说