资讯列表

击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了

经历了提前两天的「意外泄露」之后,Llama 3.1 终于在昨夜由官方正式发布了。Llama 3.1 将上下文长度扩展到了 128K,拥有 8B、70B 和 405B 三个版本,再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说,Llama 3.1 405B 最重要的意义是刷新了开源基础模型的能力上限,Meta 官方称,在一系列任务中,其性能可与最好的闭源模型相媲美。下表展示了当前 Llama 3 系列模型在关键基准测试上的性能。可以看出,405B 模型的性能与 GPT-4o 十分接近。与此同时,Meta

数学大统一理论里程碑进展:几何朗兰兹猜想获证明,论文超800页

历经三十年的努力,数学家已经成功证明了一个名为「朗兰兹纲领(Langlands program)」的宏大数学愿景的主要部分。一个由 9 位数学家组成的团队成功证明了几何朗兰兹猜想(Geometric Langlands Conjecture),这是现代数学领域涉及范围最广的范式之一。马克斯・普朗克数学研究所的著名数学家 Peter Scholze(他并未参与此证明)说:这项证明是三十年辛苦研究所到达的顶点。「看到它得到解决真是太好了。」朗兰兹纲领是由罗伯特・朗兰兹(Robert Langlands)在 1960 年

从裸机到700亿参数大模型,这里有份教程,还有现成可用的脚本

我们知道 LLM 是在大规模计算机集群上使用海量数据训练得到的,AI在线曾介绍过不少用于辅助和改进 LLM 训练流程的方法和技术。而今天,我们要分享的是一篇深入技术底层的文章,介绍如何将一堆连操作系统也没有的「裸机」变成用于训练 LLM 的计算机集群。这篇文章来自于 AI 初创公司 Imbue,该公司致力于通过理解机器的思维方式来实现通用智能。当然,将一堆连操作系统也没有的「裸机」变成用于训练 LLM 的计算机集群并不是一个轻松的过程,充满了探索和试错,但 Imbue 最终成功训练了一个 700 亿参数的 LLM,

清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本工作由清华大学朱军教授领衔的基础理论创新团队发起。长期以来,团队着眼于目前人工智能发展的瓶颈问题,探索原创性人工智能理论和关键技术,在智能算法的对抗安全理论和方法研究中处于国际领先水平,

最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代

刚刚,大家期待已久的 Llama 3.1 官方正式发布了!Meta 官方发出了「开源引领新时代」的声音。在官方博客中,Meta 表示:「直到今天,开源大语言模型在功能和性能方面大多落后于封闭模型。现在,我们正在迎来一个开源引领的新时代。我们公开发布 Meta Llama 3.1 405B,我们认为这是世界上最大、功能最强大的开源基础模型。迄今为止,所有 Llama 版本的总下载量已超过 3 亿次,我们才刚刚开始。」Meta 创始人、CEO 扎克伯格也亲自写了篇长文《Open Source AI Is the Pat

你想成为什么模样?Meta AI 测试 Imagine Me 功能:一图一句话帮你“实现”

Meta 公司昨日发布 Llama 3.1 开源 AI 模型之外,还更新扩充了 Meta AI 功能,其中最值得关注的是引入了“Imagine Me”新功能。Meta 公司目前正在美国地区邀请用户测试,用户上传自拍照,然后使用“Imagine me as xxx”(假设我是 xxx)文字提示词(例如宇航员、医生等等),可以生成各种个性化照片。AI在线注:Meta AI 是其个人数字助理,可用于 WhatsApp、Instagram、Facebook 和 Messenger 等 Meta 服务,现在美国用户可以在 M

开源是未来 AI 之路,扎克伯格:Meta 要将 Llama 打造成为“AI 界的 Linux”

Meta 创始人兼首席执行官马克・扎克伯格(Mark Zuckerberg)昨日(7 月 23 日)发布博文,表达了他对开源 AI 生态系统的愿景,认为 Llama 有潜力成为“AI 界的 Linux”。扎克伯格表示 Linux 凭借着开源特性,近乎成为通过其开源特性已成为云计算和移动操作系统的行业标准,而 Meta 公司希望将 Llama 打造成 AI 领域的 Linux。扎克伯格阐述了开源人工智能为何有利于开发者和行业的理由,AI在线简要梳理如下:训练、微调和蒸馏自己的 AI 模型每个组织都有不同的需求,而满足

Llama 3.1 上线就被攻破:大骂小扎,危险配方张口就来,指令遵循能力强了更容易越狱

最强大模型 Llama 3.1,上线就被攻破了。对着自己的老板扎克伯格破口大骂,甚至知道如何绕过屏蔽词。设计危险病毒、如何黑掉 Wifi 也是张口就来。Llama 3.1 405B 超越 GPT-4o,开源大模型登顶了,副作用是危险也更多了。不过也不全是坏事。Llama 系列前几个版本一直因为过度安全防护,还一度饱受一些用户批评:连一个 Linux 进程都不肯“杀死”,实用性太差了。现在,3.1 版本能力加强,也终于明白了此杀非彼杀。Llama 3.1 刚上线就被攻破第一时间把 Llama 3.1 破防的,还是越狱

重庆两江新区与吉利汽车集团、旷视科技签署战略合作协议,共建 AI 智行开放平台

感谢据吉利控股集团今日消息,7 月 23 日下午,重庆两江新区与吉利汽车集团、AI 公司旷视科技签署战略合作协议。根据合作协议,三方将依托重庆制造业基础和产业优势,结合旷视科技在人工智能领域关键核心技术,以及吉利汽车整车研发、制造优势,共同建设 AI 智行开放平台,构建“AI 车 机器人”产业创新发展模式。AI在线注意到,重庆目前正着力打造“33618”现代制造业集群体系,具体来说,包括两个“3”、1 个“6”、1 个“18”:两个“3”,分别是 3 大万亿级主导产业集群,包括智能网联新能源汽车、新一代电子

极群科技陈春宇:会有新产品取代微信,这是注定的规律

作者丨马蕊蕾编辑丨陈彩娴“很多产品的问题并不需要最好的模型去解决。 ”极群科技创始人陈春宇说道。 纵观科技革命的历史规律,每一次技术革新后都会涌现大量的应用产品,这个周期大致是2-3年以上。

边缘人工智能提供商 Gcore 获 6000 万美元融资;马斯克开训最大 AI 集群,目标年底开发全球最强 AI丨AI情报局

今日融资快报边缘人工智能、云、网络和安全解决方案提供商Gcore获6000万美元A轮融资Gcore 的云基础设施专为边缘而构建,为边缘的 LLM 训练和人工智能应用程序的推理提供支持。 融资由Wargaming 领投,Constructor Capital 和 Han River Partners 跟投。 这些资金将战略性投资于 Gcore 的技术和平台,包括由 NVIDIA GPU 驱动的 AI 服务器,以推动 AI 主导的创新。

英伟达推出 AI 代工业务:携手 Meta Llama 3.1 开源模型,为客户定制部署“超级模型”

感谢英伟达公司昨日(7 月 23 日)发布新闻稿,正式推出“NVIDIA AI Foundry”代工服务和“NVIDIA NIM”推理微服务。“NVIDIA AI Foundry”代工服务英伟达表示客户可以使用 Meta 的 Llama 3.1 AI 模型,以及英伟达的软件、计算和专业知识,为特定领域定制构建“超级模型”。客户可以利用专有数据、由 Llama 3.1 405B 和英伟达 Nemotron Reward 模型生成的合成数据来训练这些“超级模型”。NVIDIA AI Foundry 由 NVIDIA D

OpenAI 调岗 AI 安全高管 Aleksander Madry,新职位专注于 AI 推理

OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)本周二在 X 平台发布推文,表示在新一轮内部架构重组中,负责 AI 安全的主管亚历山大・马德里(Aleksander Madry)调岗,并将其重新分配到一个专注于人工智能推理的岗位。阿尔特曼在推文中表示:“Aleksander 正在从事一个新的、非常重要的研究项目”。阿尔特曼补充表示,OpenAI 高管华金・基诺内罗・坎德拉(Joaquin Quinonero Candela)和莉莉安・翁(Lilian Weng)将在此期间接管 Preparedness

第四波!2024年7月精选实用设计工具合集

大家好,这是 2024 年 7 月的第 4 波干货合集!这一期干货合集包含有不少有趣的好东西,比如专业的信息图学习和参考的网站、高品质样机和设计资源合集网站、顶级移动端设计灵感网站,此外还有非常方便的在线压缩图片的工具,另外还有 2 个 AI 平台,一个是做图片素材的生成和编辑的,一个是专门做图片细节融合的。 当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货: 1、超强的信息图学习和搜集网站 「信息是美丽的」 来命名的网站,专精于专业的信息图制作,他们会将真实的数据高度有效地进行可

Meta 发布 Llama 3.1 开源大语言模型:128K 上下文长度,405B 版可与 GPT-4o 和 Claude 3.5 Sonnet 媲美

感谢Meta 今晚正式发布 Llama 3.1 开源大语言模型,提供 8B、70B 及 405B 参数版本。据介绍,Llama 3.1 系列改进了推理能力及多语言支持,上下文长度提升至 128K,首次推出 405B 参数的旗舰模型。Meta 称 4050 亿参数的 Llama 3.1-405B 在常识、可引导性、数学、工具使用和多语言翻译等一系列任务中,可与 GPT-4、GPT-4o、Claude 3.5 Sonnet 等领先的闭源模型相媲美。此外,8B 与 70B 参数的 Llama 3.1 模型与其他参数量相似

快速生成矢量图形,Adobe Illustrator 和 Photoshop 迎来新 AI 功能

Adobe 公司今日宣布,其旗下两款明星软件 Illustrator 和 Photoshop 将迎来一系列基于人工智能的新功能。这些新功能旨在加速日常创作流程,并赋予设计师更多创作控制权。Illustrator 的更新亮点包括“生成式形状填充”功能,用户只需输入简单的文字提示,就能为形状填充上精美的矢量图形。系统甚至可以根据文档中其他元素自动生成填充内容,而且所有生成的图形都是可编辑的矢量图。Illustrator 的另一个新功能是“模型”,能帮助设计师快速将插图应用到真实物体上,如服装或包装,系统会自动调整尺寸和

英特尔发布 AI Playground 开源软件:支持在锐炫 Arc 显卡本地运行 AI 图像生成与聊天机器人

在 6 月预告之后,英特尔今天正式推出 AI Playground 开源软件的 Beta 测试版。AI Playground 目前支持在配备 8GB 或更多显存的锐炫 Arc 显卡的 Windows 电脑上运行,未来还将支持英特尔酷睿 Ultra-H 处理器。据介绍,AI Playground 是一款免费开源的 AI PC 入门应用程序,支持在本地运行 AI 图像生成与增强、AI 聊天机器人功能。▲ AI 图像生成与增强▲ AI 聊天机器人AI在线注意到,这款软件的设计注重易用性,但同时也支持高级用户安装自己喜欢的

番茄小说 AI 协议遭平台作家集体抵制?公司回应:已上线解除条款功能入口

近期有不少网文作家发帖称,番茄小说签约协议中增加了“AI 训练补充协议”,要求作者同意把作品“喂”给平台的 AI,用于内容开发,引发不少作家反对。据新浪科技报道,对此番茄小说相关负责人表示,“番茄小说对于已签署补充协议或签约条款中包含 AI 辅助写作条款的作者,已上线解除相关条款的功能入口,用户可通过番茄作家助手 App、番茄小说网作者工作台发起解除相关条款。”此外,近期有网友指称豆包“能问到自己尚未发布的 AI 内容”,并使用 WPS 的云端内容训练 AI。据AI在线此前报道,字节跳动、WPS 方面均作出了回应,