应用

OpenAI o1 非 GPT-4o 直接进化,在成本与性能上妥协

9 月 14 日消息,OpenAI 已经推出了新模型 OpenAI o1 的两大变体 ——o1-preview 与 o1-mini,这两款模型都有许多值得深入探讨的内容。人工智能专家西蒙・威利森(Simon Willison)专门发文,深入剖析了这些新模型背后的设计理念与实现细节,揭示了它们在技术上的独特优势与不足。威利森表示,o1 并不是简单的 GPT-4o 直接升级版,而是在强化“推理”能力的同时,做出了成本与性能上的权衡。1. 训练思维链OpenAI 的声明是一个很好的起点:“我们研发了一系列新型人工智能模型

米哈游 AI 大模型“Glossa”完成备案

感谢上海市互联网信息办公室 9 月 9 日发布“上海市生成式人工智能服务已备案信息公告”,新增 7 款已完成备案的生成式人工智能服务,累计已完成 41 款生成式人工智能服务备案。从最新备案的生成式人工智能服务名单可以看到,米哈游旗下子公司“上海米哈游秘法科技有限公司”的服务通过备案,模型名称为“Glossa”。米哈游创始人蔡浩宇曾放话“AIGC(人工智能生成内容)将彻底改变游戏开发行业”,他认为未来在游戏开发领域将只有两类人,顶尖的天才(团队)和业余爱好者,对于其他普通到专业级的开发者,蔡浩宇则建议“可以考虑转行了

AI 江湖“饭局”:马斯克、埃里森晚宴上向黄仁勋求购英伟达 GPU

甲骨文创始人拉里・埃里森在公司最新财报电话会议上透露了一段轶事,他表示,自己曾与特斯拉 CEO 埃隆・马斯克一起,亲自向英伟达 CEO 黄仁勋求购最新的 AI GPU。在位于帕洛阿尔托的 Nobu 餐厅,埃里森和马斯克向黄仁勋恳求向他们供应英伟达的最新 GPU,“我们向他乞求,请卖给我们,不,多卖给我们,越多越好,我们都需要,拜托了。”埃里森回忆道,“最后事情进展顺利,起作用了。”这次晚餐显然非常成功,埃里森和甲骨文得到了他们想要的 GPU。该公司最近宣布将打造一个名为 Zettascale AI 的超算集群,由

国内金融领域虚假人脸检测标准“零的突破”,《虚假数字人脸检测金融应用技术规范》发布

感谢据 21 财经今天傍晚报道,为提升金融信息系统的安全性,9 月 6 日北京国家金融科技认证中心联合 10 多家金融机构发布的《虚假数字人脸检测金融应用技术规范》(AI在线注:下称《应用规范》)正式施行。《应用规范》规定了面向金融领域应用的虚假数字人脸检测服务的技术框架、功能要求、性能要求等,并提出对应的测试评估方法,专门针对通过生成式 AI、Deepfake(深度伪造)等技术制作的虚假人脸内容进行检测。其为金融机构防御虚假数字人脸攻击提供了重要参考,这是国内首个面向 Deepfake 进行安全检测的标准。《应用

阿里通义将发布 AI 视频生成大模型,支持文生视频、图生视频

感谢阿里通义将在 2024 云栖大会(9 月 19 日至 9 月 21 日)期间发布视频生成大模型,目前通义 App 频道和通义万相 PC 端已上线“视频生成”入口,仅支持用户预约,但未开放使用。页面内容显示,全新发布的视频生成大模型是由通义实验室自主研发,包含“文生视频”和“图生视频”两种创作模式。AI在线测试,预约成功后,阿里通义会在用户获得使用资格时进行通知,并赠送给用户 66 灵感值(有效期 30 天)。

消息称国内 AI 大模型初创公司 MiniMax 产品负责人张前川离职

感谢据《智能涌现》报道,中国 AI 大模型初创公司 MiniMax 产品负责人、前今日头条用户产品负责人张前川,因个人原因目前已淡出公司事务,改任产品顾问一职。MiniMax 回应称,消息内容属实,感谢前川的付出和努力。一名知情者表示,产品顾问其实是虚职,张前川已经不参与公司业务,与离职无异。报道称,张前川此前在 MiniMax 内负责“星野”和“海螺”两款公司主力产品。2024 年中,张前川又淡出“星野”的决策,参与 MiniMax 生产力工具“海螺 AI”和部分其他产品的日常事务。张前川离职后,MiniMax

加速蛋白质工程,微软开发蛋白突变效应预测AI框架µFormer

编辑 | KX蛋白质工程是合成生物学领域的重要研究方向之一。近年来,AI 辅助的蛋白质工程逐渐发展成为一种高效的蛋白质分子设计新策略。近日,微软研究院科学智能中心的研究人员提出了深度学习框架 µFormer,其将预训练的蛋白质语言模型与定制设计的评分模块相结合,从而预测蛋白质的突变效应。µFormer 在预测高阶突变体、建模上位(epistatic)相互作用和处理插入方面,实现了最先进的性能。通过将 µFormer 与强化学习框架相结合,可以高效探索广阔的突变空间,涵盖数万亿个突变候选物,来设计活性增强的蛋白质变体

张俊林:OpenAI o1的价值意义及强化学习的Scaling Law

蹭下热度谈谈 OpenAI  o1 的价值意义及 RL 的 Scaling law。一、OpenAI o1 是大模型的巨大进步我觉得 OpenAI o1 是自 GPT 4 发布以来,基座大模型最大的进展,逻辑推理能力提升的效果和方法比预想的要好,GPT 4o 和 o1 是发展大模型不同的方向,但是 o1 这个方向更根本,重要性也比 GPT 4o 这种方向要重要得多,原因下面会分析。为什么说 o1 比 4o 方向重要?这是两种不同的大模型发展思路,说实话在看到 GPT 4o 发布的时候我是有些失望的,我当时以为 Op

电力、芯片制造、数据和延迟成四大限制因素,Scaling Law能续到2030年吗?

近年来,人工智能模型的能力显著提高。其中,计算资源的增长占了人工智能性能提升的很大一部分。规模化带来的持续且可预测的提升促使人工智能实验室积极扩大训练规模,训练计算以每年约 4 倍的速度增长。从这个角度来看,人工智能训练计算的增长速度甚至超过了近代史上一些最快的技术扩张。它超过了移动电话采用率(1980-1987 年,每年 2 倍)、太阳能装机容量(2001-2010 年,每年 1.5 倍)和人类基因组测序(2008-2015 年,每年 3.3 倍)的峰值增长率。在最近的一份报告中,Epoch AI 研究了当前人工

李飞飞任CEO,空间智能公司World Labs亮相,全明星阵容曝光

人工智能的下个大方向已经出现,标志性学者决定下场创业。本周五,一个重磅消息引爆了 AI 圈:斯坦福大学计算机科学家李飞飞正式宣布创办 AI 初创公司 ——World Labs,旨在向人工智能系统传授有关物理现实的深入知识。李飞飞说道:在 AI 领域中,真正难以解决的问题是什么?我的答案是空间智能 —— 这项技术可以赋能和实现创作、设计、学习、AR/VR、机器人等领域的无数可能用例。为此,李飞飞与三位联合创始人 Justin Johnson、Christoph Lassner、Ben Mildenhall,以及一支世

o1 模型完整思维链成 OpenAI 头号禁忌,问多了等着封号吧

警告!不要在 ChatGPT 里问最新 o1 模型是怎么思考的 ——只要尝试几次,OpenAI 就会发邮件威胁撤销你的使用资格。请停止此活动,确保您使用 ChatGPT 时符合我们的使用条款。违反此条款的行为可能导致失去 OpenAI o1 访问权限。大模型新范式 o1 横空出世不到 24 小时,就已经有不少用户反馈收到这封警告邮件,引起众人不满。有人反馈只要提示词里带“reasoning trace”、“show your chain of thought”等关键词就会收到警告。甚至完全避免出现关键词,使用其他手

网信办发布《人工智能生成合成内容标识办法(征求意见稿)》

感谢国家互联网信息办公室今日发布关于《人工智能生成合成内容标识办法(征求意见稿)》公开征求意见的通知。其中第四条提到,服务提供者提供的生成合成服务属于《互联网信息服务深度合成管理规定》第十七条第一款情形的,应当按照下列要求对生成合成内容添加显式标识。(一)在文本的起始、末尾、中间适当位置添加文字提示或通用符号提示等标识,或在交互场景界面或文字周边添加显著的提示标识;(二)在音频的起始、末尾或中间适当位置添加语音提示或音频节奏提示等标识,或在交互场景界面中添加显著的提示标识;(三)在图片的适当位置添加显著的提示标识;

因类人通用推理、可辅助制作生物武器等因素,OpenAI o1 AI 模型归类为“中等风险”

科技媒体 The Decoder 昨日(9 月 13 日)发布博文,报道称在 OpenAI 自家的“防备框架”(Preparedness Framework)下,将最新发布的 o1 AI 模型归类为“中等风险”(medium risk)。防备框架简介AI在线曾于 2023 年 12 月报道,OpenAI 成立了新的“防备”(Preparedness)团队,并提出“防备框架”指导方针。防备团队将反复评估 OpenAI 最先进、尚未发布的 AI 模型,根据不同类型的感知风险评为四个等级,从低到高依次是“低”、“中”、“

OpenAI ChatGPT AI 聊天机器人新增“/picture”和“/search”指令

OpenAI 扩充 ChatGPT 系统快捷指令,新增“/picture”和“/search”,进一步改善用户的交互体验。AI在线附上操作方法如下:在与 ChatGPT 对话时,只需输入一个“/”(不含双引号),一个便捷的弹出窗口就会显示这些快捷选项。“/picture”该指令会调用 OpenAI 的文生图模型 DALL-E,即使用户没有具体的提示或想法,只需选择 / picture,也能为你生成有趣的图像。“/search”该指令会进入一个新的搜索模式,你输入的任何内容都会被视为搜索查询。即便用户没有输入任何内容

Meta 下周在英国重启数据收集计划,利用用户公开帖子训练其 AI

Meta 公司昨日(9 月 13 日)发布新闻稿,宣布以负责任和透明的方式,重启 AI 训练计划,利用英国用户在 Facebook 和 Instagram 上的公开帖子来训练 AI。

如何判断AI的输出是否正确?三个办法搞定!

在生成式 AI 工具如 ChatGPT 逐渐融入日常工作和生活的今天,很多人都在依赖 AI 来完成各种任务:撰写文案、编程、生成分析报告,甚至是做生活规划。虽然 AI 的应用场景越来越广泛,但它的输出并非每次都能符合预期。很多人在使用 AI 时会碰到这样的问题:AI 生成的内容到底靠不靠谱?它的输出是否可以完全信赖?如何判断 AI 给出的答案是正确的? 作为一名 AI 产品设计师,我也经常需要依赖 AI 工具来完成日常工作。经过无数次与 AI 的互动,我逐渐摸索出了三个简单有效的办法,可以帮助我们快速判断 AI 的

“AI 教母”李飞飞为新公司融资 2.3 亿美元,创业方向瞄准“空间智能”

据路透社今晚报道,被誉为“AI 教母”的 AI 研究员李飞飞为她与三位同事共同创立的初创公司 World Labs 筹集了 2.3 亿美元(AI在线备注:当前约 16.38 亿元人民币),该公司致力于开发能够理解三维物理世界运作的 AI 技术。World Labs 的首轮融资由 Andreessen Horowitz、New Enterprise Associates 和 Radical Ventures 共同领投,其他投资者包括 AMD、Intel Capital、英伟达的 NVentures 等。尽管现有的生成

元象发布中国最大 MoE 开源大模型:总参数 255B,激活参数 36B

元象 XVERSE 发布中国最大 MoE 开源模型 XVERSE-MoE-A36B。该模型总参数 255B,激活参数 36B,官方号称效果能“大致达到”超过 100B 大模型的“跨级”性能跃升,同时训练时间减少 30%,推理性能提升 100%,使每 token 成本大幅下降。MoE(Mixture of Experts)混合专家模型架构,将多个细分领域的专家模型组合成一个超级模型,在扩大模型规模的同时,保持模型性能最大化,甚至还能降低训练和推理的计算成本。谷歌 Gemini-1.5、OpenAI 的 GPT-4 、