资讯列表
专家警告:AI 能耗巨大,加剧气候危机
人工智能专家 Sasha Luccioni 警告称,生成式人工智能使用的能源是传统搜索引擎的 30 倍,正在加速气候危机。图源 PexelsLuccioni 致力于提高人们对热门新技术对环境影响的认识。她于 2024 年被美国《时代》杂志评选为世界人工智能领域 100 位最具影响力人物之一,多年来一直致力于量化 ChatGPT 或 Midjourney 等程序的排放量。在蒙特利尔举办的 ALL IN 人工智能会议上,Luccioni 接受法新社采访时表示,生成式人工智能需要大量计算能力进行训练,这需要强大的服务器。
天津大学为新生研发“AI 学长”海棠棠:24 小时解答学术科研、校园生活、个人发展等问题
天津大学未来技术学院打造了“迎新神器” —— 新生智能体“海棠棠”,能够 24 小时解答新生在学术科研、校园生活、个人发展等方面的各类常见问题。AI在线注意到,以往新生们通常只能通过翻阅厚重的校园手册、查询论坛和公众号等散落的碎片化讯息,或是向学长、学姐、辅导员们询问才能得到答案。但面对一个个“在线等”的问题,学长、老师们很难一一及时解答。“海棠棠”以文心大模型为基座模型,汇集百余个官方媒体平台的信息。作为“AI 学长”,海棠棠为新生“抓取”全网信息,解决学习、生活各方面的问题,帮助新生更加了解学校,适应大学生活。
英伟达开源 Nemotron-Mini-4B-Instruct 小语言 AI 模型:专为角色扮演设计,9216 MLP、上下文长度 4096 词元
科技媒体 marktechpost 昨日(9 月 14 日)发布博文,报道称英伟达开源了 Nemotron-Mini-4B-Instruct AI 模型,标志着该公司在 AI 领域创新又一新篇章。小语言模型的大潜力Nemotron-Mini-4B-Instruct AI 模型专为角色扮演、检索增强生成(RAG)及函数调用等任务设计,是一个小语言模型(SLM),通过蒸馏(distilled)和优化更大的 Nemotron-4 15B 获得。英伟达使用剪枝(pruning)、量化(quantization)和蒸馏(di
消息称 OpenAI 明年调整结构,转变为传统的营利性公司
《财富》(fortune)于 9 月 13 日发布博文,报道称山姆・阿尔特曼(Sam Altman)在最近周会上,向 OpenAI 公司员工宣布,将于明年调整颇为复杂的非营利性企业结构。报道称 OpenAI 在保留一个非营利部门之外,调整成为更传统的营利性公司。阿尔特曼表示 OpenAI 将摆脱非营利实体控制,转型为一家更为传统的营利性组织,但在周会上并未透露更多细节。AI在线援引消息源报道,OpenAI 一位发言人透露公司仍“致力于构建造福所有人的 AI”,并强调非营利性是“其使命的核心,并将持续存在”。Open
华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢
在 AI 领域,几乎每个人都在谈论大型语言模型,其英文全称为 Large Language Models,简写为 LLM。因为 LLM 中有「Language」一词,因此,大家默认这种技术和语言密切相关。然而,知名 AI 大牛 Andrej Karpathy 却对此有着独特的见解:「大型语言模型(LLM)名字虽然带有语言二字,但它们其实与语言关系不大,这只是历史问题,更确切的名字应该是自回归 Transformer 或者其他。LLM 更多是一种统计建模的通用技术,它们主要通过自回归 Transformer 来模拟
DeepMind又损大将,AI总监Nando de Freitas离职,曾领导开发Gato、Genie
这边 OpenAI 刚发了又一个引爆 AI 圈的大模型 o1,那边谷歌 DeepMind 高级 AI 总监 Nando de Freitas 宣布了自己离职的消息。9 月 13 日,Nando de Freitas 发推表示自己要离开工作 10 年之久的谷歌 DeepMind 了。「过去无疑是人工智能历史上最激动人心的几年, 自己的成长已经超出了预期,感谢我的那些聪明、慷慨且乐于助人的同事们。」他接着写到,DeepMind 一直是人工智能创新领域的中心,很多著名的研究人员从这里离开并创立了 OpenAI、Mistr
北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
微软发布 Windows Agent Arena 基准框架,评估 AI Agents 运行主流 Windows 应用性能
科技媒体 NeoWin 昨日(9 月 14 日)发布博文,报道称微软官方推出了 Windows Agent Arena 基准框架,用于评估生成式 AI Agents 在 Windows PC 上的性能。Windows Agent Arena 基准框架微软表示该基准框架 AI Agents 使用主流 Windows 应用方面的能力和速度,其中包括 Microsoft Edge 和谷歌 Chrome 浏览器,Visual Studio Code 等编程应用,记事本、时钟和画图等预装 Windows 应用,VLC 等主流
大厂AI设计实战!飞猪如何用AI打造100种不可思议的旅行?
以下视频来源于飞猪设计当视频在手机上无法加载,可前往PC查看。这 100 种全球不可思议的旅行玩法,是否有一个吸引了你,现在就想出发呢?
在这个人人都能营销的时代,传统的大市场、大高空、大观点的中心化营销方式正在逐步走向小团体、私空间、个性化的转变。曾经,一句响亮的 Slogan、一幅吸睛的大 KV、一段创意十足的 TVC 或许就能让消费者目不转睛,甚至占领心智。而如今,面对这类营销,对于消费者个体来说内心只会充满问号,who care?和我有什么关系?如果不能共情,那就请不要打扰我。
因为消费者早已不是信息的被动
OpenAI o1 非 GPT-4o 直接进化,在成本与性能上妥协
9 月 14 日消息,OpenAI 已经推出了新模型 OpenAI o1 的两大变体 ——o1-preview 与 o1-mini,这两款模型都有许多值得深入探讨的内容。人工智能专家西蒙・威利森(Simon Willison)专门发文,深入剖析了这些新模型背后的设计理念与实现细节,揭示了它们在技术上的独特优势与不足。威利森表示,o1 并不是简单的 GPT-4o 直接升级版,而是在强化“推理”能力的同时,做出了成本与性能上的权衡。1. 训练思维链OpenAI 的声明是一个很好的起点:“我们研发了一系列新型人工智能模型
米哈游 AI 大模型“Glossa”完成备案
感谢上海市互联网信息办公室 9 月 9 日发布“上海市生成式人工智能服务已备案信息公告”,新增 7 款已完成备案的生成式人工智能服务,累计已完成 41 款生成式人工智能服务备案。从最新备案的生成式人工智能服务名单可以看到,米哈游旗下子公司“上海米哈游秘法科技有限公司”的服务通过备案,模型名称为“Glossa”。米哈游创始人蔡浩宇曾放话“AIGC(人工智能生成内容)将彻底改变游戏开发行业”,他认为未来在游戏开发领域将只有两类人,顶尖的天才(团队)和业余爱好者,对于其他普通到专业级的开发者,蔡浩宇则建议“可以考虑转行了
AI 江湖“饭局”:马斯克、埃里森晚宴上向黄仁勋求购英伟达 GPU
甲骨文创始人拉里・埃里森在公司最新财报电话会议上透露了一段轶事,他表示,自己曾与特斯拉 CEO 埃隆・马斯克一起,亲自向英伟达 CEO 黄仁勋求购最新的 AI GPU。在位于帕洛阿尔托的 Nobu 餐厅,埃里森和马斯克向黄仁勋恳求向他们供应英伟达的最新 GPU,“我们向他乞求,请卖给我们,不,多卖给我们,越多越好,我们都需要,拜托了。”埃里森回忆道,“最后事情进展顺利,起作用了。”这次晚餐显然非常成功,埃里森和甲骨文得到了他们想要的 GPU。该公司最近宣布将打造一个名为 Zettascale AI 的超算集群,由
国内金融领域虚假人脸检测标准“零的突破”,《虚假数字人脸检测金融应用技术规范》发布
感谢据 21 财经今天傍晚报道,为提升金融信息系统的安全性,9 月 6 日北京国家金融科技认证中心联合 10 多家金融机构发布的《虚假数字人脸检测金融应用技术规范》(AI在线注:下称《应用规范》)正式施行。《应用规范》规定了面向金融领域应用的虚假数字人脸检测服务的技术框架、功能要求、性能要求等,并提出对应的测试评估方法,专门针对通过生成式 AI、Deepfake(深度伪造)等技术制作的虚假人脸内容进行检测。其为金融机构防御虚假数字人脸攻击提供了重要参考,这是国内首个面向 Deepfake 进行安全检测的标准。《应用
阿里通义将发布 AI 视频生成大模型,支持文生视频、图生视频
感谢阿里通义将在 2024 云栖大会(9 月 19 日至 9 月 21 日)期间发布视频生成大模型,目前通义 App 频道和通义万相 PC 端已上线“视频生成”入口,仅支持用户预约,但未开放使用。页面内容显示,全新发布的视频生成大模型是由通义实验室自主研发,包含“文生视频”和“图生视频”两种创作模式。AI在线测试,预约成功后,阿里通义会在用户获得使用资格时进行通知,并赠送给用户 66 灵感值(有效期 30 天)。
消息称国内 AI 大模型初创公司 MiniMax 产品负责人张前川离职
感谢据《智能涌现》报道,中国 AI 大模型初创公司 MiniMax 产品负责人、前今日头条用户产品负责人张前川,因个人原因目前已淡出公司事务,改任产品顾问一职。MiniMax 回应称,消息内容属实,感谢前川的付出和努力。一名知情者表示,产品顾问其实是虚职,张前川已经不参与公司业务,与离职无异。报道称,张前川此前在 MiniMax 内负责“星野”和“海螺”两款公司主力产品。2024 年中,张前川又淡出“星野”的决策,参与 MiniMax 生产力工具“海螺 AI”和部分其他产品的日常事务。张前川离职后,MiniMax
加速蛋白质工程,微软开发蛋白突变效应预测AI框架µFormer
编辑 | KX蛋白质工程是合成生物学领域的重要研究方向之一。近年来,AI 辅助的蛋白质工程逐渐发展成为一种高效的蛋白质分子设计新策略。近日,微软研究院科学智能中心的研究人员提出了深度学习框架 µFormer,其将预训练的蛋白质语言模型与定制设计的评分模块相结合,从而预测蛋白质的突变效应。µFormer 在预测高阶突变体、建模上位(epistatic)相互作用和处理插入方面,实现了最先进的性能。通过将 µFormer 与强化学习框架相结合,可以高效探索广阔的突变空间,涵盖数万亿个突变候选物,来设计活性增强的蛋白质变体
张俊林:OpenAI o1的价值意义及强化学习的Scaling Law
蹭下热度谈谈 OpenAI o1 的价值意义及 RL 的 Scaling law。一、OpenAI o1 是大模型的巨大进步我觉得 OpenAI o1 是自 GPT 4 发布以来,基座大模型最大的进展,逻辑推理能力提升的效果和方法比预想的要好,GPT 4o 和 o1 是发展大模型不同的方向,但是 o1 这个方向更根本,重要性也比 GPT 4o 这种方向要重要得多,原因下面会分析。为什么说 o1 比 4o 方向重要?这是两种不同的大模型发展思路,说实话在看到 GPT 4o 发布的时候我是有些失望的,我当时以为 Op