AI资讯列表 - AI在线

大模型推理成本排行榜来了：贾扬清公司效率领跑

风投烧完之后，哪些大模型创业公司会开始盈利？「大模型的 API 是个亏本买卖吗？」随着大语言模型技术的逐渐实用化，越来越多的科技公司提出了大模型 API 供开发者们使用。但前有 OpenAI「每天烧掉 70 万美元」，我们也有理由怀疑以大模型为基础的业务到底能不能持续。本周四，AI 创业公司 Martian 为我们仔细盘算了一下。排行榜链接： LLM Inference Provider Leaderboard 是一个开源的大模型 API 推理产品排行榜。对于每个供应商的 Mixtral-8x7B 和 Llama-

大模型×文本水印：清华、港中文、港科广、UIC、北邮联合发布首个大模型时代下的文本水印综述

本文介绍首个大模型时代下的文本水印综述，由清华、港中文、港科广、UIC、北邮联合发布，全面阐述了大模型时代下文本水印技术的算法类别与设计、评估角度与指标、实际应用场景，同时深入探讨了相关研究当前面临的挑战以及未来发展的方向，探索文本水印领域的前沿趋势。论文：A Survey of Text Watermarking in the Era of Large Language Models论文链接：：文本水印新纪元文本水印是一种信息隐藏技术，起源可以追溯到上个世纪 90 年代。它通过将机密信息（水印）嵌入文本中，实现了

Controlnet 最新动态！6款超好用的新模型解析（附下载）

大家好我是花生~ 之前为大家系统介绍过 Stable Diffusion WebUI 中 Controlnet 插件的安装使用方法，也系统梳理过各个模型的用法。现在 Controlnet 又有了一些新的模型和功能，今天正好为大家梳理一下。相关模型文件都在文末的云盘链接内，有需要的小伙伴记得下载~ Controlnet 相关推荐：一、Animal_openpose Animal_openpose 是一个专门提取狗、鹿、马、豹等四足动物姿势骨架的模型，也可以用来引导人马等奇幻形象的生成。使用时需要： ① 下载 rtmp

岩芯数智推出非Attention机制大模型，支持离线端侧部署

1月24日，上海岩芯数智人工智能科技有限公司对外推出了一个非Attention机制的通用自然语言大模型——Yan模型。岩芯数智发布会上称，Yan模型使用了全新自研的“Yan架构”代替Transformer架构，相较于Transformer，Yan架构的记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。岩芯数智CEO刘凡平认为，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中小型企业望而却步。其内部架构的复杂性，让决策过程难以解释；长序列处理困难和无法控制的幻觉问题也限制了大

美国家AI研究资源试点项目上线，NASA、英伟达、OpenAI等捐赠关键基础资源

机器之能报道编辑：吴昕为确保美国在 AI 技术领域的领先地位，拜登政府曾在几个月前发布 AI 行政命令。该行政命令指出，将通过国家人工智能研究资源试点（ National AI Research Resource，NAIRR ）促进美国各地的 AI 研究。今天，美国国家科学基金会（ NSF ）正式启动这个庞大的试点项目，让更多美国研究人员和学校（而不仅仅是财力雄厚的科技公司或精英大学及其研究人员）获得计算资源。试点项目的官网显示NSF 联合了 10 个联邦机构以及多家私营企业、非盈利组织等机构组成联盟，为有抱负的

小米新一代Kaldi团队论文解读：新型自动语音识别 (ASR) 模型Zipformer诞生之路｜ICLR 2024 Oral

近日，小米集团新一代 Kaldi 团队关于语音识别声学模型的论文《Zipformer: A faster and better encoder for automatic speech recognition》被 ICLR 2024 接收为 Oral (Top 1.2%)。论文链接：： Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey 领衔的团队，专注于开源语音基础引擎研发，从神经网络声学编码器、损失函数、优化器和解码器等各方面重构语音技术链路，旨在提

顺网科技公布新战略，推出算力及AI两大业务板块

近日，顺网科技（300113.SZ）对外公布新战略——“立足算力，聚焦AI”，并揭晓了全新的品牌标识。围绕该战略，顺网科技在算力及AI两大业务板块推出了系列创新产品及业务，涵盖顺网算力塔、顺网算力市场两大新产品以及全新的顺网智算中心业务；同时，灵悉智能体引擎及基于该引擎开发的AI陪伴应用“唠唠”也得到了全面展示。顺网科技将在成熟的电竞科技及ChinaJoy业务的支撑下，在算力与AI的黄金赛道重点发力。算力方面，顺网的算力服务路径将从垂直型向多场景转变。顺网科技聚焦垂直行业算力服务的“顺网雲”业务正式升级为“顺网算力

腾讯发布2024数字科技前沿应用趋势，涉及多模态大模型、具身智能、Agent等

1月24日，腾讯发布《2024数字科技前沿应用趋势》报告，预测了数字科技未来发展趋势和应用前景。“过去一年，我们见证了数字科技的加速度。眺望未来2-3年的科技趋势，我们正驶向一个由连接衍生交互、由计算催生智能的时代。”腾讯集团副总裁、腾讯研究院院长司晓说。《2024数字科技前沿应用趋势》报告中提出：高性能计算、量子计算、云计算和边缘计算这“四大计算”融汇贯通，正催生全新的计算范式；通用人工智能渐行渐近，大模型走向多模态，AI智能体（Agent）有望成为下一代平台， AI治理将引领我们踏上更智慧、更安全的未来。此外，

Hinton、LeCun、Bengio三巨头，马维英、陈海波等华人入选，2023 ACM Fellow公布

本届 ACM Fellow 包揽了万维网发明者、深度学习三巨头等重磅名人学者。今天，美国计算机协会 ACM（Association for Computing Machinery）公布了最新一届 Fellow 名单。ACM 创立于 1947 年，是全世界计算机领域影响力最大的专业学术组织之一。ACM Fellow 是由该组织授予资深会员的荣誉，目的为表彰会员中对于计算机相关领域贡献前 1% 的学者，其审查过程十分严格，每年遴选一次，研究员由同行提名，提名由委员会审查。本年度新入选科学家中共有 68 人，他们的贡献涉

「think step by step」还不够，让模型「think more steps」更有用

本文对思维链的推理步长进行了控制变量实验，发现推理步长和答案的准确性是线性相关的，这种影响机制甚至超越了问题本身所产生的差异。如今，大型语言模型（LLM）及其高级提示策略的出现，标志着对语言模型的研究取得了重大进展，尤其是在经典的 NLP 任务中。这其中一个关键的创新是思维链（CoT）提示技术，该技术因其在多步骤问题解决中的能力而闻名。这项技术遵循了人类的顺序推理，在各种挑战中表现出了优秀的性能，其中包括跨域、长泛化和跨语言的任务。CoT 及其富有逻辑的、循序渐进的推理方法，在复杂的问题解决场景中提供了至关重要的可

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

具身智能，首先就是要共用 AI。过去一年，生成式人工智能发展的核心关键词，就是「大」。人们逐渐接受了强化学习先驱 Rich Sutton 充分利用算力「大力出奇迹」的思潮，庞大的数据量是 AI 模型展现出惊人智慧的核心原因。数据规模越大、质量越高、标注越细，模型就能了解到更全面的世界知识，从而拟合出更加智能的结果。那么，为什么人工智能的进展还没有转化成科幻片中那种全能管家机器人呢？能清理桌子、叠衣服、做早餐的机器人在哪里？一个重要的原因是机器人领域很难「大力出奇迹」，生成式 AI 的文字或图片训练数据在网络上就能轻

物理与 AI 的融合，中国科学院大气物理研究所物理耦合图神经网络，提升降水预报技巧

编辑 | ScienceAI大模型时代，纯数据驱动的气象、气候模型效果逐渐追赶甚至赶超数值模式。然而，目前气象、气候大模型也仍然存在不少问题。比如物理一致性不高、辐散风预报效果不好等等，这些问题限制了对于降水等复杂天气气候现象的预测能力。目前，将物理、大气动力与深度学习模型结合成为提升模型能力，解决目前瓶颈问题的一条重要途径。近日，中国科学院大气物理研究所黄刚研究员团队基于地球系统数值模拟装置（寰）的数据和算力支持，从物理变量耦合关系角度出发，结合图神经网络对多变量进行物理软约束，提升了数值模式的降水预报技巧，在物

未来五年AI如何改变各学科？从LLM到AI蛋白设计、医疗保健......

2019—2023 年《Nature Machine Intelligence》封面编辑 | X五年前（2019 年 1 月），《Nature Machine Intelligence》创刊。当然，就人工智能（AI）而言，五年前似乎是一个不同的时代。1 月 24 日，Nature Machine Intelligence 杂志在《Anniversary AI reflections》（周年人工智能反思）专题中，再次联系并采访了近期在期刊发表评论和观点文章的作者，请他们从各自所在领域中举例说明人工智能如何改变科学过程

ComfyUI 傻瓜整合包发布！一键安装，SD 进阶自学必备！

大家好我是花生~ 上周赛博佛祖秋葉 Aki 发布了针对 ComfyUI 的整合安装包，让这款原本偏专业的 AI 绘画工具对初学者来说更容易上手使用了，我也安装试用了一下，的确非常方便，今天就为大家详细介绍一下整合包的用法 ~ ComfyUI 相关教程：一、ComfyUI 简介 ComfyUI 本体 Github 主页： ComfyUI 和大家熟知的 WebUI 一样，都是 Stable Diffusion 的一种用户界面，可以实现文生图、图生图、图像处理、AI 视频生成等操作。但 ComfyUI 是节点式模块化的

药物-靶标亲和力预测，上科大团队开发了一种Transformer编码器和指纹图谱相结合的方法

编辑 | 萝卜皮药物与靶标之间的结合亲和力的预测对于药物发现至关重要。然而，现有方法的准确性仍需提高。另一方面，大多数深度学习方法只关注非共价（非键合）结合分子系统的预测，而忽略了在药物开发领域越来越受到关注的共价结合的情况。上海科技大学的研究团队提出了一种新的基于注意力的模型，称为 TEFDTA （Transformer Encoder and Fingerprint combined Prediction method for Drug-Target Affinity），来预测键合和非键合药物-靶标相互作用的结

视频里有前男友？谷歌最新AI视频生成器 Lumiere，轻松让他消失

机器之能报道编辑：SIA最喜欢的视频里有前男友？现在，你可以轻松将他删除了。事实再次证明，AI 生成视频技术的发展速度令人瞠目。过去几个月，我们一直挣扎在 AI 生成的威尔·史密斯吃意大利面的尴尬场景里，以至于一段再正常不过的吃面场景被视为视频生成领域的“图灵测试”。今天，谷歌又研发出全新的时空扩散模型 Lumiere，将 AI 视频生成水准推向新高度。法语里， Lumiere 意思是启蒙者。Lumiere 几乎集齐了常见视频生成和编辑功能，也是迄今为止我们所见过的最先进的视频生成器。Lumiere 会根据用户自然

AI国际顶会ICLR 2024结果揭晓，蚂蚁集团11篇论文入选

近日，人工智能顶会之一ICLR 2024录用结果揭晓，蚂蚁集团有11篇论文被收录，其中1篇为Oral，3篇为Spotlight，7篇为Poster，蚂蚁集团在AI学术领域的进展受到关注。（图：蚂蚁集团的《长视频中的多粒度噪声关联学习》被收录为Oral论文）ICLR组委会今年共收到了7262篇论文投稿，录用率约为31%。其中，1.2%被录用为Oral论文，作者获得10分钟的口头演讲，5%被录用为Spotlight论文，获得4分钟的聚光灯展示；Poster论文则以海报形式展示。论文的重要性按此三类递减。每年，ICLR

《幻兽帕鲁》爆火，大厂坐不住了：这游戏是AI设计的？

疑似用 AI 卷设计，遭同行炮轰。最近，很多社交网络平台都被一款开放世界生存游戏刷了屏。《幻兽帕鲁》（Palworld）是当下最热门的话题之一，它在 1 月 19 日于 Steam 上线抢先体验版本，24 小时之内销量就超过了 200 万份，几天之内就突破了 600 万。在 1 月 23 日，幻兽帕鲁的 Steam 历史在线峰值就达到了 185 万人，超越了《CS 2》，成为了 Steam 历史在线玩家峰值第二的游戏。在幻兽帕鲁的游戏世界中，玩家可以自由收集神奇的生物「帕鲁」，派他们进行战斗、建造、采矿，工业生产等