AI资讯列表 - AI在线

首个 AI Kaggle 特级大师诞生，OpenAI 的 o1-preview 夺 7 金封王

科技媒体 The Decoder 昨日（10 月 11 日）发布博文，报道称 OpenAI 公司推出 MLE-bench 新基准，旨在评估 AI 智能体在开发机器学习解决方案方面的能力。该基准包括 75 个 Kaggle 竞赛，旨在衡量自主 AI 系统在机器学习工程中的进展。这些竞赛涵盖了多个领域，包括自然语言处理、计算机视觉和信号处理等等。

OpenAI 推出 meta-prompt 工具，AI 时代让你掌握提示词艺术

AI 时代，你和他人的差异可能直接体现在如何提出合适的提示词（Prompt）上。科技媒体 The Decoder 昨日（10 月 11 日）发布博文，报道称 OpenAI 更新提示词优化功能 Playgound，新增引入“元提示”（meta-prompt）工具。“元提示”（meta-prompt）工具主要帮助用户更高效地创建、改进针对大型语言模型（LLMs）的提示，节省开发高质量 AI 提示的时间。

给小学数学题加句「废话」，OpenAI o1就翻车了，苹果新论文质疑AI推理能力

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。

六年、六届学生接力，共铸上交大图像合成工具箱libcom

arXiv:2106.14490v5如果你对 arXiv 的版本号有所了解，你就知道这篇论文已经更新了 4 次，现在已经来到了第 5 个版本。实际上，这个 arXiv 编号属于上海交通大学牛力团队一篇持续更新了四年的综述报告。该综述介绍了图像合成（image composition）领域需要解决的问题和应运而生的子任务，总结了各个子任务的数据集、传统方法、深度学习方法和实验现象，从鸿蒙初辟写到尘埃落地。

OpenAI今天Open了一下：开源多智能体框架Swarm

毫无疑问，多智能体肯定是 OpenAI 未来重要的研究方向之一，前些天 OpenAI 著名研究科学家 Noam Brown 还在 X 上为 OpenAI 正在组建的一个新的多智能体研究团队招募机器学习工程师。就在几个小时前，这个或许还没有组建完成的新研究团队就已经开源发布了一项重量级研究成果：Swarm。这是一个实验性质的多智能体编排框架，主打特征是工效（ergonomic）与轻量（lightweight）。

李飞飞：不要数字孪生，要数字表兄弟，一张照片生成机器人训练场景

不百分百还原出虚拟场景，效果反而更好。我们很多人都听说过数字孪生（digital twin），在英伟达等公司的大力推动下，这种高效运营工作流程的方法已经在很多工业场景中得到应用。但你听说过数字表亲（digital cousin）吗？

NeurIPS 2024 | Transformer长度外推，全新位置编码DAPE大幅提升模型性能

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

Counterpoint：2024Q2 AI 服务器全球市场占比达 29%

市场调查机构 Counterpoint Research 昨日（10 月 11 日）发布博文，报告称 2024 年第 2 季度全球服务器市场中，AI 服务器占据所有服务器的 29%。报告指出由于 AI 服务器的强劲需求，第 2 季度全球服务器市场产值达到 454.22 亿美元，同比增长了 35%。自 2022 年 ChatGPT 横空问世以来，AI 服务器的需求激增，推动了整个服务器市场的快速发展。

上海交大联合开发 AI 系统，首次实现孕前精准预测流产风险

本月发表的最新论文中，上海交通大学李金金教授领导的研究团队开发了可解释 AI 算法，搭建流产风险预警平台，通过分析血清代谢物，首次实现在怀孕前精准预测流产风险。项目团队简介该项目团队由上海交通大学李金金教授领导，携手上海市红房子妇产科医院金莉萍副院长，同济大学附属第一妇婴医院、上海交通大学医学院附属瑞金医院共同参与开发。论文标题为《Interpretable learning predicts miscarriage using pre-pregnancy serum metabolites》，于 10 月发表在《The Innovation Medicine》期刊上。

快手联合推出 Pyramid Flow 开源文生视频 AI 模型：最高 10 秒 768P@24fps，创新金字塔流匹配让推理 tokens 降至 1/4

由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型，用户在输入文本之后，即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等，提供更高效、更灵活的视频生成解决方案，目前已经在 Hugging Face 平台上线，并完全开源。 AI在线查询官方介绍，附上 Pyramid Flow 的核心特点如下：高效生成：Pyramid Flow 采用新技术，通过统一 AI 模型分阶段生成视频，大多数阶段为低分辨率，只有最后阶段为全分辨率。

苹果研究人员质疑 AI 的推理能力：简单数学问题稍作改动就会答错

近年来，人工智能（AI）在各个领域取得了显著的进展，其中大型语言模型（LLM）能够生成人类水平的文本，甚至在某些任务上超越人类的表现。然而，研究人员对 LLM 的推理能力提出了质疑，他们发现这些模型在解决简单的数学问题时，只要稍加改动，就会犯错误，这表明它们可能并不具备真正的逻辑推理能力。图源 Pexels周四，苹果公司的一组研究人员发布了一篇名为《理解大型语言模型中数学推理的局限性》的论文，揭示 LLM 在解决数学问题时容易受到干扰。

ComfyUI实战教程！5分钟部署最新Flux大模型

Midjourney 和 Stable Diffusion 都是目前流行的 AI 图像生成工具，它们能够根据文本描述生成高质量的图像。都是基于深度学习技术的文本到图像生成模型，但它们各自基于不同的大模型。但最近推出了一款比前两者更强大，生成图像更加逼真，在细节上更符合现实世界的模型，就是 FLUX！

AI 时代如何做好XR设计？2个实战案例经验复盘

一、AI 驱动下的 XR 体验设计小 XR 提起 XR，不知道大家的脑海里会浮现出什么样的画面？

Kimi探索版发布，10倍搜索量自主解决复杂问题

2024年10月11日，通用人工智能创业公司——月之暗面正式发布可自主海量搜索解决复杂问题的 Kimi 探索版。Kimi 探索版具备AI自主搜索能力，可以模拟人类的推理思考过程，多级分解复杂问题，执行深度搜索，并即时反思改进结果，提供更全面和准确的答案，帮助用户更高效地完成分析调研等复杂任务。Kimi 探索版的搜索量是普通版的 10 倍，一次搜索即可精读超过 500 个页面。

字节跳动与清华 AIR 成立联合研究中心，推动大模型产学研合作

清华大学智能产业研究院（AIR）- 字节跳动“可扩展大模型智能技术联合研究中心（SIA Lab）”今日在清华大学举行成立仪式。字节跳动介绍称，近年来人工智能呈爆发式发展，预训练大语言模型（Pre-trained Language Model）已经成为迈向通用智能的重要发展路线之一。全球科技公司与研究机构正在投入大量资源研究预训练大语言模型，字节跳动组建豆包大模型团队，在相关领域持续研究与投入，致力于开发业界先进的 AI 大模型技术，成为世界一流的研究团队。

豆包大模型再造爆款：抖音“AI绘本特效”播放超11亿

国庆期间，抖音上一款名为“AI治愈绘本”的特效凭借温暖优美的画风和高还原度吸引了数百万用户投稿，采用了动态绘本的拟物玩法，“AI治愈绘本”特效首次使用了3D立体翻书的形式，巧妙地将首张用户图作为书皮呈现，玩法新颖有趣。基于该特效投稿的“成为绘本里的温暖主角”话题播放量超过11亿。据了解，“AI治愈绘本”特效底层使用了字节跳动豆包大模型的图像生成能力，技术团队通过多项自研算法，保证了模型有更好的风格响应度、画面美观度，让风格化效果更富有表现力，并且更大程度还原了人物面部特征、服装款式、颜色、配饰等主体特征，在“美且像”的维度上取得了良好的效果。

字节跳动清华AIR成立联合研究中心推动大模型产学研合作

10月11日，清华大学智能产业研究院（AIR）-字节跳动 “可扩展大模型智能技术联合研究中心（SIA Lab） ” 在清华大学举行成立仪式。SIA Lab 聚焦预训练大语言模型技术，致力于发展更为通用与可扩展的智能系统，提升智能技术在互联网以及更多场景、更复杂任务中表现能力。清华AIR院长张亚勤院士，清华大学科研院院长刘奕群，清华AIR首席科学家马维英教授，AIR执行院长刘洋教授，字节跳动豆包大模型大语言模型团队负责人乔木，SIA Lab主任、清华AIR 周浩副教授，字节跳动科研战略与学术合作负责人金小伟，SIA Lab联合主任、字节跳动豆包大模型大语言资深研究员王明轩等嘉宾出席中心成立仪式。

AIGCRank：2024年9月AI微信公众号排行榜

AI在线发布第 4 期「AI行业微信公众号排行榜」 TOP50 榜单

资讯列表