资讯列表

OpenAI今天Open了一下:开源多智能体框架Swarm

毫无疑问,多智能体肯定是 OpenAI 未来重要的研究方向之一,前些天 OpenAI 著名研究科学家 Noam Brown 还在 X 上为 OpenAI 正在组建的一个新的多智能体研究团队招募机器学习工程师。就在几个小时前,这个或许还没有组建完成的新研究团队就已经开源发布了一项重量级研究成果:Swarm。这是一个实验性质的多智能体编排框架,主打特征是工效(ergonomic)与轻量(lightweight)。

李飞飞:不要数字孪生,要数字表兄弟,一张照片生成机器人训练场景

不百分百还原出虚拟场景,效果反而更好。我们很多人都听说过数字孪生(digital twin),在英伟达等公司的大力推动下,这种高效运营工作流程的方法已经在很多工业场景中得到应用。但你听说过数字表亲(digital cousin)吗?

NeurIPS 2024 | Transformer长度外推,全新位置编码DAPE大幅提升模型性能

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

Counterpoint:2024Q2 AI 服务器全球市场占比达 29%

市场调查机构 Counterpoint Research 昨日(10 月 11 日)发布博文,报告称 2024 年第 2 季度全球服务器市场中,AI 服务器占据所有服务器的 29%。报告指出由于 AI 服务器的强劲需求,第 2 季度全球服务器市场产值达到 454.22 亿美元,同比增长了 35%。自 2022 年 ChatGPT 横空问世以来,AI 服务器的需求激增,推动了整个服务器市场的快速发展。

上海交大联合开发 AI 系统,首次实现孕前精准预测流产风险

本月发表的最新论文中,上海交通大学李金金教授领导的研究团队开发了可解释 AI 算法,搭建流产风险预警平台,通过分析血清代谢物,首次实现在怀孕前精准预测流产风险。项目团队简介该项目团队由上海交通大学李金金教授领导,携手上海市红房子妇产科医院金莉萍副院长,同济大学附属第一妇婴医院、上海交通大学医学院附属瑞金医院共同参与开发。论文标题为《Interpretable learning predicts miscarriage using pre-pregnancy serum metabolites》,于 10 月发表在《The Innovation Medicine》期刊上。

快手联合推出 Pyramid Flow 开源文生视频 AI 模型:最高 10 秒 768P@24fps,创新金字塔流匹配让推理 tokens 降至 1/4

由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型,用户在输入文本之后,即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等,提供更高效、更灵活的视频生成解决方案,目前已经在 Hugging Face 平台上线,并完全开源。 AI在线查询官方介绍,附上 Pyramid Flow 的核心特点如下:高效生成:Pyramid Flow 采用新技术,通过统一 AI 模型分阶段生成视频,大多数阶段为低分辨率,只有最后阶段为全分辨率。

苹果研究人员质疑 AI 的推理能力:简单数学问题稍作改动就会答错

近年来,人工智能(AI)在各个领域取得了显著的进展,其中大型语言模型(LLM)能够生成人类水平的文本,甚至在某些任务上超越人类的表现。然而,研究人员对 LLM 的推理能力提出了质疑,他们发现这些模型在解决简单的数学问题时,只要稍加改动,就会犯错误,这表明它们可能并不具备真正的逻辑推理能力。图源 Pexels周四,苹果公司的一组研究人员发布了一篇名为《理解大型语言模型中数学推理的局限性》的论文,揭示 LLM 在解决数学问题时容易受到干扰。

ComfyUI实战教程!5分钟部署最新Flux大模型

Midjourney 和 Stable Diffusion 都是目前流行的 AI 图像生成工具,它们能够根据文本描述生成高质量的图像。都是基于深度学习技术的文本到图像生成模型,但它们各自基于不同的大模型。但最近推出了一款比前两者更强大,生成图像更加逼真,在细节上更符合现实世界的模型,就是 FLUX!

AI 时代如何做好XR设计?2个实战案例经验复盘

一、AI 驱动下的 XR 体验设计 小 XR 提起 XR,不知道大家的脑海里会浮现出什么样的画面?

Kimi探索版发布,10倍搜索量自主解决复杂问题

2024年10月11日,通用人工智能创业公司——月之暗面正式发布可自主海量搜索解决复杂问题的 Kimi 探索版。Kimi 探索版具备AI自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供更全面和准确的答案,帮助用户更高效地完成分析调研等复杂任务。Kimi 探索版的搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个页面。

字节跳动与清华 AIR 成立联合研究中心,推动大模型产学研合作

清华大学智能产业研究院(AIR)- 字节跳动“可扩展大模型智能技术联合研究中心(SIA Lab)”今日在清华大学举行成立仪式。字节跳动介绍称,近年来人工智能呈爆发式发展,预训练大语言模型(Pre-trained Language Model)已经成为迈向通用智能的重要发展路线之一。全球科技公司与研究机构正在投入大量资源研究预训练大语言模型,字节跳动组建豆包大模型团队,在相关领域持续研究与投入,致力于开发业界先进的 AI 大模型技术,成为世界一流的研究团队。

豆包大模型再造爆款:抖音“AI绘本特效”播放超11亿

国庆期间,抖音上一款名为“AI治愈绘本”的特效凭借温暖优美的画风和高还原度吸引了数百万用户投稿,采用了动态绘本的拟物玩法,“AI治愈绘本”特效首次使用了3D立体翻书的形式,巧妙地将首张用户图作为书皮呈现,玩法新颖有趣。基于该特效投稿的“成为绘本里的温暖主角”话题播放量超过11亿。据了解,“AI治愈绘本”特效底层使用了字节跳动豆包大模型的图像生成能力,技术团队通过多项自研算法,保证了模型有更好的风格响应度、画面美观度,让风格化效果更富有表现力,并且更大程度还原了人物面部特征、服装款式、颜色、配饰等主体特征,在“美且像”的维度上取得了良好的效果。

字节跳动清华AIR成立联合研究中心 推动大模型产学研合作

10月11日,清华大学智能产业研究院(AIR)-字节跳动 “可扩展大模型智能技术联合研究中心 (SIA Lab) ”  在清华大学举行成立仪式。SIA Lab 聚焦预训练大语言模型技术,致力于发展更为通用与可扩展的智能系统,提升智能技术在互联网以及更多场景、更复杂任务中表现能力。 清华AIR院长张亚勤院士,清华大学科研院院长刘奕群,清华AIR首席科学家马维英教授,AIR执行院长刘洋教授,字节跳动豆包大模型大语言模型团队负责人乔木,SIA Lab主任、清华AIR 周浩副教授,字节跳动科研战略与学术合作负责人金小伟,SIA Lab联合主任、字节跳动豆包大模型大语言资深研究员王明轩等嘉宾出席中心成立仪式。

AIGCRank:2024年9月AI微信公众号排行榜

AI在线 发布第 4 期「AI行业微信公众号排行榜」 TOP50 榜单

英国温布尔登网球锦标赛明年起引入 AI 鹰眼线审系统取代人类司线员

全英草地网球和槌球俱乐部(All England Lawn Tennis and Croquet Club)于 10 月 9 日发布新闻稿,其中宣布明年的温布尔登网球锦标赛将全面引入基于 AI 的鹰眼即时电子线审系统(Live Electronic Line Calling)取代人类司线员。据悉,这一鹰眼即时电子线审系统主要帮助裁判判定网球落点轨迹,该俱乐部声称,他们在今年的锦标赛期间进行了广泛的测试,并经过充分的考虑和咨询,决定在明年的温布尔登网球锦标赛(北京时间 2025 年 6 月 30 日至 7 月 13 日举行)全面采用这一鹰眼即时电子线审系统以减少比赛中的争议评分情况。AI在线获悉,澳大利亚网球公开赛(Australian Open)、美国网球公开赛(US Open)均已全面采用电子线审,在温布尔登网球锦标赛宣布采用这一技术后,目前全球四大网球公开赛中仅剩法国网球公开赛(French Open)还在使用人工线审。

香港面向 AI 启动财政支持计划,AI 超算中心 11 月底正式启用

据界面新闻报道,香港数码港 10 日举行 AI 资助计划简介会,并宣布 AI 超算中心将于 11 月底正式启用。据悉,香港新推出了 AI 资助计划,申请者最多可获超算中心服务定价的 7 成资助。据香港人工智能资助计划委员会主席冼汉迪介绍,该计划旨在最大限度发挥超算中心的潜力,从而支持符合条件的项目。

AI 逆向绘画:一键重绘梵高《罗纳河上的星夜》,来自华盛顿大学

梵高名作也能被 AI 逆向破解了?!直接喂一张原图,AI 就能化身梵高・本高一点点重绘整张图画(原图可任意)。

微软助推医疗行业 AI 变革:新增智能体服务、扩充 Azure 大模型

科技媒体 NeoWin 昨日(10 月 10 日)发布博文,报道称微软公司针对 Copilot Studio 推出了全新的医疗智能体服务,应对当前医疗体系中的诸多挑战。AI在线翻译微软官方博文部分内容如下医疗智能体服务让医疗机构能够为患者或临床医生开发自有的生成式人工智能代理,支持在预约调度、临床试验匹配、患者分诊等多种用例中的应用,还支持通过额外插件扩展组织的智能体。微软还推出新的临床安全 API,为特定客户提供私有预览,旨在帮助检测虚假信息和遗漏。