资讯列表
早半年发arXiv,却被质疑抄袭:活在微软AutoGen阴影里的CAMEL
arXiv 不是同行评审期刊,所以发在 arXiv 上的论文不必被引用,这合理吗? 如果你对 AI 智能体感兴趣,那你一定知道微软的 AutoGen。它是一个用于构建 AI 智能体的开源编程框架,允许多个智能体通过聊天来解决任务。其间,LLM 智能体可以扮演多种角色,如程序员、设计师,或者各种角色的组合。在 GitHub 上,这个项目已经收获了 28k 的 star 量,论文还在 ICLR 2024 LLM Agent Workshop 上获得了最佳论文奖。不过,这篇论文的背后其实是存在争议的。2023 年 1
快手开源LivePortrait,GitHub 6.6K Star,实现表情姿态极速迁移
近日,快手可灵大模型团队开源了名为LivePortrait的可控人像视频生成框架,该框架能够准确、实时地将驱动视频的表情、姿态迁移到静态或动态人像视频上,生成极具表现力的视频结果。如下动图所示: 来自网友测试LivePortrait 来自网友测试LivePortrait快手开源的LivePortrait对应的论文题目为:《 LivePortrait: Efficient Portrait Ani
有效评估Agent实际表现,新型在线评测框架WebCanvas来了
当 LLM Agent 踏入真实的在线网络世界时,它们的表现能否如预期般游刃有余?
Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型
网友很好奇,Mathstral能不能搞定「9.11和9.9谁大」这一问题。昨天,AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了,包括OpenAI GPT-4o、Google Gemini等在内的大语言模型都翻了车。这让我们看到,大语言模型在处理一些数字问题时并不能像人类那样理解并给出正确的答案。对于数字以及复杂的数学问题,专用模型更术业有专攻。今天,法国大模型独角兽 Mistral AI 发布了一个专注于数学推理和科学发现的7B大模型「Mathstral」,来解决需要复杂、多步骤逻辑推理的高级数学问题。该
无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]李堉晖:北京大学智能学院硕士,受张弘扬老师和张超老师指导,研究方向为大模型加速和对齐,正在寻找25届工作机会魏芳芸:微软亚研院研究员,研究方向为具身智能、图像生成和AI agents张超:
大脑如何处理语言?普林斯顿团队对Transformer模型进行分析
编辑 | 萝卜皮在处理语言时,大脑会部署专门的计算来从复杂的语言结构中构建含义。基于 Transformer 架构的人工神经网络是自然语言处理的重要工具。普林斯顿大学的研究人员探讨了 Transformer 模型和人类大脑在语言处理中的功能特殊化问题。Transformer 通过结构化电路计算整合单词间的上下文信息。不过,当前的研究主要集中于这些电路生成的内部表征(「嵌入」)。研究人员直接分析电路计算:他们将这些计算解构为功能专门的「transformations」,将跨词语的上下文信息整合在一起。利用参与者聆听自
AI 大神 Karpathy 官宣创业:打造 80 亿人 AI 原生学校,首款课程 GitHub 斩获 17k 星
今天,AI 圈再次掀起海啸级巨震,离职 OpenAI 近半年的 AI 大牛 Karpathy 终于官宣了最终动向。他激动地宣布,自己正在创办一家 AI 教育的公司 —— Eureka Labs。Karpathy 这条官宣帖子,已有近百万浏览。Eureka Labs 官推初次现身,写下了「你好世界」。不难想到,自 2 月离职以来,Karpathy 一直都在专注在线授课领域,并不断动手尝试自己的新项目。当时,网友们便对 Karpathy 能够坚持输出高质教育内容的呼声越来越高。如今,愿望成真了!▲ 唯一的不足就是
消息称字节将于 7 月 19 日首次大范围公布文生图 / 视频等 AI 模型进展
钛媒体 AGI 报道称,字节跳动团队将会在 7 月 19 日(本周五)首次大范围公布文生图、类 sora 新视频等全新人工智能(AI)模型技术进展,尤其在长视频、高动态方向上具备创新技术,或将直接对标 Sora 效果。消息人士表示,字节跳动内部将 AI 大模型设为集团 P0 最高级别的方向。此外抖音、剪映等内部多个团队也在研发 AI 视频模型应用,预计将在近期公布。字节跳动将在新加坡举办关于世界模型(World Models)探索的 AI 技术菁英论坛(ByteDance AI Luminary Talks)活动,
戴盟机器人王煜:「具身技能」才能发挥人形机器人的作用 | 具身智能十人谈
作者:赖文昕编辑:岑峰本月,在爆火的世界人工智能大会(WAIC 2024)中,人形机器人「十八金刚」成为了会场中当之无愧的焦点。 由青龙、智元-远征A2、宇树-H1、傅利叶-GR-1、星动纪元-XBot-L、乐聚-夸父4代等一众人形机器人组成的先锋阵列,作为「镇馆之宝」被陈列在展览馆进门处,成为了所有进场观众看到的首个惊喜。 在大模型技术的加持下,长出「大脑」的人形机器人被视为通向 AGI 的必经之路,「具身智能元年」似乎已经到来。
AI 编程新星 Anysphere 获 A16z 估值 4 亿美元投资;微软为 Excel 等研发新 AI 模型丨AI情报局
今日融资快报AI编程Anysphere获得A16z新一轮投资,估值达4亿美元AI 编程初创公司 Anysphere 发布AI代码编辑器 Cursor,并成功从知名风险投资公司 A16z 获得新一轮融资,估值至少达到4亿美元。 Cursor 被多个大型科技公司使用,包括 OpenAI 和 Perplexity。 Anysphere 的目标是通过AI 编辑器帮助开发者提高工作效率,简化编码过程。
苹果、英伟达等公司被曝使用争议 YouTube 资源训练 AI 模型:5.7GB,涉及 4.8 万个频道 17.4 万个视频字幕
非营利性新闻工作室 ProofNews 昨日(7 月 16 日)发布博文,表示包括苹果、英伟达、Salesforce 和 Anthrophic 在内的大型科技公司,在训练其 AI 模型时均使用了来自 YouTube 的视频资源。 报道称这些科技公司在训练其 AI 模型过程中,使用了名为 YouTube Subtitles 的数据集,大小为 5.7GB(4.89 亿个单词)。该数据集由 EleutherAI 创建,最早发布于 2020 年,涉及超过 48000 个频道的 173536 个 YouTube 视频字幕内容
第三波!2024年7月精选实用设计工具合集
大家好,这是 2024 年 7 月的第 3 波干货合集!这一期干货合集包含有好几个资源合集类型的素材,有基于 Notion 整合的资源和 AI 工具合集,有免费的矢量 LOGO 素材网站,有超全面的海外版设计资源导航,也有专业的图标和插画素材网站。此外,这次合集中还有基于 AI 的配色工具,可以直接导入 Figma 的那种,还有基于 AI 的手绘转数字版图表的工具,相当专业。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、基于 Notion 的设计资源和 AI 工具合集
ComfyUI 进阶篇!完整梳理 ComfyUI 的核心节点(二)
前言:
学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理,并详细解释每个参数。希望大家在学习过程中培养自我思考的能力,真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结,才能在面对复杂的工作流时游刃有余。祝大家学习顺利,早日成为 ComfyUI 的高手!一、VAE Decode
能给后院鸟儿起名,智能喂食器用 AI 技术识别鸟类个体
智能喂食器 Bird Buddy 近期宣布了名为“Nature Intelligence”的更新,为用户带来一系列新功能。升级后,Bird Buddy 不仅能识别光顾喂食器鸟儿的品种,还能通过人工智能图像识别技术,区分个体鸟类并为其起名,让观鸟更加有趣。Bird Buddy 公司将此功能称为“非侵入式鸟类标记”。传统鸟类标记需要在鸟腿上安装追踪器,而 Bird Buddy 则依靠其喂食器内置的 5MP 高清摄像头和 AI 图像识别技术,通过识别鸟儿的细节特征来区分不同的个体。该公司 CEO Franci Zidar
科技巨头被曝未经授权用 YouTube 内容训练 AI,苹果、英伟达在列
据 Wired 报道,包括苹果在内的一些科技巨头未经 YouTube 视频创作者同意,就使用了他们视频的字幕文件来训练人工智能模型。AI在线注意到,此次事件影响到的创作者包括知名科技博主 MKBHD (Marques Brownlee)、MrBeast、PewDiePie、以及脱口秀主持人斯蒂芬・科尔伯特、约翰・奥利弗和吉米・坎摩尔等。这些被用于训练 AI 的字幕文件相当于视频的文本转录内容。调查记者披露,一些世界上最富有的科技公司一直在利用来自成千上万个 YouTube 视频的素材来训练 AI,而这违反了 You
英国监管机构出手,正调查微软与 Inflection AI 相关交易
英国竞争和市场管理局(CMA)7 月 16 日发布声明称,正调查微软雇佣 Inflection AI 部分前员工以及与 Inflection 方面达成相关安排的情况。该监管机构担心此举可能导致“竞争实质性减少”。图源 PexelsCMA 在声明中表示,做出第一阶段决定的截止日期为 9 月 11 日,届时该机构将宣布是否将此案转入第二阶段的深入调查。今年 4 月,CMA 曾表示正在征集公众意见,针对一系列科技巨头与人工智能初创公司的交易展开调查,其中包括微软与 Inflection AI 的交易、微软与 Mistra
SOTA性能,厦大多模态蛋白质-配体亲和力预测AI方法,首次结合分子表面信息
编辑 | KX在药物研发领域,准确有效地预测蛋白质与配体的结合亲和力对于药物筛选和优化至关重要。然而,目前的研究没有考虑到分子表面信息在蛋白质-配体相互作用中的重要作用。基于此,来自厦门大学的研究人员提出了一种新颖的多模态特征提取(MFE)框架,该框架首次结合了蛋白质表面、3D 结构和序列的信息,并使用交叉注意机制进行不同模态之间的特征对齐。实验结果表明,该方法在预测蛋白质-配体结合亲和力方面取得了最先进的性能。此外,消融研究证明了该框架内蛋白质表面信息和多模态特征对齐的有效性和必要性。相关研究以「Surface-
人类模仿AI新赛道,AI:论疯癫,你是我爹
机器之能报道编辑:杨文AI被人类带坏!这个世界,太癫了……最近,社交媒体上冒出来一堆搞怪视频,打着 AI 的旗号,真人 cos AI,甚至抖音还专门出了个热门话题——人类模仿 AI 大赛。(视频来自抖音博主「关妮乱石」)视频链接::左边一张旧照片,右边打着「AI 修复」的字幕,实际由真人演绎着脑干缺失的狗血「剧情」。-1-AI:第一次被人冒充,没想到比我还抽象自从可灵、Luma 发布以来,全球网友组团整活,什么特朗普和拜登打啵,鳌拜和韦小宝秀恩爱,奥特曼和黄仁勋打起来……只有你想不到,没有 AI「祸害」不到。(查看