让模型预见数据分布变化,东京大学等提出时态域泛化全新框架
在数据分布持续变化的动态环境中,如何进行连续模型泛化? 东京大学等高校的研究人员提出了名为Koodos的新框架,可以基于在一些随机时间点观测的数据分布,在任意时刻生成当下适用的神经网络。 尽管数据随时间持续发生变化,但是泛化的模型能在连续时间中与数据分布始终保持协调一致。- 968
- 0
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了,SU哈佛亚马逊最新研究引热议
4-bit量化,能让现有反学习/机器遗忘技术失灵! 也就是大模型在人类要求下“假装”忘记了特定知识(版权、私人内容等),但有手段能让它重新“回忆”起来。 最近,来自宾夕法尼亚州立大学、哈佛大学、亚马逊团队的一项新研究在reddit、Hacker News上引起热议。- 968
- 0
即插即用ChatTracker:多模态大模型重塑目标跟踪
写在前面 & 笔者的个人理解视觉对象跟踪旨在基于初始边界框在视频序列中定位目标对象。 最近,视觉语言(VL)跟踪器已经提出利用额外的自然语言描述来增强各种应用中的通用性。 然而,VL跟踪器在跟踪性能方面仍然不如最先进的视觉跟踪器(SoTA)。- 968
- 0
两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024
知识图谱(Knowledge Graphs)是一种结构化的,用于展示和管理信息,组织现实世界知识的形式。 其通常被表达为三元组形式(头实体,关系,尾实体)。 KGs 为问答系统、推荐系统和搜索引擎等各种实际应用提供了极其重要支持。- 968
- 0
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队! HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。 通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。- 968
- 0
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
文本属性图Text-Attributed Graphs(TAGs)是一种在节点上有丰富文本信息的图结构, TAGs 广泛应用于社交网络(social network)、引用网络(citation network)和推荐系统(recommendation system)等实际场景中。 由于其强大且通用的表达能力,该领域近年来得到了快速发展。 然而目前TAGs面临三大挑战:现有的TAGs数据集一般仅在…- 969
- 0
GPT-4o加钱能变快!新功能7秒完成原先23秒的任务
OpenAI出了个新功能,直接让ChatGPT输出的速度原地起飞! 这个功能叫做“预测输出”(Predicted Outputs),在它的加持之下,GPT-4o可以比原先快至多5倍。 以编程为例,来感受一下这个feel:为啥会这么快?- 969
- 0
英伟达团队机器训练新方法:仅 5 次演示让机器生成 1000 个新 demo
人类只需要演示五次,就能让机器人学会一项复杂技能。 英伟达实验室,提出了机器人训练数据缺乏问题的新解决方案 ——DexMimicGen。 五次演示之后,DexMimicGen 就可以直接模仿出 1000 个新的 demo。- 5
- 0
车道线再出发!SinLane:孪生Transformer如何破局(上交&浙大)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 & 笔者的个人理解车道检测是自动驾驶系统中一项重要但具有挑战性的任务。 基于Visual Transformer的发展,早期基于Transformer的车道检测研究在某些场景下取得了有前景的结果。- 968
- 0
微软清华改进Transformer:用降噪耳机原理升级注意力,一作在线答疑
Transformer自问世后就大放异彩,但有个小毛病一直没解决:总爱把注意力放在不相关的内容上,也就是信噪比低。 现在微软亚研院、清华团队出手,提出全新改进版Differential Transformer,专治这个老毛病,引起热议。 论文中介绍,整体思路类似差分放大电路或降噪耳机,用两个信号的差值来滤除共模噪声。- 968
- 0
Claude AI 上线新工具:分析、可视化 CSV 文件中的数据
科技媒体 NeoWin 昨日(10 月 24 日)发布博文,报道称 Anthropic 公司在更新 Claude 3.5 Sonnet 并推出全新的 Claude 3.5 Haiku 后,还推出了全新的分析工具,可以编写和运行 JavaScript 代码,实现处理数据、进行分析并生成实时洞察。 此分析工具将作为 Claude.ai 的新内置功能提供,类似于 ChatGPT 的代码解释器,它能够编…- 5
- 0
中国移动上海产业研究院:金融领域 AI 大模型渗透率过半,系行业最高
据《北京商报》周日报道,在 2024 金融街论坛年会“AI 金融赋能数字金融新篇章”平行论坛上,中国移动上海产业研究院副总经理陈豫蓉介绍,金融领域是大模型渗透率最高的行业,渗透率超过 50%。智慧销售、智能问答和智能风控是现阶段金融行业最热门,也是应用成熟度最高的 AI 大模型应用场景。AI在线从报道获悉,金融业具备大规模、高质量的数据资源和多维度、多元化的应用场景,被视为大模型技术应用的最优行业…- 7
- 0
LightRAG: 港大黄超团队打造简单高效的RAG系统, 大幅降低大模型检索增强成本
项目地址:: ,结合了图结构与双层检索机制,显著降低了大模型检索增强的成本,同时提升了信息检索的准确性和效率。首先,通过引入图结构,LightRAG能够更好地捕捉实体之间的复杂依赖关系,实现全面的信息理解。其次,其双层检索策略允许系统同时处理具体和抽象的查询,确保用户获得既相关又丰富的响应。- 4
- 0
OpenAI 发布 MMMLU 数据集:更广、更深评估 AI 模型,支持简体中文
科技媒体 marktechpost 昨日(9 月 23 日)发布博文,报道称 OpenAI 在 Hugging Face 上发布了多语言大规模多任务语言理解(MMMLU)数据集。背景随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI 决定推出 MMMLU 数据集,通过提供强大的多语言和多任务数据集,来评估大型语言模型(LLMs)在各种任务中的性能,从而应对这…- 6
- 0
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
看一眼菜品图就知道怎么做、能给植物看病、能把手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图像。与大型语言模型(LLMs)相比,大语言模型在处理和生成文本数据方面有专长,而多模态大…- 7
- 0
全球最大商业图库 Getty Images 推出免费高画质照片 AI 训练集:含 3750 张照片、分 15 项类别
以提供新闻、体育和娱乐照片授权闻名的全球最大的商业图库 Getty Images 上周宣布推出高画质照片样本训练数据集,供开发者开发和训练 AI 模型使用。AI在线获悉,该样本数据集包含 3,750 张照片,分为商业、教育、医疗健康、运动与健身、物品与物体、插图、图标等 15 个类别。数据集提供多种主题的高质量视觉内容,可用于训练机器学习和 AI 模型,开发多种应用场景。▲ 相关图片选集目前,这一…- 51
- 0
更高分辨率,更经济,深度生成模型与主动学习策略结合,推进大规模单细胞研究
编辑 | 萝卜皮单细胞测序是分析复杂疾病细胞复杂性的重要工具。然而,其高昂的成本阻碍了其在广泛的生物医学研究中的应用。传统的细胞反卷积方法可以从更便宜的批量测序数据中推断出细胞类型比例,但它们无法提供单细胞水平分析所需的精细分辨率。为了克服这一挑战,加拿大麦吉尔大学(McGill University)的研究人员引入了「scSemiProfiler」,这是一个创新的计算框架,将深度生成模型与主动学…- 6
- 0
迈向「多面手」医疗大模型,上交大团队发布大规模指令微调数据、开源模型与全面基准测试
编辑 | ScienceAI近日,上海交通大学、上海 AI Lab、中国移动等机构的联合研究团队,在 arXiv 预印平台发布文章《Towards Evaluating and Building Versatile Large Language Models for Medicine》,从数据、测评、模型多个角度全面分析讨论了临床医学大语言模型应用。文中所涉及的所有数据和代码、模型均已开源。Git…- 22
- 0
谷歌 AI 推出 CardBench 评估框架:含 20 个真实数据库,更全面评估基数估计模型
谷歌 AI 研究人员最新推出了 CardBench 基准,主要为学习型基数估计(cardinality estimation)满足系统评估框架需求。CardBench 基准是个综合评估框架,包含 20 个不同真实数据库中的数千次查询,大大超过了以往的任何基准。项目背景基数估计(cardinality estimation,简称 CE)是优化关系数据库查询性能的关键,涉及预测数据库查询将返回的中间结…- 13
- 0
美国加州通过人工智能训练数据透明度法案,要求企业披露 AI 模型数据来源
今日,美国加州立法机构通过了一项颇具争议的法案 —— 人工智能训练数据透明度法案,该法案将提交给州长加文・纽瑟姆,但其尚未对此法案表态。图源 Pexels该法案旨在要求人工智能公司在开发和训练模型时,对其使用的数据集进行更加透明的披露。AI在线注意到,这项由议员雅克・欧文提出的法案(AB 2013)原本适用范围更广,但在 8 月 20 日范围缩小至仅适用于生成式人工智能,即能生成文本、图像和类似内…- 9
- 0
Transformer 作者 Aidan Gomez 预警:只卖模型玩不过 OpenAI
Transformer 八子中最年轻的 Aidan Gomez 在最新的采访中感叹:只卖模型真的不赚钱!谷歌版的 Aidan Gomez,是给 AI 领域带来深远影响的 Transformer 作者之一。而现在的 Aidan Gomez,是估值飙升 55 亿美元的 Cohere 公司的联合创始人兼 CEO(此前推出了 Command R 系列开源大模型)。在这次与 20VC 主理人 Harry S…- 8
- 0
明确了:文本数据中加点代码,训练出的大模型更强、更通用
代码知识原来这么重要。如今说起大语言模型(LLM),写代码能力恐怕是「君子六艺」必不可少的一项。在预训练数据集中包含代码,即使对于并非专门为代码设计的大模型来说,也已是必不可少的事。虽然从业者们普遍认为代码数据在通用 LLM 的性能中起着至关重要的作用,但分析代码对非代码任务的精确影响的工作却非常有限。在最近由 Cohere 等机构提交的一项工作中,研究者系统地研究了代码数据对通用大模型性能的影响…- 36
- 0
Meta 部署新网络爬虫机器人,为其 AI 模型收集大量数据
北京时间 8 月 21 日,近日,Meta 悄悄地发布了一款新的网络爬虫,用于搜索互联网并收集大量数据,为其人工智能模型提供支持。据三家追踪网络抓取器的公司称,Meta 新网络爬虫机器人 Meta External Agent 于上月推出,类似于 OpenAI 的 GPTBot,可以抓取网络上的人工智能训练数据,例如新闻文章中的文本或在线讨论组中的对话。根据使用档案历史记录显示,Meta 确实在 …- 15
- 0
中国工程院院士邬贺铨:AI 大模型仍需“大力出奇迹”、提升算力枢纽利用率
据中新社报道,中国工程院院士邬贺铨 19 日在 2024 北京人工智能生态大会上表示,人工智能是新质生产力的引擎,大模型的发展仍然需要“大力出奇迹”,多措并举提升对物理世界的模拟能力。算力、数据等是促进人工智能发展的关键要素。据AI在线此前报道,中国信通院 7 月数据显示,截至 2023 年,全国在用算力中心机架总规模已超过 810 万标准机架,算力总规模达到 230EFLOPS,位居全球第二。邬…- 5
- 0
数据
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!