样本

终于把统计学中的抽样方法搞懂了!!!

大家好,我是小寒今天给大家介绍统计学中的一个关键概念,抽样抽样是一种从总体中选取部分个体(样本)以获得关于总体的信息的方法。 由于在大多数情况下直接研究整个总体的每一个个体并不实际,因此抽样为我们提供了在不完全观测总体的情况下推断总体特征的手段。 抽样的理论和技术被广泛用于统计学、社会科学、市场调查和其他需要分析数据的领域。

OpenAI 公布新型 AI 文生图方案“sCM”,号称效率是传统扩散模型 50 倍

OpenAI 本周公布了一款名为 sCM(Continuous-Time Consistency Model)的新型 AI 文生图方案。 与传统的扩散模型相比,sCM 仅需两个步骤即可生成高质量样本,号称能够将文生图效率提升约 50 倍,且生成的样本质量能与“业界较强的扩散模型”相比较,为 AI 文生图提供了新的方案。 目前业界通常使用扩散模型生成图片及音视频,但传统扩散模型的取样过程通常缓慢,通常需要数十到数百个逐步降噪的过程才能生成高质量样本(例如小伙伴们使用 SD“炼丹”绘图就需要等待特别长的降噪时间),这使得相应模型效率低下,不适合商业化应用。

北京:推进数字疗法、AI 辅助治疗等产品研发应用,支持医疗大模型开发、落地

北京市人民政府办公厅今日印发《北京市加快医药健康协同创新行动计划(2024-2026 年)》,提到人工智能技术、大模型、算力等一系列内容。IT之家汇总部分重点任务:实施医疗大数据共享与应用。建设全市共享的门急诊、住院、体检、科研等电子病历体系。推动标准化、信息化临床研究数据共享,明确数据脱敏标准,打通医院之间数据链接。推动检验结果、医疗影像在全市三级医院实现互联互通互认。推动医院开展医疗大数据的登记、评估、流通,拓展在创新研发端应用。推动临床样本数字化管理使用。建立面向全市开放、充分保护隐私的临床样本共享信息系统和

ICCV 2023 Oral | 如何在开放世界进行测试段训练?基于动态原型扩展的自训练方法

提高模型泛化能力是推动基于视觉的感知方法落地的重要基础,测试段训练和适应(Test-Time Training/Adaptation)通过在测试段调整模型参数权重,将模型泛化至未知的目标域数据分布段。现有 TTT/TTA 方法通常着眼于在闭环世界的目标域数据下提高测试段训练性能。可是,在诸多应用场景中,目标域容易受到强域外数据 (Strong OOD) 数据的污染,例如不相关的语义类别数据。在该场景又可称为开放世界测试段训练 (OWTTT),在该场景下,现有 TTT/TTA 通常将强域外数据强行分类至已知类别,从而

CVPR2022 | 利用域自适应思想,北大、字节跳动提出新型弱监督物体定位框架

将弱监督物体定位看作图像与像素特征域间的域自适应任务,北大、字节跳动提出新框架显著增强基于图像级标签的弱监督图像定位性能

离群?异常?新类?开集?分布外检测?一文搞懂其间异同!

你是否也曾迷惑于「离群检测,异常检测,新类检测,开集识别,分布外检测」之间错综复杂的关系?你是否也想要解决开放世界的问题却不知道从哪个任务入手?不知道利用什么方法解决问题?这篇最新综述将让你对开放世界领域有全新的认识!

《Pattern Recognition Letters》特刊通知

主题:深度学习模型安全简介:深度学习已广泛应用于自然语言处理、计算机视觉、数据安全等诸多领域。为学习到有效的深度模型,需花费大量时间和精力来收集数据与分配计算资源。这些模型可能会被非法使用,从而牺牲模型所有者的权益。另一方面,深度学习模型也容易受到对抗样本或毒化数据的攻击。这严重降低了深度学习技术的准确性和可靠性。为此需进行深度学习模型安全研究,保障模型的真实性和可靠性,以抵御各种攻击。该研究还处于起步阶段,虽然已取得了一定进展,但要为基于深度学习的应用开发稳健可靠的模型还远远不够。本期特刊旨在推动深度学习模型的攻

CVPR 2021 | 创新奇智首次提出零样本实例分割,助力解决工业场景数据瓶颈难题

对于数据发现、数据粗筛、辅助标注、模型基本能力探索等方面有巨大的提升。

AI模型被「骗」怎么破?《燃烧吧!天才程序员》冠军团队解决方案出炉

前段时间,一档名为《燃烧吧!天才程序员》的竞赛类综艺让「程序员」这一群体成功破圈,也呈现了 AI 在解决实际问题的过程中面临的一些挑战,如数据集中存在对抗样本、图像中存在噪声等。在本文中,CLS 战队(大赛头名团队)的优秀选手、奥比中光算法工程师埼玉详细解读了他们在比赛中用到的解决方案。近日,由蚂蚁集团、清华大学等组织共同协办的首届「Inclusion|A-tech 科技精英赛」(以下简称 A-tech 大赛)圆满落幕。奥比中光科技集团股份有限公司 (以下简称「奥比中光」) 研究院 SDK 组负责人小蛮腰、算法工程
  • 1