机器学习
导致大多数企业AI项目失败的致命错误
在企业中的某个领域,或许正有一个AI项目正在走向失败,可能它是一个旨在将销售额提升30%的推荐引擎,可能它是一个旨在大幅减少停机时间的预测性维护系统,又可能是一个本打算彻底改变响应时间的客户服务聊天机器人。 这些雄心勃勃的计划上落满的灰尘,代表的不仅仅是资源的浪费,还有期望的破灭,这让未来推动创新变得更加困难。 期望与现实之间的差距把AI项目想象成冰山。
受 DeepSeek-R1 启发,小米大模型团队登顶音频推理 MMAU 榜
@小米技术 官微今日发文称,小米大模型团队在音频推理领域取得突破性进展。受 Deepseek-R1 启发,团队率先将强化学习算法应用于多模态音频理解任务,仅用一周时间便以 64.5% 的 SOTA 准确率登顶国际权威的 MMAU 音频理解评测榜首,现同步开源。
AI助力房地产市场腾飞,预计2030年规模将达1803.45亿美元
全球人工智能(AI)在房地产市场的应用正在迅速崛起,预计到2030年将达到1803.45亿美元,年均增长率高达35%。 这一市场的快速发展得益于机器学习、预测分析等技术的进步,以及房地产管理对自动化的日益需求。 在这一市场中,主要参与者包括 Zillow 集团、Compass、Redfin 公司和 Reonomy 等。
马来西亚Maxis与华为携手推动智能网络运营的AI与ML技术应用
马来西亚电信公司 Maxis 与华为技术(马来西亚)有限公司宣布达成战略合作,旨在通过人工智能(AI)和机器学习(ML)技术,提升网络运营的智能化水平。 这一合作不仅是为了加速 Maxis 的数字化转型,更是希望通过智能化的自我优化网络技术,提升用户体验和运营效率。 根据 Maxis 的声明,此次合作将涵盖一个全面的联合项目,致力于将 AI 和 ML 技术深度整合进 Maxis 的网络运营中。
Science子刊,AI与生物物理建模相结合,设计新型蛋白质
编辑 | 萝卜皮机器学习 (ML) 正在改变计算蛋白质设计的世界,数据驱动方法在实验成功率方面超越了基于生物物理的方法。 然而,它们通常被报告为案例研究,缺乏整合和标准化,因此很难进行客观比较。 在最新的研究中,德国莱比锡大学(Leipzig University)的跨学科研究团队在 Rosetta 软件框架内建立了一个精简且多样化的工具箱,用于预测氨基酸概率的方法,以便对这些模型进行并排比较。
利用DeepSeek人工智能和人工智能可解释性预防银行欺诈
分析人工智能驱动的欺诈检测使用XGBoost、SHAP和实时仪表板提高了准确性和透明度,提供了可扩展的解决方案来打击欺诈。 随着人工智能(AI)和机器学习(ML)的发展,银行业的欺诈检测取得了显著进展。 然而,一个持续存在的挑战是欺诈决策的可解释性——我们如何证明为什么一个特定的交易被标记为欺诈?
使用Rust构建高性能机器学习模型
译者 | 布加迪审校 | 重楼机器学习主要使用Python来完成。 Python之所以大受欢迎,是由于它易于学习,并且有许多机器学习库。 而现在,Rust正成为一种强有力的替代语言。
科大讯飞出品!人人都能懂的AI大模型科普课
在当今科技飞速发展的时代,一个名为"AIGC"(Al Generated Content,人工智能生成内容)的概念正逐渐走进公众视野,并迅速成为各界热议的话题。 无论是社交媒体上的讨论,还是专业论坛中的交流,AIGC都成为了不可忽视的存在。 它不仅代表着技术进步的一个重要里程碑,更是预示着未来内容创作方式的一场深刻变革。
PVUW视频分割Workshop@CVPR 2025 | 征稿!比赛!
第四届真实世界下的像素级视频理解挑战赛(The 4th PVUW challenge)主页/Call for Paper::复杂场景视频目标分割挑战赛(MOSE Challenge):参赛、数据集下载::基于动作描述的指向性视频分割挑战赛(MeViS Challenge):参赛、数据集下载: 真实世界下的像素级视频理解(Pixel-level Video Understanding in the Wild, PVUW)挑战赛将于 CVPR 2025 期间在美国田纳西州纳什维尔的 Music City Center 举办。 像素级场景理解是计算机视觉中的核心问题之一,旨在识别图像中每个像素的类别、掩码和语义。 然而,现实世界是动态的,基于视频的,而非静态的图像状态,因此学习进行视频分割对于实际应用来说更为合理和实用。
机器学习特征筛选:向后淘汰法原理与Python实现
向后淘汰法(Backward Elimination)是机器学习领域中一种重要的特征选择技术,其核心思想是通过系统性地移除对模型贡献较小的特征,以提高模型性能和可解释性。 该方法从完整特征集出发,逐步剔除不重要的特征,最终保留对预测结果最具影响力的变量子集。 向后淘汰法的工作原理向后淘汰法遵循一个迭代式的特征筛选过程,具体步骤如下:初始模型构建:首先使用数据集中的全部特征构建模型。
速度提高40w倍,牛津新的ML策略计算蛋白的自由能扰动,助力药物发现
编辑 | 白菜叶机器学习为快速准确地预测结合亲和力提供了巨大的希望。 然而,目前的模型缺乏稳健的评估,无法完成(命中到)先导化合物优化中遇到的任务,例如对一系列同类配体的结合亲和力进行排序,从而限制了它们在药物发现中的应用。 牛津大学的研究团队首先提出了一种新的基于注意力的图神经网络模型 AEV-PLIG(原子环境向量-蛋白质配体相互作用图),以解决这些问题。
Meta AI 发布新型视频学习模型V-JEPA :视频理解新突破
近日,Meta AI 团队推出了视频联合嵌入预测架构(V-JEPA)模型,这一创新举措旨在推动机器智能的发展。 人类能够自然而然地处理来自视觉信号的信息,进而识别周围的物体和运动模式。 机器学习的一个重要目标是揭示促使人类进行无监督学习的基本原理。
使用共享神经网络扩展机器学习模型
译者 | 崔皓审校 | 重楼随着机器学习模型的复杂性和规模不断增长,任何企业或者组织在部署、扩展模型上都面临着巨大的挑战。 迫在眉睫的挑战是如何在内存限制与模型规模之间取得平衡,并保持高性能和成本效益。 本文探讨了一种创新的架构解决方案,通过将共享神经编码器与专门的预测头结合的混合方法来应对这些挑战。
哈佛、英特尔等60+顶尖机构联手打造:NeuroBench定义神经形态计算评测新范式
编辑 | 2049在人工智能快速发展的今天,计算效率成为制约其进一步发展的关键瓶颈。 神经形态计算凭借其借鉴生物大脑的创新架构,在能效比和实时处理等方面展现出巨大潜力。 然而,该领域长期缺乏统一的评测基准,使得技术创新难以得到客观衡量和有效比较。
如何将机器学习模型部署到生产环境?
译者 | 布加迪审校 | 重楼开发机器学习模型只完成了一半工作。 除非部署到生产环境、提供业务价值,否则模型仍然毫无用处。 知道如何部署自己的模型已成为任何数据科学家的一项基本技能,许多雇主已经要求我们能做到这一点。
研究警告AI语言模型极限:超8K上下文性能腰斩,概念推理成难关
慕尼黑大学、慕尼黑机器学习中心与Adobe Research近日联合发布的研究显示,包括GPT-4o、Gemini1.5Pro和Llama-3.3-70B在内的12款顶尖AI语言模型,在长文本概念推理任务中面临显著性能衰减。 尽管这些模型均支持至少128,000个标记的上下文处理,但其深层逻辑关联能力仍存在根本性局限。 研究团队开发的NOLIMA(无文字匹配)基准测试系统,通过刻意规避关键词重复的设计,揭示AI模型在概念联结上的脆弱性。
谷歌引入机器学习模型,加强验证机制防止青少年“谎报”年龄
这款新模型的目标是更准确地判断用户是否已满18岁,从而提供更符合其年龄的使用体验。不过,谷歌尚未透露具体的技术细节,因此该系统是否比现有的安全措施更有效,还有待验证。
Nature子刊新登,如何检测小分子机器学习中的覆盖率偏差
编辑丨&小分子机器学习旨在从分子结构中预测化学或生物特性,其应用包括毒性预测、配体结合和药代动力学等。 最近的一个趋势是开发避免显式领域知识的端到端模型。 这些模型假设训练和评估数据中没有覆盖率偏差,这意味着数据代表了真实分布。