深度学习
使用 CNN 进行时间序列预测!!
1D 卷积层(One-Dimensional Convolutional Layer)是卷积神经网络(CNN)的基本组成部分,广泛应用于处理一维序列数据,如时间序列分析、自然语言处理、语音识别等。 1D 卷积层是深度学习中用于处理序列数据的重要工具。 它通过滑动窗口方式提取局部特征,并在多个通道间整合信息。
ETH&PICO开源MADPose:通过显式仿射校正单目深度预测的相对位姿估计方法
本文经3D视觉之心公众号授权转载,转载请联系出处。 单目深度估计的关键局限和挑战近年来,基于深度学习的单目深度估计(Monocular Depth Estimation, MDE)能够从单张二维图像中提取出日益准确的三维信息。 这些进展为利用三维先验丰富传统几何计算机视觉任务开辟了新的可能性。
YOLO 详解:基于深度学习的物体检测
引言本文介绍了YOLO(You Only Look Once),一种基于卷积神经网络(CNN)的物体检测模型。 与依赖基于分类方法的传统物体检测模型不同,YOLO通过基于回归的方法直接推断边界框来预测物体位置。 这种端到端的CNN模型以其卓越的处理速度和高预测精度脱颖而出,在这两方面都优于许多现有的物体检测架构。
PyTorch vs PyTorch Lightning 框架对比
在不断发展的深度学习领域,PyTorch 已经成为开发者和研究人员家喻户晓的名字。 其动态计算图、灵活性以及广泛的社区支持使其成为构建从简单神经网络到复杂前沿模型的首选框架。 然而,灵活性也带来了编写大量样板代码的责任——尤其是在训练循环、日志记录和分布式学习方面。
深度学习最佳 GPU,知多少?
众所周知,在深度学习领域,硬件选择的重要性不言而喻。 随着机器学习模型复杂性的不断提升,对高效计算的需求也在指数级增长。 图形处理单元(GPU,Graphics Processing Unit)凭借其强大的并行计算能力,成为应对深度学习挑战的理想硬件解决方案。
入门 Transformer:概念、代码与流程详解
引言论文《Attention is All You Need》(Vaswani等,2017)提出了Transformer架构,这一模型通过完全摒弃标准的循环神经网络(RNN)组件,彻底改变了自然语言处理(NLP)领域。 相反,它利用了一种称为“注意力”的机制,让模型在生成输出时决定如何关注输入的特定部分(如句子中的单词)。 在Transformer之前,基于RNN的模型(如LSTM)主导了NLP领域。
多模态RAG技术:从语义抽取到VLM应用与规模化挑战
一、基于语义抽取的多模态 RAG多模态 RAG 的发展方向旨在构建一个高度集成的系统,能够无缝融合文本、图像和其它多媒体元素,为用户提供更丰富的信息交互体验。 实现多模态 RAG 系统的三种主要技术路径如下:传统对象识别与解析(雕花路线)传统的多模态文档处理首先会运用图像识别技术,如 OCR(Optical Character Recognition,光学字符识别),从图像中抽取出文字、表格和图片等元素。 之后,这些独立的对象会被进一步解析,转换成文本格式,以便于后续的信息检索与分析。
LeCun:对人工智能末日的担忧被夸大了,Meta正在构建超级智能助手
AI末日将近? 深度学习三巨头之一、被称为AI教父的Hinton教授在最新演讲中指出,技术的发展速度远远超出了他的预期,如果再不加以监管人类将会在10年内灭绝:不过,同为深度学习三巨头之一的LeCun教授则表示:夸大了。 在最新采访中,LeCun表示,自己还是非常看好人工智能的未来的。
Pytorch 核心操作全总结!零基础必备!
在深度学习与人工智能领域,PyTorch已成为研究者与开发者手中的利剑,以其灵活高效的特性,不断推动着新技术的边界。 对于每一位致力于掌握PyTorch精髓的学习者来说,深入了解其核心操作不仅是提升技能的关键,也是迈向高级应用与创新研究的必经之路。 本文精心梳理了PyTorch的核心操作,这不仅是一份全面的技术指南,更是每一个PyTorch实践者的智慧锦囊,建议收藏!
意念操控电脑,如手掌般精准!MIT脑机接口新技术登Nature子刊
编辑 | 2049想象一下,仅凭思维就能自如地操控电脑鼠标,就像健全人使用手部一样精准和流畅。 这听起来像科幻片中的场景,但在加州理工学院(MIT)的最新研究中,这样的未来正在成为现实。 研究人员开发出了一种名为「FENet」的突破性技术,让瘫痪患者能够更精准地用意念控制电脑设备。
CMU等提出超实用「模型泛化性」指标,分布外准确率提升6% | ICML 2024 Oral
当前许多深度学习分类模型通常在大规模数据中训练以找到足以区分不同类别的特征。 然而,这种方式不可避免地学到伪相关特征(Spurious Correlation),导致训练的分类器在分布偏移(Distribution Shift)下往往会失效。 因此,如何在衡量一个训练好的模型的泛化性(Generalization)一直是一个关键问题。
新SOTA,浙大、中科院深度学习模型可靠、准确预测蛋白-配体,助力药物开发
编辑 | 萝卜皮准确预测蛋白质-配体相互作用对于理解细胞过程至关重要,目前仍面临着诸多挑战。 中国科学院、浙江大学的研究人员提出了 SurfDock,这是一种深度学习方法,通过将蛋白质序列、三维结构图和表面级特征整合到等变架构中来解决这一挑战。 SurfDock 在非欧几里德流形上采用生成扩散模型,优化分子平移、旋转和扭转以生成可靠的结合姿势。
机械系统也能自主学习!密歇根大学团队构建了全新数学框架,登上Nature Communications
编辑丨&受人脑复杂运作的启发,神经网络已经彻底改变了各个领域的生产研究现状。 然而,考虑到基于计算机的神经网络需求的大量计算与极高能耗,特别是传统数字处理器的能源效率,机械神经网络的发展逐步被提上日程。 在光学神经网络中,波-物质相互作用被用来实现机器学习,类似的思路也可以被用来建立机械神经网络(MNN)的学习框架。
从方向导数到梯度:深度学习中的关键数学概念详解
方向导数作为标量量,表征了函数在特定方向上的变化率。 其数学表示为 ∇ᵤf(x) 或 Dᵤf(x)。 对于标量函数 f(x): Rⁿ → R,其梯度由函数的偏导数构成向量场。
精确属性控制,湖大、西电从头药物设计AI方法,登Nature子刊
编辑 | 萝卜皮深度生成模型在药物从头设计领域受到广泛关注。 然而,针对新靶点合理设计配体分子仍然具有挑战性,特别是在控制生成分子的性质方面。 在这里,受到 DNA 编码化合物库技术的启发,湖南大学和西安电子科技大学的研究人员提出了 DeepBlock,这是一种基于块(block)的配体生成深度学习方法,可根据目标蛋白质序列进行定制,同时实现精确的属性控制。
使用 YOLO 和 EasyOCR 从视频文件中检测车牌
本文将介绍如何通过Python中的YOLO(ou Only Look Once)和EasyOCR(光学字符识别)技术来实现从视频文件中检测车牌。 本技术依托于深度学习,以实现车牌的即时检测与识别。 从视频文件中检测车牌先决条件在我们开始之前,请确保已安装以下Python包:复制实施步骤步骤1:初始化库我们将首先导入必要的库。
压缩率达10的48次方,实现蛋白序列空间极端压缩,清华EvoAI登Nature子刊
编辑 | 萝卜皮设计功能更佳的蛋白质需要深入了解序列和功能之间的关系,这是一个难以探索的广阔空间。 通过识别功能上重要的特征来有效压缩这一空间的能力极其宝贵。 清华大学的研究团队建立了一种称为 EvoScan 的方法,用于全面分割和扫描高适应度序列空间,以获得能够捕捉其基本特征(尤其是在高维度中)的锚点。
如何为深度学习选择优秀 GPU ?
Hello folks,我是 Luga,今天我们继续来聊一下人工智能生态相关技术 - 用于加速构建 AI 核心算力的 GPU 硬件技术。 众所周知,对于绝大多数的深度学习模型的训练,尤其是参数规模较为庞大的模型,其往往是整个开发流程中最耗时、资源消耗最大的环节。 在传统的 CPU .