理论

检测&OCC双SOTA!Doracamom实现首个LV多模态融合的统一多任务感知算法框架~

写在前面&笔者的个人理解自动驾驶技术是现代交通革命的前沿,备受关注。 自动驾驶系统通常包括环境感知、轨迹预测和规划控制等组件,以实现自动驾驶功能。 准确的 3D 感知是自动驾驶系统的基础,主要侧重于 3D目标检测和语义占用预测任务。

能量驱动注意力:提升文本到图像扩散模型的语义对齐新范式

一眼概览该论文提出了一种 基于能量的跨注意力(Energy-Based Cross-Attention, EBCA) 机制,以解决文本到图像扩散模型中的 语义不对齐(semantic misalignment) 问题。 通过建模 上下文向量的后验分布,该方法能够自适应地调整语义上下文,实现更精准的文本引导图像生成,无需额外训练,并在 多概念生成、文本引导修复、图像编辑 任务上取得了优异表现。 核心问题当前的 文本到图像扩散模型(Text-to-Image Diffusion Models)(如 Stable Diffusion、Imagen)在生成高质量图像方面取得了巨大成功。

全球首个「视频教学」基准!南洋理工、CMU发布Video-MMMU

想象一下,你正在观看吴恩达老师的机器学习课程,视频讲解清晰、动画直观,你很快掌握了核心概念,并能在考试中灵活应用,人类对这个过程再熟悉不过。 那么,如果AI也能这样学习呢? 图1 Video-MMMU提出知识获取的3大认知阶段这正是Video-MMMU试图回答的核心问题:AI能否通过观看视频获取并应用知识?

DeepSeek的爆火,背后是这些启发 ...

关注AI大模型技术的朋友们,在欢度春节的这些天,一定有被国产大模型底座DeepSeek的”横空出圈"霸屏了。 国产化大模型在算力更加“节约”的情况下,研发出了近乎和OpenAI GPT-4o同等“聪明”的大模型底座,极大地激励了国人对于AI技术研发的信心,同时也给国内外同行们带来了不少“焦虑”与“反思”。 与其他主流大模型相比,正如DeepSeek的中文名“深度求索”想表达的,它在解决具体回答任务时,不仅关注“端到端”的一问一答结果,更加关注这个答案是怎么得到的。

AI已学会自我复制!复旦新研究:开源LLM克隆成功率最高90%

AI已跨越关键「红线」,实现了自我复制。 复旦大学的研究人员在一项新研究中,展示了两种开源的LLM具备自我克隆的能力。 在没有人类帮助的情况下,AI成功实现自我复制,这不仅是它超越人类的关键一步,也是「流氓AI」出现的早期信号。

AI赋能数据治理能力的十大模式

介绍在数据驱动决策的时代,数据治理已从单纯的法规遵及数据质量从发展成为推动明智决策的战略举措。 在之前的探索中,我们深入研究了 OpenAI API 的潜力,以自动填充术语定义,从而提高数据治理任务的效率。 今天,我们踏上了超越传统的旅程,来到数据治理 3.0时代,我们将数据治理工具与大型语言模型 (LLM) 无缝集成,它们具有理解和生成类似人类文本的能力,处于这场革命的前沿,自动执行大量任务并增强用户体验。

DeepSeek对数据治理的影响有哪些?

DeepSeek作为智能一款助手,在数据治理体系中具有深远的影响。 它通过提供智能化、自动化和高效化的解决方案,推动企业在数据治理变革与领域的优化。 以下是EPSEEK对数据治理体系影响的多角度分析: 一、战略层面:推动数据治理目标的明确与实现1.

Claude团队:用400万条对话分析AI对经济的长期影响

基于400万条Claude真实对话数据,Anthropic重磅发布全新报告! 在今天,哪些职业用AI最多? 他们都用AI干什么?

炸裂:SpringAI内置DeepSeek啦!

好消息,Spring AI 最新快照版已经内置 DeepSeek 了,所以以后项目中对接 DeepSeek 就方便多了。 但因为快照版会有很多 Bug,所以今天咱们就来看稳定版的 Spring AI 如何对接 DeepSeek 满血版。 SpringAI和DeepSeek介绍Spring AI 是 Spring 生态系统中的一个重要项目,旨在将人工智能集成到 Spring 应用程序中,它为 Java 开发者提供了一种便捷的方式来构建、管理和部署 AI 模型。

推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

开源推理大模型新架构来了,采用与Deepseek-R1/OpenAI o1截然不同的路线:抛弃长思维链和人类的语言,直接在连续的高维潜空间用隐藏状态推理,可自适应地花费更多计算来思考更长时间。 例如问题:Claire每天早餐都会做一个3个鸡蛋的煎蛋卷。 她在4周内会吃多少个鸡蛋?

20个很强的DeepSeek提问公式

大家好,我是汤师爷~今天直接给大家分享DeepSeek干货内容。 要获得精准的AI回答,关键在于提问方式。 这里为你整理了20个高效提问公式,直接提升回答质量。

一文读懂DeepSeek-V3 技术报告

2023年7月17日,DeepSeek正式成立,由幻方量化提供资金支持。 梁文锋凭借其在金融和AI领域的深厚背景,带领团队开始探索生成式AI技术。 同年11月2日,DeepSeek推出首款开源模型DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务,为AI领域的应用奠定了基础,直到 2024 年 12 月,DeepSeek-V3的发布引发了行业震动和社会广泛关注,在他们的最新技术报告《DeepSeek-V3技术报告》中,团队详细介绍了其最新成果——DeepSeek-V3模型。

研究表明:AI工具能悄无声息地改变我们的观点

大型语言模型,那些能对我们的提示给出人类回答的智能聊天机器人,会影响我们的观点吗? 《IEEE智能系统》杂志中描述的一项实验表明,答案是肯定的。 这项研究的影响对教师批改论文、员工评估以及许多其他可能影响我们生活的情况都有深远意义。

本地部署DeepSeek就这么简单...

引言DeepSeek 作为一款优秀的语言模型,结合 Ollama 和 Cherry Studio 可以轻松实现本地部署。 本文将深入浅出地介绍如何使用 Ollama 与 Cherry Studio 本地部署 DeepSeek。 Oallam简介Ollama 是一个简单易用的工具,它允许用户在本地快速部署和运行各种语言模型。

简易指南:运用AI/ML技术检测实时欺诈行为

译者 | 核子可乐审校 | 重楼随着技术的飞速发展,欺诈检测的重要意义也日益凸显。 根据注册欺诈审查师协会(ACFE)公布的数据,全球范围内的欺诈活动给企业造成的损失高达数万亿美元,占年销售总额的近5%。 随着欺诈手段愈发老练复杂,企业也开始借助AI与机器学习(ML)等前沿技术辅助分析,探索打击欺诈的新途径。

企业AI数据泄露风险加剧:CISO如何应对?

企业员工正以惊人的速度通过未授权和已授权的GenAI应用泄露敏感企业数据。 堵住这些泄露至关重要,以降低风险暴露。 员工通过GenAI泄露数据正成为企业的噩梦。

普通人也能轻松掌握的20个DeepSeek高频提示词(2025版)

一、基础原则1.说人话最重要"不用专业术语,就像和朋友聊天一样描述需求"。 ❌️ 错误示范:"请用SWOT分析法输出新能源汽车行业报告"。 ✅ 正确示范:"我要给老板汇报比亚迪谈判进展,完全不懂电池技术,请用买菜大妈都能听懂的话说明:他们的核心技术强在哪?

ICLR 2025 | Deep Signature 高效表征生物大分子复杂运动的新方法

编辑 | ScienceAI理解蛋白质动力学行为对于解析其功能机制和开发分子疗法至关重要。 然而,生物过程通常涉及复杂的高维动力学以及原子间相互作用,这对现有计算处理技术构成了巨大挑战。 本文介绍了来自香港城市大学李皓亮研究团队所提出的 Deep Signature,一个用于生物大分子复杂运动表征学习的深度学习框架。