技术

手机实现GPT级智能，比MoE更极致的稀疏技术：省内存效果不减｜对话面壁&清华肖朝军

在大模型争霸的时代，算力与效率的平衡成为决定胜负的关键。端侧部署一直是大模型落地的最后一公里，却因算力瓶颈困难重重。面壁智能和清华走出了一条与MoE不同的路径——神经元级稀疏激活，让模型在保持性能的同时大幅降低资源消耗。

4/14/2025 8:30:00 AM

量子位

动态场景，开放文本查询！清华哈佛联合建模4D语言场 | CVPR 2025

构建支持开放词汇查询的语言场在机器人导航、3D场景编辑和交互式虚拟环境等众多应用领域展现出巨大的潜力。尽管现有方法在静态语义场重建方面已取得显著成果，但如何建模4D语言场（4D language fields）以实现动态场景中时间敏感且开放式的语言查询，仍面临诸多挑战，动态世界的语义建模对于推动许多实际应用的落地至关重要。近日，来自清华大学、哈佛大学等机构的研究团队提出了一种创新方法4D LangSplat，基于动态三维高斯泼溅技术，成功重建了动态语义场，能够高效且精准地完成动态场景下的开放文本查询任务。

4/3/2025 10:12:30 AM

新智元

OCR技术选型：数据提取哪家强？

数据是企业运营的核心资产之一。然而，超过 85% 的商业信息以非结构化数据的形式存在，如电子邮件、报告、发票和合同等，这给计算机处理带来了极大挑战。为解决这一问题，光学字符识别（OCR）技术（Mistral OCR：文档处理领域的革新者）应运而生。

4/2/2025 4:00:00 AM

大模型之路

“计算机视觉被GPT-4o终结了”（狗头）

一夜之间，CV被大模型“解决”了（狗头）。万物皆可吉卜力之后，GPT-4o原生多模态图像生成更多玩法被开发出来。一个男友回头表情包，可以秒变语义分割图。

3/31/2025 8:44:00 AM

量子位

Anthropic首次切开Claude大脑，「AI黑箱」彻底破解？心算诡异思考过程曝光

AI的性能愈发强大，一个新模型可能前一天还是SOTA（最佳模型），第二天就被拍了下去。不过，这些强大的AI上空总有一团迷雾笼罩。那就是：他们到底是怎么找到答案的？

3/31/2025 8:30:00 AM

新智元

LLM中的分块技术：原理、应用与展望

在大语言模型（LLM）飞速发展的当下，分块技术（Chunking）（RAG 中的分块策略：从基础到前沿的全面剖析）作为提升模型性能的关键手段，受到了广泛关注。它在优化信息处理、提高检索效率、增强模型理解能力等方面发挥着不可或缺的作用。深入探究 LLMs 中的分块技术，对于推动自然语言处理（NLP）领域的发展具有重要意义。

3/27/2025 2:50:00 AM

大模型之路

一文详尽大型语言模型的四种量化技术

大型语言模型（比如ChatGPT背后的技术）确实非常"庞大"——这不仅指它们的能力，更直接体现在它们的体积上。一个中等规模的模型就可能占用几十GB的内存，相当于几百部高清电影的大小。对于普通开发者、个人研究者或初创公司来说，这样的资源需求无疑是一道难以跨越的门槛。

3/27/2025 2:44:00 AM

云朵君

关于人工智能技术学习与应用心得

最近一年多来开始转行做人工智能，从刚开始一点都不懂的小白到现在对人工智能有了初步的认识；中间过程可以说是相当不容易。因此，经过这段时间的应用和学习，也慢慢有了一点心得体会，因此在此记录一下。人工智能心得体会关于什么是人工智能，什么是机器学习，什么是神经网络，什么是大模型，以及各种模型架构在这里就不说了；在前面的文章中已经不止一次的讲述过以上内容。

3/26/2025 12:00:00 AM

DFires

揭秘老黄演讲中关键技术：PD分离！UCSD华人团队力作，LLM吞吐量跃升4倍

现在，PD分离已经成为兵家必争之地。前有Mooncake/DeepSeek等公司采用这种技术来优化大模型的推理服务，后有Nvidia/PyTorch基于该技术孵化下一代LLM服务系统。甚至最近，黄仁勋也在2025 GTC的舞台上提到了PD分离（Prefill-Decode Disaggregation）技术，进一步证明了这一技术获得的广泛关注。

3/20/2025 9:00:00 AM

新智元

15个Cursor AI功能，让你省去50%的编码时间！

经过长期的探索与实践，这里总结出15个Cursor AI的高效使用技巧。不管你是初次尝试Cursor AI的新手，还是希望进一步提升技能的老手，下面这些方法都能帮你更高效地利用这一革命性的工具，真正释放它的强大潜力。无缝 VS Code 迁移从VS Code切换到Cursor很简单：导航至光标设置常规帐户查找 "从 VS 代码导入 "选项点击并确认image.png虽然习惯难以改变，但当你熟悉Cursor后，或许会发现它独特的功能明显胜出旧版的VS Code，带来更流畅的开发体验。

3/17/2025 12:00:00 AM

dev

无缝切换，实现多厂家大模型高效对接

1、问题介绍在 AI 技术迅猛发展的今天，越来越多的研发同学面临着众多大模型选型的挑战。随着业务需求的多样化，大家希望能够逐一对比和探索不同的大模型，以便选择最适合的解决方案。然而，不同模型的对接方式各异，请求格式、参数解析也各不相同，这给开发者带来了不小的困扰。

3/14/2025 9:02:03 AM

架构精进之路

腾讯混元-TurboS：首个混合Transformer-Mamba MoE超大模型来了

腾讯混元团队发布了他们最新的力作——Hunyuan-TurboS，首个混合Transformer-Mamba MoE架构的超大模型大家都知道，传统Transformer模型在处理长文本时一直面临挑战，O(N²)的复杂度以及KV-Cache问题让长文本训练和推理效率大打折扣。而这次，混元-TurboS巧妙地融合了Mamba和Transformer两种架构的优势：• Mamba的高效长序列处理能力• Transformer强大的上下文理解能力强强联合，效果自然惊艳！官方数据显示，Hunyuan-TurboS在多个关键benchmark上表现出色：• 数学、推理、对齐能力超越或持平 GPT-4o-0806、DeepSeek-V3 以及各类开源模型。

3/11/2025 9:42:00 AM

AI寒武纪

世界首个人类脑细胞计算机诞生！能编程还能活体计算，售价3万5美金

就在刚刚，世界上第一台「合成生物智能」生物计算机诞生了！ Cortical lab推出的这款计算机，是由人类神经元直接集成到硅芯片上，可以编程和自适应，甚至还能活体计算。合成生物智能，再次创造奇迹。

3/10/2025 8:52:00 AM

新智元

C#+AI暴力变现：自动生成小红书爆款笔记，单账号月流水破10万源码解析

在数字化营销与内容创作深度融合的当下，利用技术手段实现高效内容产出与商业变现成为众多从业者关注的焦点。 C# 语言与AI技术的结合，为小红书爆款笔记的自动生成提供了有力支持，通过构建多平台矩阵运营，实现了单账号月流水破10万的惊人收益。本文将深入解析其中的技术细节、多平台运营策略及收益数据背后的逻辑。

3/10/2025 1:07:13 AM

conan

风格迁移重大突破！西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025

近年来，随着扩散模型的发展，风格迁移技术在文本引导的图像生成任务中取得了显著突破。然而，尽管现有方法可以实现优秀的风格化效果，但其对文本信息的精准控制仍存在明显不足，大多数方法在融合风格图像与文本描述时，往往会让生成结果过度依赖参考风格图像，导致对文本内容的响应能力下降。「风格主导的失衡问题」使得用户在输入文本提示时难以精准控制图像的颜色、结构或其他细节属性，还可能引入不稳定因素，例如棋盘格效应，进一步限制了其实用性。

3/7/2025 8:50:00 AM

新智元

图灵奖颁给强化学习师徒，一个造船改行写代码，一个痛批AI投身AGI

计算机最高奖图灵奖揭晓！强化学习先驱Andrew Barto与Richard Sutton共同获奖，他们被评价为“引领基础AI技术开发的研究人员”。值得一提的是，两位是师徒关系，Richard Sutton是Andrew Barto他第一位博士生。

3/6/2025 10:07:00 AM

量子位

B站文生视频模型工程实践

一、前言近年来，AI 内容生成（AIGC）领域的快速发展令人雀跃，OpenAI 在 2023 年初推出大型语言模型（LLM）GPT-4 受到了学术界和工业界的极大关注。 OpenAI 随后在 2024 年初推出文生视频（T2V）模型Sora，能够根据文本指令制作出具有现实风格和富有想象力的场景视频，更是展示了令人惊喜的“世界模拟器”能力。 B站作为UGC内容丰富的视频网站，在视频生成模型领域有着天然数据优势和广泛应用场景。

3/5/2025 12:00:55 AM

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型全能且实用！实战测评谷歌最新模型Gemini 2.5 Pro 大模型部署工具 Ollama 使用指南：技巧与问题解决全攻略 50组多风格提示词，全面测评Midjourney V7生图效果！ Deepseek 突破 AI 训练烧钱魔咒：1.2 万美元 1/525 成本 MT-Bench 跑分媲美 GPT-4o 斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习模态苹果 AI视频驾驶文本搜索 xAI 人形机器人 Copilot 大语言模型神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 架构

技术