技术
手机实现GPT级智能,比MoE更极致的稀疏技术:省内存效果不减|对话面壁&清华肖朝军
在大模型争霸的时代,算力与效率的平衡成为决定胜负的关键。 端侧部署一直是大模型落地的最后一公里,却因算力瓶颈困难重重。 面壁智能和清华走出了一条与MoE不同的路径——神经元级稀疏激活,让模型在保持性能的同时大幅降低资源消耗。
4/14/2025 8:30:00 AM
量子位
最新版Spring Ai实践
深入探索 Spring AI 1.0.0-M6在人工智能与软件开发深度融合的时代,Spring AI 作为一个强大的框架,持续为开发者提供着高效且便捷的工具,以实现与大语言模型(LLM)的无缝交互。 Spring AI 的最新版本引入了一系列令人瞩目的特性,其中 Function Calling 到 Tool Calling 的转换以及模型上下文协议(MCP)的应用,标志着该框架在 AI 集成领域的又一次重大飞跃。 聊天接口示例在今天的内容之前我们回一下如何使用SpringAI实现一个简单的聊天接口,使用千问API实现聊天功能:添加依赖复制配置复制实现复制当进行下面的提问时:现在北京时间几点了?
4/14/2025 2:25:00 AM
动态场景,开放文本查询!清华哈佛联合建模4D语言场 | CVPR 2025
构建支持开放词汇查询的语言场在机器人导航、3D场景编辑和交互式虚拟环境等众多应用领域展现出巨大的潜力。 尽管现有方法在静态语义场重建方面已取得显著成果,但如何建模4D语言场(4D language fields)以实现动态场景中时间敏感且开放式的语言查询,仍面临诸多挑战,动态世界的语义建模对于推动许多实际应用的落地至关重要。 近日,来自清华大学、哈佛大学等机构的研究团队提出了一种创新方法4D LangSplat,基于动态三维高斯泼溅技术,成功重建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。
4/3/2025 10:12:30 AM
新智元
OCR技术选型:数据提取哪家强?
数据是企业运营的核心资产之一。 然而,超过 85% 的商业信息以非结构化数据的形式存在,如电子邮件、报告、发票和合同等,这给计算机处理带来了极大挑战。 为解决这一问题,光学字符识别(OCR)技术(Mistral OCR:文档处理领域的革新者)应运而生。
4/2/2025 4:00:00 AM
大模型之路
“计算机视觉被GPT-4o终结了”(狗头)
一夜之间,CV被大模型“解决”了(狗头)。 万物皆可吉卜力之后,GPT-4o原生多模态图像生成更多玩法被开发出来。 一个男友回头表情包,可以秒变语义分割图。
3/31/2025 8:44:00 AM
量子位
Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光
AI的性能愈发强大,一个新模型可能前一天还是SOTA(最佳模型),第二天就被拍了下去。 不过,这些强大的AI上空总有一团迷雾笼罩。 那就是:他们到底是怎么找到答案的?
3/31/2025 8:30:00 AM
新智元
LLM中的分块技术:原理、应用与展望
在大语言模型(LLM)飞速发展的当下,分块技术(Chunking)(RAG 中的分块策略:从基础到前沿的全面剖析)作为提升模型性能的关键手段,受到了广泛关注。 它在优化信息处理、提高检索效率、增强模型理解能力等方面发挥着不可或缺的作用。 深入探究 LLMs 中的分块技术,对于推动自然语言处理(NLP)领域的发展具有重要意义。
3/27/2025 2:50:00 AM
大模型之路
一文详尽大型语言模型的四种量化技术
大型语言模型(比如ChatGPT背后的技术)确实非常"庞大"——这不仅指它们的能力,更直接体现在它们的体积上。 一个中等规模的模型就可能占用几十GB的内存,相当于几百部高清电影的大小。 对于普通开发者、个人研究者或初创公司来说,这样的资源需求无疑是一道难以跨越的门槛。
3/27/2025 2:44:00 AM
云朵君
关于人工智能技术学习与应用心得
最近一年多来开始转行做人工智能,从刚开始一点都不懂的小白到现在对人工智能有了初步的认识;中间过程可以说是相当不容易。 因此,经过这段时间的应用和学习,也慢慢有了一点心得体会,因此在此记录一下。 人工智能心得体会关于什么是人工智能,什么是机器学习,什么是神经网络,什么是大模型,以及各种模型架构在这里就不说了;在前面的文章中已经不止一次的讲述过以上内容。
3/26/2025 12:00:00 AM
DFires
揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍
现在,PD分离已经成为兵家必争之地。 前有Mooncake/DeepSeek等公司采用这种技术来优化大模型的推理服务,后有Nvidia/PyTorch基于该技术孵化下一代LLM服务系统。 甚至最近,黄仁勋也在2025 GTC的舞台上提到了PD分离(Prefill-Decode Disaggregation)技术,进一步证明了这一技术获得的广泛关注。
3/20/2025 9:00:00 AM
新智元
15个Cursor AI功能,让你省去50%的编码时间!
经过长期的探索与实践,这里总结出15个Cursor AI的高效使用技巧。 不管你是初次尝试Cursor AI的新手,还是希望进一步提升技能的老手,下面这些方法都能帮你更高效地利用这一革命性的工具,真正释放它的强大潜力。 无缝 VS Code 迁移从VS Code切换到Cursor很简单:导航至光标设置 常规 帐户查找 "从 VS 代码导入 "选项点击并确认image.png虽然习惯难以改变,但当你熟悉Cursor后,或许会发现它独特的功能明显胜出旧版的VS Code,带来更流畅的开发体验。
3/17/2025 12:00:00 AM
dev
无缝切换,实现多厂家大模型高效对接
1、问题介绍在 AI 技术迅猛发展的今天,越来越多的研发同学面临着众多大模型选型的挑战。 随着业务需求的多样化,大家希望能够逐一对比和探索不同的大模型,以便选择最适合的解决方案。 然而,不同模型的对接方式各异,请求格式、参数解析也各不相同,这给开发者带来了不小的困扰。
3/14/2025 9:02:03 AM
架构精进之路
腾讯混元-TurboS:首个混合Transformer-Mamba MoE超大模型来了
腾讯混元团队发布了他们最新的力作——Hunyuan-TurboS,首个混合Transformer-Mamba MoE架构的超大模型大家都知道,传统Transformer模型在处理长文本时一直面临挑战,O(N²)的复杂度以及KV-Cache问题让长文本训练和推理效率大打折扣。 而这次,混元-TurboS巧妙地融合了Mamba和Transformer两种架构的优势:• Mamba的高效长序列处理能力• Transformer强大的上下文理解能力强强联合,效果自然惊艳! 官方数据显示,Hunyuan-TurboS在多个关键benchmark上表现出色:• 数学、推理、对齐能力超越或持平 GPT-4o-0806、DeepSeek-V3 以及各类开源模型。
3/11/2025 9:42:00 AM
AI寒武纪
世界首个人类脑细胞计算机诞生!能编程还能活体计算,售价3万5美金
就在刚刚,世界上第一台「合成生物智能」生物计算机诞生了! Cortical lab推出的这款计算机,是由人类神经元直接集成到硅芯片上,可以编程和自适应,甚至还能活体计算。 合成生物智能,再次创造奇迹。
3/10/2025 8:52:00 AM
新智元
C#+AI暴力变现:自动生成小红书爆款笔记,单账号月流水破10万源码解析
在数字化营销与内容创作深度融合的当下,利用技术手段实现高效内容产出与商业变现成为众多从业者关注的焦点。 C# 语言与AI技术的结合,为小红书爆款笔记的自动生成提供了有力支持,通过构建多平台矩阵运营,实现了单账号月流水破10万的惊人收益。 本文将深入解析其中的技术细节、多平台运营策略及收益数据背后的逻辑。
3/10/2025 1:07:13 AM
conan
风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025
近年来,随着扩散模型的发展,风格迁移技术在文本引导的图像生成任务中取得了显著突破。 然而,尽管现有方法可以实现优秀的风格化效果,但其对文本信息的精准控制仍存在明显不足,大多数方法在融合风格图像与文本描述时,往往会让生成结果过度依赖参考风格图像,导致对文本内容的响应能力下降。 「风格主导的失衡问题」使得用户在输入文本提示时难以精准控制图像的颜色、结构或其他细节属性,还可能引入不稳定因素,例如棋盘格效应,进一步限制了其实用性。
3/7/2025 8:50:00 AM
新智元
图灵奖颁给强化学习师徒,一个造船改行写代码,一个痛批AI投身AGI
计算机最高奖图灵奖揭晓! 强化学习先驱Andrew Barto与Richard Sutton共同获奖,他们被评价为“引领基础AI技术开发的研究人员”。 值得一提的是,两位是师徒关系,Richard Sutton是Andrew Barto他第一位博士生。
3/6/2025 10:07:00 AM
量子位
B站文生视频模型工程实践
一、前言近年来,AI 内容生成(AIGC)领域的快速发展令人雀跃,OpenAI 在 2023 年初推出大型语言模型(LLM)GPT-4 受到了学术界和工业界的极大关注。 OpenAI 随后在 2024 年初推出文生视频(T2V)模型Sora,能够根据文本指令制作出具有现实风格和富有想象力的场景视频,更是展示了令人惊喜的“世界模拟器”能力。 B站作为UGC内容丰富的视频网站,在视频生成模型领域有着天然数据优势和广泛应用场景。
3/5/2025 12:00:55 AM
AI
资讯热榜
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型
上海AI实验室开源InternVL3系列多模态大型语言模型
全能且实用!实战测评谷歌最新模型Gemini 2.5 Pro
大模型部署工具 Ollama 使用指南:技巧与问题解决全攻略
50组多风格提示词,全面测评Midjourney V7生图效果!
Deepseek 突破 AI 训练烧钱魔咒:1.2 万美元 1/525 成本 MT-Bench 跑分媲美 GPT-4o
斯坦福2025 AI指数出炉!中美AI对决差距仅剩0.3%,DeepSeek领衔
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
AI设计
Anthropic
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
模态
苹果
AI视频
驾驶
文本
搜索
xAI
人形机器人
Copilot
大语言模型
神器推荐
LLaMA
字节跳动
具身智能
Claude
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
架构