技术
中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术
来自国内的光电混合芯片技术,登上最新顶刊Nature! 这次的成果主要聚焦在了自主研发的光子计算处理器——PACE(Photonic Arithmetic Computing Engine)。 简单来说,PACE是一种基于光电混合的架构,它通过光执行矩阵向量乘法,可以实现超低延迟和高能效的计算。
4/15/2025 9:24:00 AM
量子位
手机实现GPT级智能,比MoE更极致的稀疏技术:省内存效果不减|对话面壁&清华肖朝军
在大模型争霸的时代,算力与效率的平衡成为决定胜负的关键。 端侧部署一直是大模型落地的最后一公里,却因算力瓶颈困难重重。 面壁智能和清华走出了一条与MoE不同的路径——神经元级稀疏激活,让模型在保持性能的同时大幅降低资源消耗。
4/14/2025 8:30:00 AM
量子位
最新版Spring Ai实践
深入探索 Spring AI 1.0.0-M6在人工智能与软件开发深度融合的时代,Spring AI 作为一个强大的框架,持续为开发者提供着高效且便捷的工具,以实现与大语言模型(LLM)的无缝交互。 Spring AI 的最新版本引入了一系列令人瞩目的特性,其中 Function Calling 到 Tool Calling 的转换以及模型上下文协议(MCP)的应用,标志着该框架在 AI 集成领域的又一次重大飞跃。 聊天接口示例在今天的内容之前我们回一下如何使用SpringAI实现一个简单的聊天接口,使用千问API实现聊天功能:添加依赖复制配置复制实现复制当进行下面的提问时:现在北京时间几点了?
4/14/2025 2:25:00 AM
动态场景,开放文本查询!清华哈佛联合建模4D语言场 | CVPR 2025
构建支持开放词汇查询的语言场在机器人导航、3D场景编辑和交互式虚拟环境等众多应用领域展现出巨大的潜力。 尽管现有方法在静态语义场重建方面已取得显著成果,但如何建模4D语言场(4D language fields)以实现动态场景中时间敏感且开放式的语言查询,仍面临诸多挑战,动态世界的语义建模对于推动许多实际应用的落地至关重要。 近日,来自清华大学、哈佛大学等机构的研究团队提出了一种创新方法4D LangSplat,基于动态三维高斯泼溅技术,成功重建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。
4/3/2025 10:12:30 AM
新智元
OCR技术选型:数据提取哪家强?
数据是企业运营的核心资产之一。 然而,超过 85% 的商业信息以非结构化数据的形式存在,如电子邮件、报告、发票和合同等,这给计算机处理带来了极大挑战。 为解决这一问题,光学字符识别(OCR)技术(Mistral OCR:文档处理领域的革新者)应运而生。
4/2/2025 4:00:00 AM
大模型之路
“计算机视觉被GPT-4o终结了”(狗头)
一夜之间,CV被大模型“解决”了(狗头)。 万物皆可吉卜力之后,GPT-4o原生多模态图像生成更多玩法被开发出来。 一个男友回头表情包,可以秒变语义分割图。
3/31/2025 8:44:00 AM
量子位
Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光
AI的性能愈发强大,一个新模型可能前一天还是SOTA(最佳模型),第二天就被拍了下去。 不过,这些强大的AI上空总有一团迷雾笼罩。 那就是:他们到底是怎么找到答案的?
3/31/2025 8:30:00 AM
新智元
LLM中的分块技术:原理、应用与展望
在大语言模型(LLM)飞速发展的当下,分块技术(Chunking)(RAG 中的分块策略:从基础到前沿的全面剖析)作为提升模型性能的关键手段,受到了广泛关注。 它在优化信息处理、提高检索效率、增强模型理解能力等方面发挥着不可或缺的作用。 深入探究 LLMs 中的分块技术,对于推动自然语言处理(NLP)领域的发展具有重要意义。
3/27/2025 2:50:00 AM
大模型之路
一文详尽大型语言模型的四种量化技术
大型语言模型(比如ChatGPT背后的技术)确实非常"庞大"——这不仅指它们的能力,更直接体现在它们的体积上。 一个中等规模的模型就可能占用几十GB的内存,相当于几百部高清电影的大小。 对于普通开发者、个人研究者或初创公司来说,这样的资源需求无疑是一道难以跨越的门槛。
3/27/2025 2:44:00 AM
云朵君
关于人工智能技术学习与应用心得
最近一年多来开始转行做人工智能,从刚开始一点都不懂的小白到现在对人工智能有了初步的认识;中间过程可以说是相当不容易。 因此,经过这段时间的应用和学习,也慢慢有了一点心得体会,因此在此记录一下。 人工智能心得体会关于什么是人工智能,什么是机器学习,什么是神经网络,什么是大模型,以及各种模型架构在这里就不说了;在前面的文章中已经不止一次的讲述过以上内容。
3/26/2025 12:00:00 AM
DFires
揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍
现在,PD分离已经成为兵家必争之地。 前有Mooncake/DeepSeek等公司采用这种技术来优化大模型的推理服务,后有Nvidia/PyTorch基于该技术孵化下一代LLM服务系统。 甚至最近,黄仁勋也在2025 GTC的舞台上提到了PD分离(Prefill-Decode Disaggregation)技术,进一步证明了这一技术获得的广泛关注。
3/20/2025 9:00:00 AM
新智元
15个Cursor AI功能,让你省去50%的编码时间!
经过长期的探索与实践,这里总结出15个Cursor AI的高效使用技巧。 不管你是初次尝试Cursor AI的新手,还是希望进一步提升技能的老手,下面这些方法都能帮你更高效地利用这一革命性的工具,真正释放它的强大潜力。 无缝 VS Code 迁移从VS Code切换到Cursor很简单:导航至光标设置 常规 帐户查找 "从 VS 代码导入 "选项点击并确认image.png虽然习惯难以改变,但当你熟悉Cursor后,或许会发现它独特的功能明显胜出旧版的VS Code,带来更流畅的开发体验。
3/17/2025 12:00:00 AM
dev
无缝切换,实现多厂家大模型高效对接
1、问题介绍在 AI 技术迅猛发展的今天,越来越多的研发同学面临着众多大模型选型的挑战。 随着业务需求的多样化,大家希望能够逐一对比和探索不同的大模型,以便选择最适合的解决方案。 然而,不同模型的对接方式各异,请求格式、参数解析也各不相同,这给开发者带来了不小的困扰。
3/14/2025 9:02:03 AM
架构精进之路
腾讯混元-TurboS:首个混合Transformer-Mamba MoE超大模型来了
腾讯混元团队发布了他们最新的力作——Hunyuan-TurboS,首个混合Transformer-Mamba MoE架构的超大模型大家都知道,传统Transformer模型在处理长文本时一直面临挑战,O(N²)的复杂度以及KV-Cache问题让长文本训练和推理效率大打折扣。 而这次,混元-TurboS巧妙地融合了Mamba和Transformer两种架构的优势:• Mamba的高效长序列处理能力• Transformer强大的上下文理解能力强强联合,效果自然惊艳! 官方数据显示,Hunyuan-TurboS在多个关键benchmark上表现出色:• 数学、推理、对齐能力超越或持平 GPT-4o-0806、DeepSeek-V3 以及各类开源模型。
3/11/2025 9:42:00 AM
AI寒武纪
世界首个人类脑细胞计算机诞生!能编程还能活体计算,售价3万5美金
就在刚刚,世界上第一台「合成生物智能」生物计算机诞生了! Cortical lab推出的这款计算机,是由人类神经元直接集成到硅芯片上,可以编程和自适应,甚至还能活体计算。 合成生物智能,再次创造奇迹。
3/10/2025 8:52:00 AM
新智元
C#+AI暴力变现:自动生成小红书爆款笔记,单账号月流水破10万源码解析
在数字化营销与内容创作深度融合的当下,利用技术手段实现高效内容产出与商业变现成为众多从业者关注的焦点。 C# 语言与AI技术的结合,为小红书爆款笔记的自动生成提供了有力支持,通过构建多平台矩阵运营,实现了单账号月流水破10万的惊人收益。 本文将深入解析其中的技术细节、多平台运营策略及收益数据背后的逻辑。
3/10/2025 1:07:13 AM
conan
风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025
近年来,随着扩散模型的发展,风格迁移技术在文本引导的图像生成任务中取得了显著突破。 然而,尽管现有方法可以实现优秀的风格化效果,但其对文本信息的精准控制仍存在明显不足,大多数方法在融合风格图像与文本描述时,往往会让生成结果过度依赖参考风格图像,导致对文本内容的响应能力下降。 「风格主导的失衡问题」使得用户在输入文本提示时难以精准控制图像的颜色、结构或其他细节属性,还可能引入不稳定因素,例如棋盘格效应,进一步限制了其实用性。
3/7/2025 8:50:00 AM
新智元
图灵奖颁给强化学习师徒,一个造船改行写代码,一个痛批AI投身AGI
计算机最高奖图灵奖揭晓! 强化学习先驱Andrew Barto与Richard Sutton共同获奖,他们被评价为“引领基础AI技术开发的研究人员”。 值得一提的是,两位是师徒关系,Richard Sutton是Andrew Barto他第一位博士生。
3/6/2025 10:07:00 AM
量子位
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
全日程揭晓!ICLR 2025论文分享会我们北京见
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
AI视频
模态
驾驶
文本
人形机器人
xAI
搜索
大语言模型
Copilot
Claude
字节跳动
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练