数据
阶跃公开了自家新型注意力机制:KV缓存消耗直降93.7%,性能不减反增
随着当前大语言模型的广泛应用和推理时扩展的新范式的崛起,如何实现高效的大规模推理成为了一个巨大挑战。 特别是在语言模型的推理阶段,传统注意力机制中的键值缓存(KV Cache)会随着批处理大小和序列长度线性增长,俨然成为制约大语言模型规模化应用和推理时扩展的「内存杀手」。 虽然业界已有 MQA、GQA、MLA 等多种注意力机制变体试图解决这一问题,但这些方案要么难以在严格的显存限制下保持理想性能,要么在模型结构上引入额外复杂度,带来巨大的工程挑战和生态兼容性问题。
2024诺贝尔化学奖得主:「模型幻觉」给我无限创造力
万万没想到,一直备受批评的AI「幻觉」问题,竟然在科学领域具有极大的应用价值? 就在最近,计算机科学家Amy McGovern表示:「公众认为这完全是坏事。 但实际上,它为科学家提供了新的灵感,让他们得以探索一些原本可能不会想到的思路。
Keras之父创业押注「程序合成」,副业竟能解锁终极AGI!o3预示新拐点
AGI还有另一条新路:深度学习引导的程序合成! 刚刚, Keras之父François Chollet宣布,与Mike Knoop共同创立全新AI实验室Ndea,直奔AGI。 他们将另辟蹊径,聚焦于深度学习引导的程序合成,以构建具有真正的发明、适应和创新能力的AI。
理想汽车提出3DRealCar:首个大规模3D真实汽车数据集!
本文经AIGC Studio公众号授权转载,转载请联系出处。 理想提出3DRealCar,这是第一个大规模 3D 实车数据集,包含 2500 辆在真实场景中拍摄的汽车。 3DRealCar的目标是可以成为促进汽车相关任务的宝贵资源。
Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境
在自然界,「适应」是一种非常普遍的现象。 例如,章鱼能够迅速改变自身的肤色和纹理,以融入周围环境,从而躲避天敌和捕捉猎物;人脑在受伤后能够重新连接自身神经回路,使个体能够恢复失去的功能并适应新的思维方式或行动方式。 生物体展现出的适应能力使得生命能够在不断变化的环境中蓬勃发展。
医疗复杂推理开源大模型——华佗GPT-o1
在医学领域涉及大量复杂的推理过程,从症状分析到疾病诊断,每一步都需要综合考虑众多因素。 例如,在诊断一种罕见疾病时,医生不仅要熟悉各种疾病的症状表现,还要了解患者的病史、家族遗传史、生活环境等多方面信息,通过层层推理才能做出准确的判断。 为了辅助医生实现更高效的推理,香港中文大学(深圳)和深圳市大数据研究院联合开源了专用于医疗领域的复杂大模型——华佗GPT-o1。
谷歌新架构一战成名,打破Transformer记忆瓶颈,姚班校友钟沛林新作
想挑战 Transformer 的新架构有很多,来自谷歌的“正统”继承者 Titan 架构更受关注。 英伟达把测试时间计算(Test-time Computing)称为大模型的第三个 Scaling Law。 OpenAI 把它用在推理(Reasoning),谷歌这次把它用在了记忆(Memory)。
同时提升摄像机控制效率、视频质量,可控视频生成架构AC3D来了
可控的视频生成需要实现对摄像机的精确控制。 然而,控制视频生成模型的摄像机运动(camera control)总是不可避免地伴随着视频质量的下降。 近期,来自多伦多大学、Vector Institute、Snap Research 和西蒙・弗雷泽大学(SFU)的研究团队推出了 AC3D (Advanced 3D Camera Control)。
微软华人团队最新研究:从LLM到LAM,让大模型真正具有「行动力」!
LLM只能针对问题进行回答与分析?这种「隔靴搔痒」的体验也许就要被终结了! 最近,微软推出了一项名为「大型行动模型」(Large Aciton Model,LAM)的创新技术,标志着大模型从语言理解向实际执行任务的转变。 与传统的LLM不同,LAM不仅能理解用户的自然语言指令,还能将这些指令转化为具体的行动步骤,在软件环境中自主执行文档编辑、表格处理等任务。
物理学家发现新型量子粒子!表现介于玻色子费米子之间 | Nature
新型量子粒子出现了,相关论文已经登上Nature。 事情是这样的,美国布朗大学物理学家发现了一类既不属于玻色子,也不属于费米子的新粒子,这种粒子的表现介于两种基本粒子之间,被称为“分数激子”。 研究人员表示,这种新粒子不携带整数电荷,却遵循独特的量子统计规律。
霉霉用中文拜早年!国风年味视频免费生成,可任意切换主角,0帧起手小白友好
新一年,霉霉也来送祝福啦,完全中文版哦。 几十米高的大熊猫爬上了长城。 鱼尾狮成了它把玩的玩具。
三小时输出27个知识点!张朝阳跨年演讲硬核解析生活中的量子力学
“在2025年的前一个小时,我们还在计算,看来2025年是动脑子的一年。 ”2024年12月31日晚上10点,搜狐创始人、董事局主席兼首席执行官、物理学博士张朝阳准时开启2025跨年演讲。 这一次,他以普通人一天的经历生动演绎了量子力学在生活和现代技术中的广泛应用,连续3小时直播分享了现代物理学的支柱之一——量子力学,带来一场别样的科学跨年夜。
直击CES:AI教育群雄逐鹿,中国选手展现硬实力
今年的科技盛宴CES上什么趋势最火? AI智能体当仁不让。 在AI界呼风唤雨的老黄,也将智能体定位了英伟达未来的一大目标。
可灵AI破解电车难题全员无伤!网友:这就是东方智慧吗
大跌眼镜! 经典电车难题就这样被可灵AI解决了? !
突破瓶颈!北航ETH等将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升
将扩散模型量化到1比特极限,又有新SOTA了! 来自北航、ETH等机构的研究人员提出了一种名为BiDM的新方法,首次将扩散模型(DMs)的权重和激活完全二值化。 具体而言,作者们从时间和空间的角度对扩散模型进行了优化:从时间角度来看,引入了“时间步友好二值结构”(TBS),通过可学习的激活二值化器和跨时间步特征连接来应对DMs高度时间步相关的激活特征。
深圳人形机器人街边溜达爆火海外!超自然步态大步流星十几米,“成本10万内、两月后商用”
国产机器人深圳街头散散步,直接火到国外了。 步态、速度、稳定性,方方面面都酷似人类。 而且就这么轻松走出去了十几米,在旁边都是围观群众的情况下。
OpenAI谷歌回收“废旧”视频,UP主外快渠道+1,单笔可赚数千美元
单笔可赚数千美元,UP主也能从OpenAI谷歌那里挣AI的钱了? 一则彭博社的最新爆料登上了Techmeme热榜,引发了内容创作者们的集体热议。 原来OpenAI谷歌等AI公司为了获取更多“独家”视频用于AI训练,现在正纷纷向UP主们重金求购那些“从未公开”的视频。
英伟达迷你超算遭友商嘲讽:宣传FP4算力,实际“不如买个游戏电脑”
老黄在CES上发布的迷你超算Project DIGITS,开启了AI超算的PC时刻。 但随即也引发了不小争议,还遭到了大佬的贴脸嘲讽。 在AMD和英特尔都工作过的芯片设计专家Raja Koduri实名吐槽道:FLOPs除以4,价格翻倍,这就是在CES上stay grounded的秘诀。