MIT
一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成
扩散生成模型通常需要50-100次迭代去噪步骤,效率很低,时间步蒸馏技术可以极大提高推理效率,「基于分布的蒸馏」方法,如生成对抗网络GAN及其变分分数蒸馏VSD变体,以及「基于轨迹的蒸馏方法」(如直接蒸馏、渐进蒸馏、一致性模型)可以实现10-100倍的图像生成加速效果。 但仍然存在一些关键难点,比如基于GAN的方法由于对抗动态的振荡特性和模式坍塌问题,训练过程不稳定;基于VSD的方法需要联合训练一个额外的扩散模型,增加了计算开销;一致性模型虽然稳定,但在极少数步骤(例如少于4步)的情况下,生成质量会下降。 如何开发一个能够兼顾效率、灵活性和质量的蒸馏框架成了模型部署的关键。
4/1/2025 5:10:00 AM
新智元
普特南数赛公布,MIT创5连冠神话!3位00后华人称霸TOP 5
普特南数学竞赛,结果出炉! MIT再次成为全世界的焦点,连续5年夺冠,5位本科生科横扫榜单TOP 5。 其中,有三位00后华人学生。
3/5/2025 9:40:00 AM
新智元
刚刚,AI颠覆物理模拟:一句话精准仿真,学术圈半壁江山联手耗时24个月研究成果
AI视频生成这就过时了吗? 刚刚,最先进的生成式物理引擎Genesis发布,一句话就可以生成完整精确的模拟物理世界。 一滴水滴落到一个啤酒瓶上,然后沿着瓶子表面慢慢滑落。
12/19/2024 1:28:54 PM
405B大模型也能线性化!斯坦福MIT最新研究,0.2%训练量让线性注意力提分20+
生产级大模型应用线性注意力的方法,来了。 线性Attention(包括RNN系列),再也不用困在几B参数的范围内娱乐了。 一套方法,即可线性化现有各种量级的Transformer模型,上至Llama 3.1 405B,也只需要十来张显卡在两天内搞定!
11/21/2024 8:39:08 AM
新智元
MIT 热门研究:AI 工具“带飞”科研,但也严重加速内卷
最近,MIT的一名博士生Aidan Toner-Rodgers历经四年,在AI 科研领域挖掘出一个惊人的结论——AI的参与让科学发现和创新迈上了新台阶,却也意外拉大了科研人员之间的“能力鸿沟”。 在这项实验里,AI的加持让专利申请量像火箭一样蹿升了39%,产品创新数量也提升了17%。 但这项技术的助力却并非人人受益,反倒在科研圈引发了不小的焦虑。
11/18/2024 2:29:00 PM
刘洁
教授何恺明在MIT的第二门课——《深度生成模型》,讲座PPT陆续已出
又有机会跟着大神学习了! 今年 2 月起,何恺明已经开始了自己在 MIT 的副教授职业生涯,并在 3 月 7 日走上讲台完成了「人生中教的第一堂课」。 近日,我们发现了何恺明的第二门课程《深度生成模型》(6.S978: Deep Generative Models),已经于 9 月初开始了授课。
11/10/2024 4:00:00 PM
机器之心
每年能省200万美元,没有爱思唯尔,MIT过得还不错
继 2020 年与爱思唯尔谈判破裂后,MIT 蹚出了一条不受大型期刊订阅裹挟的全新路线,每年能节省 200 万美元。对于高校而言,期刊的订阅费用向来是一笔庞大的开支。特别是订阅像爱思唯尔这种全球顶级出版集团的期刊的费用。众所周知,爱思唯尔是世界上最大的医学和其他科学文献出版社之一,我们所熟知的知名学术期刊《柳叶刀》和《细胞》都由爱思唯尔出版。但是,在为作者和读者提供便利的同时,爱思唯尔的订阅费用却始终居于高位,不可避免地给高校等科研机构带来了沉重的财政负担。此外,爱思唯尔以封闭期刊为主的出版性质也不符合科学界所倡导
8/21/2024 2:33:00 PM
机器之心
- 1
资讯热榜
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型
上海AI实验室开源InternVL3系列多模态大型语言模型
50组多风格提示词,全面测评Midjourney V7生图效果!
全日程揭晓!ICLR 2025论文分享会我们北京见
斯坦福2025 AI指数出炉!中美AI对决差距仅剩0.3%,DeepSeek领衔
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
AI设计
Anthropic
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
模态
AI视频
驾驶
文本
xAI
搜索
人形机器人
大语言模型
Copilot
神器推荐
LLaMA
字节跳动
具身智能
Claude
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练