SOTA
一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成
扩散生成模型通常需要50-100次迭代去噪步骤,效率很低,时间步蒸馏技术可以极大提高推理效率,「基于分布的蒸馏」方法,如生成对抗网络GAN及其变分分数蒸馏VSD变体,以及「基于轨迹的蒸馏方法」(如直接蒸馏、渐进蒸馏、一致性模型)可以实现10-100倍的图像生成加速效果。 但仍然存在一些关键难点,比如基于GAN的方法由于对抗动态的振荡特性和模式坍塌问题,训练过程不稳定;基于VSD的方法需要联合训练一个额外的扩散模型,增加了计算开销;一致性模型虽然稳定,但在极少数步骤(例如少于4步)的情况下,生成质量会下降。 如何开发一个能够兼顾效率、灵活性和质量的蒸馏框架成了模型部署的关键。
4/1/2025 5:10:00 AM
新智元
耗时一年半!谷歌新定义具身通用最强SOTA,轰动硅谷!物理世界的原生推理能力、灵活性让人惊掉下巴!网友:亿些震撼!
出品 | 51CTO技术栈(微信号:blog51cto)想知道世界SOTA级别的模型用在物理世界中有多震撼吗? Google DeepMind做了一件破天荒的事情。 大模型自爆火以来,已经过去两年多,但在物理世界中真正能转化为机器人行为,还是一个世界级难题。
3/13/2025 1:37:14 PM
云昭
DiffUCD:扩散模型助力无监督高光谱变化检测,超越SOTA,逼近监督方法!
一眼概览DiffUCD 提出了一种创新的无监督高光谱影像变化检测(HSI-CD)方法,利用 语义相关性扩散模型(SCDM) 和 跨时间对比学习(CTCL),在无需标注的情况下提高检测精度,在多个基准数据集上超越现有方法。 核心问题高光谱影像变化检测(HSI-CD)旨在识别同一区域在不同时刻的地表变化。 然而,受限于以下挑战:• 现有方法依赖大量标注数据,而高质量的人工标注成本高昂。
3/3/2025 5:00:00 AM
萍哥学AI
机器之心升级「SOTA!模型」资源站,万余模型覆盖千余AI任务
机器之心于2022年第一季度推出新版「SOTA 模型」资源站。作为专注服务中国开发者的第三方平台,该站点在对每日学界、业界最新的SOTA工作进行追踪的同时,汇总了原作团队、社区用户所放出的模型文件、实现代码、数据集等开发资源,帮助用户快速上手尝试新技术。当前新版 「SOTA!模型」已收录超过15000个模型资源,覆盖超过1000个AI任务。用户可通过「检索模型」功能基于模型资源所适配的硬件类型、计算平台、框架及模型规模等维度高效查询。作为专业的人工智能信息平台,机器之心于2019年9月发布了首版「SOTA 模型」项
8/5/2022 5:22:00 PM
机器之心
「Pop SOTA!List for AI Developers 2021」社区评价 TOP 128 价值工作完整名录发布!
2022 年初,我们对 2021 年度发布于 arXiv 的「SOTA」AI 论文进行了一轮分析,试图找到 2021 年度,对 AI 开发者最具价值的「Pop SOTA!」工作。但面对超过 2 万篇的「SOTA」工作,我们产生了疑惑 —— 自称「SOTA」的工作就一定是先进的吗?对广大 AI 开发者来说,什么样才是先进的技术工作?是思路具有启发性?还是跑出的实验分数高?是易于实现,对数据资源、计算资源的需求可控?还是放出的代码实现即插即用,可用性强?
1/27/2022 2:05:00 PM
SOTA模型
- 1
资讯热榜
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型
上海AI实验室开源InternVL3系列多模态大型语言模型
50组多风格提示词,全面测评Midjourney V7生图效果!
全日程揭晓!ICLR 2025论文分享会我们北京见
斯坦福2025 AI指数出炉!中美AI对决差距仅剩0.3%,DeepSeek领衔
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
AI设计
Anthropic
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
模态
AI视频
驾驶
文本
xAI
搜索
人形机器人
大语言模型
Copilot
神器推荐
LLaMA
字节跳动
具身智能
Claude
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练