SOTA

一秒十图！英伟达MIT联手刷新SOTA，一步扩散解锁实时高质量可控图像生成

扩散生成模型通常需要50-100次迭代去噪步骤，效率很低，时间步蒸馏技术可以极大提高推理效率，「基于分布的蒸馏」方法，如生成对抗网络GAN及其变分分数蒸馏VSD变体，以及「基于轨迹的蒸馏方法」（如直接蒸馏、渐进蒸馏、一致性模型）可以实现10-100倍的图像生成加速效果。但仍然存在一些关键难点，比如基于GAN的方法由于对抗动态的振荡特性和模式坍塌问题，训练过程不稳定；基于VSD的方法需要联合训练一个额外的扩散模型，增加了计算开销；一致性模型虽然稳定，但在极少数步骤（例如少于4步）的情况下，生成质量会下降。如何开发一个能够兼顾效率、灵活性和质量的蒸馏框架成了模型部署的关键。

4/1/2025 5:10:00 AM

新智元

耗时一年半！谷歌新定义具身通用最强SOTA，轰动硅谷！物理世界的原生推理能力、灵活性让人惊掉下巴！网友：亿些震撼！

出品 | 51CTO技术栈（微信号：blog51cto）想知道世界SOTA级别的模型用在物理世界中有多震撼吗？ Google DeepMind做了一件破天荒的事情。大模型自爆火以来，已经过去两年多，但在物理世界中真正能转化为机器人行为，还是一个世界级难题。

3/13/2025 1:37:14 PM

云昭

DiffUCD：扩散模型助力无监督高光谱变化检测，超越SOTA，逼近监督方法！

一眼概览DiffUCD 提出了一种创新的无监督高光谱影像变化检测（HSI-CD）方法，利用语义相关性扩散模型（SCDM）和跨时间对比学习（CTCL），在无需标注的情况下提高检测精度，在多个基准数据集上超越现有方法。核心问题高光谱影像变化检测（HSI-CD）旨在识别同一区域在不同时刻的地表变化。然而，受限于以下挑战：• 现有方法依赖大量标注数据，而高质量的人工标注成本高昂。

3/3/2025 5:00:00 AM

萍哥学AI

机器之心升级「SOTA！模型」资源站，万余模型覆盖千余AI任务

机器之心于2022年第一季度推出新版「SOTA 模型」资源站。作为专注服务中国开发者的第三方平台，该站点在对每日学界、业界最新的SOTA工作进行追踪的同时，汇总了原作团队、社区用户所放出的模型文件、实现代码、数据集等开发资源，帮助用户快速上手尝试新技术。当前新版「SOTA！模型」已收录超过15000个模型资源，覆盖超过1000个AI任务。用户可通过「检索模型」功能基于模型资源所适配的硬件类型、计算平台、框架及模型规模等维度高效查询。作为专业的人工智能信息平台，机器之心于2019年9月发布了首版「SOTA 模型」项

8/5/2022 5:22:00 PM

机器之心

「Pop SOTA！List for AI Developers 2021」社区评价 TOP 128 价值工作完整名录发布！

2022 年初，我们对 2021 年度发布于 arXiv 的「SOTA」AI 论文进行了一轮分析，试图找到 2021 年度，对 AI 开发者最具价值的「Pop SOTA！」工作。但面对超过 2 万篇的「SOTA」工作，我们产生了疑惑 —— 自称「SOTA」的工作就一定是先进的吗？对广大 AI 开发者来说，什么样才是先进的技术工作？是思路具有启发性？还是跑出的实验分数高？是易于实现，对数据资源、计算资源的需求可控？还是放出的代码实现即插即用，可用性强？

1/27/2022 2:05:00 PM

SOTA模型

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练