影像
零样本 | ZAPS:零样本扩散采样,3倍加速逆问题重建,重塑高效影像修复新范式
一、 一眼概览ZAPS(Zero-Shot Approximate Posterior Sampling)是一种针对扩散模型(Diffusion Models, DMs)在逆问题(Inverse Problems)中的高效采样方法。 它利用零样本学习(Zero-Shot Learning)进行自适应超参数优化,使得扩散采样步骤固定,同时提高重建质量并减少推理时间。 二、核心问题当前的扩散模型在解决逆问题(如去模糊、修复、超分辨率)时,存在以下挑战:需要大量的采样步骤,导致推理速度慢;现有的噪声调度策略(Noise Schedule)在逆问题场景下难以直接适用;传统方法使用手动调整的对数似然权重(Log-Likelihood Weights),不够鲁棒,容易导致次优解。
2/8/2025 11:12:34 AM
萍哥学AI
“一超多能”年度高端旗舰,vivo X200系列正式发布
10月14日,全新一代vivo X200系列旗舰手机在国家游泳中心(水立方)发布。作为重磅登场的国产旗舰系列,vivo X200系列首次集齐全面升级的四大vivo蓝科技,带来“一超多能”年度旗舰手机。vivo X200 Pro搭载Ultra同款蔡司2亿APO超级长焦并升级自研大模型画质增强算法,蔡司大底T*主摄采用vivo与索尼联合定义全新一代图像传感器蓝图x索尼LYT-818,实现移动影像能力的“超级”进化。
10/14/2024 11:07:00 PM
新闻助手
武大等开源大幅面高清卫星影像数据集:涵盖 21 万 + 地理目标,复杂地理空间场景知识精准生成
AI 卫星影像知识生成模型数据集稀缺的问题,又有新解了。来自武汉大学、上海 AI 实验室、西工大等 9 家机构共同推出了该领域的大型数据集,涵盖了 21 万个地理目标和 40 万个目标-关系三元组。而且像机场、港口、立交桥等这样复杂地理空间场景,也都包括在了数据集当中。具体来说,该数据集名为 RSG,主要面向卫星影像中的目标检测(OBD)和场景图生成(SGG)任务。SGG 有助于促进模型对地理空间场景从感知到认知的智能理解,但一直缺乏大幅面、超高分辨率的卫星影像数据。而 RSG 的出现很好地填补了这一空白,一同提出
6/21/2024 1:28:04 PM
汪淼
重新定义Ultra标准,vivo X100系列新品正式发布
5 月 13 日,vivo X100 系列新品三舰齐发,宣布与蔡司签署全新的联合研发扩展协议,以自研和共研并行的开放体系,与蔡司共同探索移动影像新高度。同时推出了蓝图影像,在 X100 系列上市的蓝图影像专属于 vivo|蔡司联合研发产品线,代表了 vivo 影像在关键场景的认知与积累。vivo 已经连续三年稳坐国产手机销量第一。今年 Q1,vivo 持续保持了第一成绩,满分旗舰 X100 系列功不可没。在 vivo X100、vivo X100 Pro 持续热销收获好口碑之时,vivo 此次升级发布了 vivo
5/14/2024 1:59:00 PM
新闻助手
美图携手ACM Multimedia 2022举办第四届PIC竞赛 聚焦美妆场景
2022年7月1日,美图影像研究院(MT Lab)联合北京航天航空大学、中国人民大学在ACM国际多媒体会议(ACM International Conference on Multimedia, ACM MM)上主办的第四届Person in Context(PIC)竞赛圆满收官。 此次PIC竞赛因其前沿性和实用性吸引了来自清华大学、北京大学、上海交通大学、香港大学、中国科学技术大学等知名高校,以及腾讯、京东、小米、bilibili等知名企业共58支队伍报名参赛,参赛人数再创新高。竞赛共分设三个赛道,涵盖视频内容时
6/25/2023 5:58:00 PM
美图影像研究院
美图影像节发布7款影像生产力工具,推出懂美学的视觉大模型
6月19日,美图公司举办以“AI时代的影像生产力工具”为主题的第二届影像节,现场发布7款新品:AI视觉创作工具WHEE;AI口播视频工具开拍;桌面端AI视频编辑工具WinkStudio;主打AI商业设计的美图设计室2.0;AI数字人生成工具DreamAvatar;美图AI助手RoboNeo;美图视觉大模型MiracleVision。 全面提供从生活场景到生产力场景影像服务的同时,美图公布了最新的VIP会员数量,截至6月18日,美图全球VIP会员数为719万。 美图公司创始人、董事长兼首席执行官吴欣鸿介绍说:“过去美
6/25/2023 5:57:00 PM
美图影像研究院
vivo影像战略发布,新一代自研影像芯片及多项新技术亮相
2022 年 10 月 24 日,vivo 影像战略发布会正式召开。会上,vivo 盘点了之前在影像理念上的坚持,即通过专业化的能力还原眼之所见,超越眼之所见,并将专业影像技术赋能每一个人,持续为消费者提供人性化的专业影像体验。vivo 的影像技术矩阵也在此次影像战略发布会正式公布:围绕“三个比肩”,坚持联合创新和自主创新两大战略支点,在日趋同质化的影像赛场中创造竞争优势,力求在移动影像赛道上筑起技术壁垒,并保持持续领先。 vivo 影像副总裁于猛vivo 影像副总裁于猛、vivo 影像产品高级总监李卓、蔡司消费光
10/24/2022 3:32:00 PM
新闻助手
达摩院发布AI遥感分析云平台,助力提升地球科学研究效率
3月3日,达摩院发布AI Earth地球科学云平台,平台集成了PB级开源卫星遥感数据、十余种遥感AI算法、云端高性能计算和存储资源,助力研究者开展农业灾害分析、气候变化分析、水体水质分析等科研工作。卫星遥感影像是人类对地观测的重要信息来源,但获取、处理以及分析应用卫星遥感数据的链路较长、成本较高。研究人员需要向卫星数据运营机构申请获取数据或者下载行业公开数据,在本地计算机存储配置后才能进行数据分析。而分析环节对机器的计算和存储资源要求较高,普通计算机无法满足大规模影像数据分析的需求。另外,现有分析方法自动化程度低、
3/3/2022 4:34:00 PM
新闻助手
- 1
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
韩国初创公司 RLWRLD 获 1480 万美元融资,致力于机器人基础模型开发
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
AI视频
模态
人形机器人
驾驶
xAI
文本
搜索
字节跳动
大语言模型
Copilot
Claude
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练