视频理解
PVUW视频分割Workshop@CVPR 2025 | 征稿!比赛!
第四届真实世界下的像素级视频理解挑战赛(The 4th PVUW challenge)主页/Call for Paper::复杂场景视频目标分割挑战赛(MOSE Challenge):参赛、数据集下载::基于动作描述的指向性视频分割挑战赛(MeViS Challenge):参赛、数据集下载: 真实世界下的像素级视频理解(Pixel-level Video Understanding in the Wild, PVUW)挑战赛将于 CVPR 2025 期间在美国田纳西州纳什维尔的 Music City Center 举办。 像素级场景理解是计算机视觉中的核心问题之一,旨在识别图像中每个像素的类别、掩码和语义。 然而,现实世界是动态的,基于视频的,而非静态的图像状态,因此学习进行视频分割对于实际应用来说更为合理和实用。
3/3/2025 4:37:00 PM
新闻助手
- 1
资讯热榜
DeepSeek-V3-0324 悄然发布:技术圈沸腾的低调升级
OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升
万字长文:说清MCP的前世今生+RAGFlow整合应用示例
Google AI Studio 现可通过 ai.dev 域名直接访问
开源实时识别模型RF-DETR: 实时识别画面中的物体,开源可商用
深度拆解!这可能是全网最详细的AI视频创作教程
Sider AI推出Deep Research功能:能自动模拟人类研究行为,还能生成可视化交互式报告
AMD 推出开源项目“GAIA”实现本地大模型高效运行:针对锐龙 AI 300 系列处理器优化,目前仅适用于 Windows
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
机器人
数据
谷歌
大模型
模型
Midjourney
智能
用户
学习
GPT
开源
微软
AI创作
Meta
图像
技术
论文
Stable Diffusion
马斯克
算法
Gemini
蛋白质
生成式
芯片
代码
神经网络
腾讯
英伟达
计算
研究
Sora
AI设计
AI for Science
3D
GPU
机器学习
开发者
场景
华为
Anthropic
预测
伟达
Transformer
模态
深度学习
百度
AI视频
苹果
文本
驾驶
搜索
神器推荐
xAI
人形机器人
Copilot
LLaMA
安全
算力
大语言模型
具身智能
视频生成
应用
科技
字节跳动
干货合集
Claude
2024
视觉
AGI
特斯拉
亚马逊
架构
语音