旋转多尺度交互网络
只需1080ti,即可在遥感图像中对目标进行像素级定位!代码数据集已开源!
太长不看版这篇论文介绍了一项新的任务 —— 指向性遥感图像分割(RRSIS),以及一种新的方法 —— 旋转多尺度交互网络(RMSIN)。RRSIS 旨在根据文本描述实现遥感图像中目标对象的像素级定位。为了解决现有数据集规模和范围的限制,本文构建了一个新的大规模 RRSIS 数据集(RRSIS-D),其中涵盖了多种空间分辨率的图像和具有尺度和角度多样性的分割目标(已公开!)。同时还提出了多尺度交互模块和旋转卷积(已开源!),以处理遥感图像的复杂性。实验证明,RMSIN 方法在 RRSIS 任务上表现优于当前最先进的方
1/5/2024 7:00:00 PM
机器之心
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
机器人
谷歌
大模型
Midjourney
模型
智能
用户
学习
GPT
开源
微软
AI创作
图像
Meta
技术
论文
Stable Diffusion
马斯克
算法
生成式
蛋白质
Gemini
芯片
代码
神经网络
腾讯
计算
研究
Sora
AI设计
英伟达
3D
AI for Science
GPU
开发者
机器学习
场景
预测
华为
Anthropic
伟达
Transformer
模态
百度
深度学习
AI视频
驾驶
文本
苹果
搜索
神器推荐
LLaMA
算力
xAI
Copilot
人形机器人
安全
科技
视频生成
应用
字节跳动
具身智能
干货合集
2024
视觉
大语言模型
AGI
特斯拉
Claude
亚马逊
语音
AI应用场景