AI在线 AI在线

Vision-R1:强化学习助力视觉定位,图文模型性能提升 50%

作者:AI在线
2025-04-08 03:01

相关资讯

IBM发布视觉语言模型Granite-Vision-3.1-2B,轻松解析复杂文档

随着人工智能技术的不断发展,视觉与文本数据的融合成为了一项复杂的挑战。 传统的模型往往难以准确解析表格、图表、信息图和图示等结构化视觉文档,这一限制影响了自动内容提取和理解能力,进而影响了数据分析、信息检索和决策等应用。 面对这一需求,IBM 近期发布了 Granite-Vision-3.1-2B,一款专为文档理解设计的小型视觉语言模型。
2/8/2025 4:45:00 PM
AI在线

Apple Intelligence 四月登陆 Vision Pro,加入写作、表情、图像功能

据彭博社记者马克·古尔曼报道,苹果计划最早于四月将 Apple Intelligence 集成至 Vision Pro 头戴设备。 该 AI 套件最初于2024年6月发布,此次将通过 visionOS2.4软件更新引入,预计本周向开发者开放。 就在 Apple Intelligence 于2024年6月首次发布几周后,Gurman 报道称,苹果正寻求将其 AI 工具套件引入 Vision Pro,尽管关于如何重新构想这些工具以实现混合现实体验仍存在一些问题。
2/17/2025 9:34:00 AM
AI在线

​Cohere发布全新多模态AI模型Aya Vision,提供32B和8B两个版本

人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。 该实验室声称,该模型在行业内处于领先地位。 Aya Vision 能够执行多项任务,包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。
3/6/2025 2:54:00 PM
AI在线