Magma
微软开源多模态AI Agent “Magma”:为购物和机器人操作带来新体验
微软在其官网上正式发布了多模态 AI Agent 基础模型 “Magma”,并进行了开源。 这一新兴技术相较于传统的智能助手,展现出了更为强大的多模态能力,能够处理图像、视频、文本等多种数据形式,打破了数字与物理世界之间的壁垒。 Magma 不仅可以帮助用户在电商平台上自动下单,查询天气等日常事务,还能与实体机器人协作,执行更复杂的操作。
微软开源全新多模态 AI Agent “Magma”:可自动下单与行为预测
近日,微软在其官网正式开源了一款名为 “Magma” 的多模态 AI Agent 基础模型。 这款新型人工智能具有跨越数字和物理世界的能力,能够同时处理图像、视频、文本等多种数据类型。 与传统的 AI 助手相比,Magma 的独特之处在于其心理预测功能,使其能够更加准确地理解视频中人物或物体的意图及未来行为。
微软团队推多模态AI模型Magma:整合视觉、语言和动作决策技能
近日,微软研究团队联合多所高校的研究人员,发布了一款名为 “Magma” 的多模态 AI 模型。 这款模型的设计旨在处理和整合图像、文本和视频等多种数据类型,以便在数字和物理环境中执行复杂任务。 随着科技的不断进步,多模态 AI 代理正在被广泛应用于机器人技术、虚拟助手和用户界面自动化等领域。
- 1