AppAgent
DeepSeek的最佳用法?西湖大学发布可以自主进化的手机智能体AppAgentX
背景介绍近年来,大语言模型(LLM) 的快速发展正推动人工智能迈向新的高度。 像 DeepSeek-R1 这样的模型因其强大的理解和生成能力,已经在 对话生成、代码编写、知识问答 等任务中展现出了卓越的表现。 如今,LLM 的应用范围正进一步拓展,催生了一类新的智能体 —— 基于 LLM 的 GUI 智能体(GUI Agents),它们能够像人类一样,直接通过鼠标、键盘与计算机或手机进行交互。
大模型竟然能玩手机了,还能用软件修图:「AppAgent」会成为2024年的新趋势吗?
这就是2024年的新趋势吗?近日,一项名为 AppAgent 的创新技术引起了广泛关注。简单来说,AppAgent 的智能代理能力可以用于操作任何 App,它在 50 个复杂手机任务上展示了强大的能力。AppAgent 幕后团队来自腾讯,相关技术论文也已经公布。论文地址::,这项技术通过引入一种基于大型语言模型(LLMs)的多模态智能代理(Agent)框架,赋予了智能体操作智能手机应用的能力。与传统的智能助手如 Siri 不同,AppAgent 不依赖于系统后端访问,而是通过模拟人类的点击和滑动等操作,直接与手机应
- 1