Agent

面壁智能完成新一轮数亿元融资,继续面向AGI的高效大模型征程

近日,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。本轮融资完成后,面壁智能将进一步推进优秀人才引入,加固大模型发展的底层算力与数据基础,持续引领「高效大模型」路线,推动大模型高效训练、快步应用落地。本轮由光源资本担任独家财务顾问。依托于扎实的原创性AI技术底蕴,面壁智能是世界范围内对「高效大模型」探索最为前列的大模型团队之一,目前已完成了贯彻高效训练、高效落地与高效推理的大模型全栈技术生产线布局。核心研发团队脱胎于清华NLP实验室,拥有中国

定位“神队友”,谷歌发布 SIMA 模型:具备约 600 项游戏技能

谷歌 DeepMind 团队近日发布了 SIMA 模型,通过训练和学习游戏技能,让其整体操作风格更接近于人类。SIMA 的全称是“Scalable, Instructable, Multiworld Agent”(可扩展、可指导、多世界 Agent),目前仅处于研究阶段,未来可以和你一起玩游戏。SIMA 的定位并非是游戏中的 AI NPC,而是要成为你的队友,默契配合你的操作。SIMA 结合自然语言和图像识别技术,能够理解 3D 游戏世界,希望能成为玩家的默契队友。谷歌与 Hello Games、Embracer、

从框架到经典方法,全面了解分布式深度强化学习DDRL

本文在回顾分布式深度强化学习 DDRL 基本框架的基础上,重点介绍了 IMPALA 框架系列方法。AlphaGo 是一个在人机博弈中赢得众多职业围棋手的 agent 机器人。随着 AlphaGo 的突破,深度强化学习(Deep Reinforcement Learning,DRL)成为一种公认的解决连续决策问题的有效技术。人们开发了大量算法来解决介于 DRL 与现实世界应用之间的挑战性问题,如探索与开发困境、数据低效、多 agent 合作与竞争等。在所有这些挑战中,由于 DRL 的试错学习机制需要大量交互数据,数据

数智上海 2023 峰会 | 通用、垂直、AI Agent,大模型是如何拥抱千行百业应用场景的?

由于通用大模型的泛化特性,它很难在落地行业场景中精准满足用户需求。让通用大模型学习行业知识和行业语料成为行业大模型,再进一步学习业务知识和专业领域工具演进为场景大模型,是当前大模型落地应用的关键路径。未来,AI Agent 的产品形式被越来越多地认为是大模型的进化方向,是赋能各行各业的高效生产力工具。通用大模型性能如何保障?如何架构行业垂直大模型?AI Agent 落地前景?数智上海 2023 峰会上,最具代表性的产学一线嘉宾围绕大模型演进过程,带来了前沿分享。以「智能创新赋能产业数字化转型」为主题,数智上海 20

面壁智能ChatDev火遍全球,GitHub星标超1.2万

ChatDev 又双叒叕霸榜了 GitHub Trending,开源仅 6 周星标数已超 1.2 万!这一由面壁智能(ModelBest)联合清华大学 NLP 实验室共同开发的大模型全流程自动化软件开发框架,火遍全球,吸引国内外软件开发和创业者成为“自来水”。谷歌 DeepMind 大模型产品负责人 Bailey、资深数据科学家 Sanyam Bhutani等对 ChatDev 强大的自动开发软件功能及其背后的大模型群体智能技术进行了详细解读。DeepMind 大模型产品负责人 Bailey 的推特截图资深数据科学

我为什么放弃了 LangChain?

如果你关注了过去几个月中人工智能的爆炸式发展,那你大概率听说过 LangChain。简单来说,LangChain 是一个 Python 和 JavaScript 库,由 Harrison Chase 开发,用于连接 OpenAI 的 GPT API(后续已扩展到更多模型)以生成人工智能文本。更具体地说,它是论文《ReAct: Synergizing Reasoning and Acting in Language Models》的实现:该论文展示了一种提示技术,允许模型「推理」(通过思维链)和「行动」(通过能够使用