资讯列表
空间智能新进展:教机器人组装宜家家具,首次实现操作步骤与真实视频对齐
斯坦福吴佳俊团队,给机器人设计了一套组装宜家家具的视频教程! 具体来说,团队提出了用于机器人的大型多模态数据集IKEA Video Manuals,已入选NeurIPS。 数据集涵盖了6大类IKEA家具,每种家具都包含完整的3D模型、组装说明书和实际组装视频。
吴恩达开源大模型套件:11 个模型平台一种方式调用,已获星标超 1.2K
它把 11 家知名大模型平台集中到了一起,统一了接口,可以用相同的方式调用不同模型。切换模型时,只需要改动一个字符串,不用在不同的 API 之间摸不着头脑了。
AI 写好代码自己发 Github:人类程序员只需“动嘴”,Claude 化身服务器联通一切
Anthropic 又发大礼包!现在 Claude 自己就是一台服务器。能直连 GitHub,AI 自己写代码、自己创建仓库、Push 代码、创建 Issue、创建分支、创建 PR 一条龙服务。
AI视频两巨头开战!Runway秒生现实大片,Luma动嘴创作电影
几乎同一时间,AI视频再迎来两大重磅更新,这一领域果然是卷到冒烟了。 Runway刚放出图像生成基础模型Frames,让AI生图的质量又提升了一大截。 紧接着还不到半小时,另一巨头Luma也出手了!
炸裂!Anthropic 重磅开源「模型上下文协议」MCP,LLM 应用要变天, AGI真的近了
各位大佬,激动人心的时刻到啦! Anthropic 开源了一个革命性的新协议——MCP(模型上下文协议),有望彻底解决 LLM 应用连接数据难的痛点! 它的目标是让前沿模型生成更好、更相关的响应。
提示词:怎样与大模型沟通
同前面讲大模型特点类似,关于如何使用 GPT,我们也会分成两个视角:用户视角和技术视角。 这一讲,我们先从用户视角来看看如何用好 GPT。 用好 GPT若要充分发挥 GPT 的效用,需遵循以下步骤:首先是定义任务目标。
2025 开发 AI 应用必备 JS 工具库!
本文来分享开发 AI 应用必备的 js 工具库,帮助你更好地迎接 AI 时代的前端开发浪潮。 UI 组件库Ant Design XAnt Design X 是遵循 Ant Design 设计体系的一个 React UI 库,用于构建由 AI 驱动的界面,一键接入智能对话组件与 API 服务。 目前,提供了 13 个用于 AI 应用开发的组件,可以满足很多 AI 场景。
闭环仿真杀器!DrivingSphere:理想提出直接构建高保真4D世界
写在前面&笔者的个人理解近年来,端到端自动驾驶算法取得了重大进展,准确评估这些模型是一项非常紧迫的任务。 为了安全、负责任地进行评估,必须有一个精确的模拟环境,准确反映现实世界的驾驶条件。 这个要求通常包括两个方面:一是高保真传感数据的生成,二是闭环反馈机制的实现。
扩散模型=进化算法!生物学大佬用数学揭示本质
扩散模型居然就是生物的进化算法! 这个结论来自「新常春藤」塔夫茨大学(Tufts University)于近日发表的一项研究:论文地址: Levin,博士毕业于哈佛大学,目前担任塔夫茨大学Allen Discovery Center主任。 Michael Levin长期从事生物电、人工生命和许多其他生物学相关主题的研究,曾在NeurIPS 2018上发表了题为「What Bodies Think About:Bioelectric Computation Outside the Nervous System」的精彩演讲:视频地址: 2020上,Michael Levin还阐述了有关「机器人癌症」的话题:「what the bioelectrics of embryogenesis and regeneration can teach us about unconventional computing, cognition, and the software of life」。
【RAG】浅看引入智能信息助理提升大模型处理复杂推理任务的潜力-AssisTRAG
AssisTRAG通过集成一个智能信息助手来提升LLMs处理复杂推理任务的能力。 该框架由两个主要组件构成:一个冻结的主语言模型和一个可训练的助手语言模型。 AssisTRAG与之前的RAG对比1.
法拉第未来明年年初更换股票代码为 FFAI,官方称全车 AI 化是 FF 和 FX 重点战略
法拉第未来今日发文宣布,公司将在 2025 年年初将纳斯达克股票代码 FFIE 正式更名为 FFAI。官方表示此举符合公司在 AI 战略上的持续聚焦,并进一步明确了 FX 战略所确立的方向。
斯坦福、华盛顿大学与Google DeepMind合作:AI智能体预测人类行为准确率高达85%
11月25日消息,据外媒报道,斯坦福大学、华盛顿大学与Google DeepMind的研究人员携手开发了一种能够逼真模拟人类行为的AI智能体。 研究团队将详细的访谈记录与先进的GPT-4o模型相结合,构建了这一模拟系统。 当用户向智能体提出问题时,系统会加载访谈数据,并促使AI模仿受访者的回答方式。
亚马逊被曝启动“登月”计划:目标部署 10 万颗二代 AI 自研芯片,减少对英伟达依赖
彭博社昨日(11 月 25 日)发布博文,报道称亚马逊为减少对英伟达的依赖,已启动“登月”(moonshot)的计划,希望部署 10 万颗二代自研芯片,挑战行业垄断。
如何在组织中启用机器学习
译者 | 李睿审校 | 重楼计划在组织内部引入人工智能/机器学习的产品经理通常会提出这样一个问题:“我从哪里开始着手? ”对于缺乏该领域经验的组织来说,深入研究人工智能/机器学习可能会让人感到不知所措。 构建机器学习产品需要不同类型的技能和流程,而这些技能和流程需要逐步被吸纳并融入组织的日常运作中。
深入解读大模型应用中台:探索AI实战应用!
写过很多篇关于大数据的文章,它的核心理念:避免数据的重复计算,通过数据服务化,提高数据的共享能力,赋能数据应用。 有小伙伴就问,既然数据中台作为底座基础能力,加工价值数据赋能应用,那么现在最为火爆的AI大模型可以作为底座能力赋能应用吗? 我认为AI大模型完全可以作为基础能力赋能应用。
Babylon.js:如何与3D场景中的物体交互?
图片开发棋类游戏,需要实现鼠标控制棋子的功能,使得游戏能够将鼠标在屏幕上的位置准确地映射到棋盘上的对应落子点。 如果开发的是2D游戏的话,实现就比较简单,鼠标屏幕坐标和棋盘都是二维平面。 就像下图围棋所示,可以根据xy坐标表示鼠标的位置,同时围棋落子点的坐标也可以计算得出xy坐标,这样很轻松地就能实现鼠标位置和围棋落子点坐标的映射和距离比较。
解读GraphRAG
RAG 结合了大型语言模型和信息检索模型的力量,允许它们用从大量文本数据中提取的相关事实和细节来补充生成的响应。 事实证明,这种方法在提高模型输出的实际准确性和总体质量方面是有效的。 图片然而,随着 RAG 系统得到更广泛的采用,它们的局限性开始浮出水面,具体而言:平面检索: RAG 将每个文档作为一个独立的信息。
十倍开发者与AI:科技精英程序员会被取代吗?
顶尖开发人员将与现在看起来大不相同。 公司需要改变他们对高绩效开发团队的看法。 译自The 10x Developer vs.