资讯列表
AI时代的BBA来了!小鹏P7+18.68万元起售
“全球首款AI汽车”小鹏P7 正式上市发售。 新车共发布三个版本,包括小鹏P7 长续航Max、超长续航Max以及限定版Max,官方指导售价分别为18.68万元、19.88万元以及21.88万元。 其中,小鹏P7 限定版Max提供星阙哑光灰车身配色、扶摇绿限定内饰色、limited edition标识等专属设计,并采用Alcantara定制座椅面料,首批限量发售500台。
AI 背后的原理是什么?如何搭建一个 AI 聊天机器人?
AI无疑是当下最热门的一个话题,不管你是不是做技术,多多少少都听过它,很多人甚至都担心自己的工作会被它取代,那么,AI的背后的原理是什么? 为什么它会这么流行? 这篇文章,我们通过搭建一个简单的聊天机器人来了解 AI背后的秘密。
“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样
在机器人领域,一场关于“通用智能”的探索正如火如荼地展开。 MIT 的何恺明和 Lirui Wang 等人最近成功在“通用数据”上取得了进展,让机器人离拥有“通用大脑”的目标又近了一步。 机器人数据的异质性问题一直是机器人训练的大难题。
一个弹窗整懵Claude,瞬间玩不转电脑了
纳尼? AI Agent容易受到弹幕影响! 甚至比人类更容易。
AI蛋白质诺奖后再登Nature,第一性原理级精度,微软亚研院4年之作
历时四年,微软亚研院AI for Science团队发布AI驱动的从头算(ab initio)生物分子动力学模拟系统。 直接登上Nature正刊。 系统名为AI²BMD,能够高效模拟含有10000多个原子的各种蛋白质,分辨率达到全原子级别,近似达到从头算(第一性原理)的精确度。
谷歌、MIT等开发多智能体医疗决策框架MDAgents,医学LLM新用法
编辑 | 白菜叶基础模型正在成为医学领域的宝贵工具。 然而,尽管它们前景广阔,但在复杂的医学任务中如何最好地利用大型语言模型 (LLM) 仍是一个悬而未决的问题。 麻省理工学院、谷歌研究院和首尔国立大学医院的研究人员提出了一种新颖的多智能体框架,称为医疗决策智能体 (MDAgents),它通过自动为 LLM 团队分配协作结构来帮助解决这一差距。
Sim2Real新突破:Jim Fan团队造机器人“修仙”模拟器,挂机50分钟=修炼一整年
天上一天,人间一年——这居然已经不是神话了? Jim Fan 团队的最新成果实现了 10,000 倍的超级加速:机器人在虚拟“道场”里训练了整整一年,但现实里只用了 50 分钟! 而且训练结果无需微调,就直接无缝衔接到现实世界使用。
全球首次:AI 机器人画作首登苏富比拍卖,成交价 108 万美元
英国卫报今天(11 月 8 日)发布博文,报道称由类人机器人创作的艺术品,一幅英国数学家艾伦・图灵(Alan Turing)的肖像画,以 108 万美元(IT之家备注:当前约 772.7 万元人民币)的价格成交。
失业小哥在父母卧室做AI应用,日入2万刀!晒账单爆火全网,AI初创价值3500万
一位身无分文的失业小哥,和父母住在一起。 在2020年那一年,他看准AI是个风口,决定全力投入。 在父母的卧室里,他创办了一家价值3500万美元的AI初创公司。
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
文本属性图Text-Attributed Graphs(TAGs)是一种在节点上有丰富文本信息的图结构, TAGs 广泛应用于社交网络(social network)、引用网络(citation network)和推荐系统(recommendation system)等实际场景中。 由于其强大且通用的表达能力,该领域近年来得到了快速发展。 然而目前TAGs面临三大挑战:现有的TAGs数据集一般仅在节点上包含文本信息,而边的信息往往被简化为二元或分类属性。
LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
视频生成模型虽然可以生成一些看似符合常识的视频,但被证实目前还无法理解物理规律! 自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。 图灵奖得主 Yann LeCun 明确表示,基于文本提示生成的逼真视频并不代表模型真正理解了物理世界。
把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
无问芯穹提出混合稀疏注意力方案MoA,加速长文本生成,实现最高8倍吞吐率提升
随着大语言模型在长文本场景下的需求不断涌现,其核心的注意力机制(Attention Mechanism)也获得了非常多的关注。 注意力机制会计算一定跨度内输入文本(令牌,Token)之间的交互,从而实现对上下文的理解。 随着应用的发展,高效处理更长输入的需求也随之增长 [1][2],这带来了计算代价的挑战:注意力高昂的计算成本和不断增长的键值缓存(KV-Cache)代价。
智能体首次达到Kaggle Grandmaster水平,华为用结构化推理补齐思维链短板
前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。 为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。 这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问题(不过依然还相对简单)。
聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
云服务用户,实际在用真金白银帮助厂商构建AI成果
这才是堪称终极的商业模式。 云计算最天才的核心构想,就是让一家掌握大量IT预算(每年可能高达数亿美元)且拥有一定专业知识的大企业,先建立起规模远超自身需求的IT部门,为此砸下数十亿美元(到如今的AI时代,投资额甚至可能高达数百亿美元),再将绝大部分容量出租给第三方客户。 如此一来,单凭第三方租金基本就足以抵平云服务商自身的IT运营成本。
谷歌 DeepMind 研究再登 Nature 封面,隐形水印让 AI 无所遁形
近日,谷歌 DeepMind 发表的一项研究登上了 Nature 期刊的封面,研究人员开发了一种名为 SynthID-Text 的水印方案,已经在自家的 Gemini 上投入使用,跟踪 AI 生成的文本内容,使其无所遁形。
谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形
君可知,我们每天在网上的见闻,有多少是出自AI之手? 图片除了「注意看! 这个男人叫小帅」让人头皮发麻,真正的问题是,我们无法辨别哪些内容是AI生成的。