资讯列表
OpenAI怒斥Scaling撞墙论!o1已产生推理直觉潜力巨大
最近,OpenAI高级研究副总裁Mark Chen在炉边谈话中,正式否认「Scaling Law撞墙论」。 他表示,并没有看到Scaling Law撞墙,甚至OpenAI还有两个范例——o系列和GPT系列,来保持这种Scaling。 用他的话说,「我们准确地掌握了需要解决的技术挑战」。
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
在大语言模型(LLMs)不断发展的背景下,如何评估这些模型在多轮对话和多语言环境下的指令遵循(instruction following)能力,成为一个重要的研究方向。 现有评估基准多集中于单轮对话和单语言任务,难以揭示复杂场景中的模型表现。 最近,Meta GenAI团队发布了一个全新基准Multi-IF,专门用于评估LLM在多轮对话和多语言指令遵循(instruction following)中的表现,包含了4501个三轮对话的多语言指令任务,覆盖英语、中文、法语、俄语等八种语言,以全面测试模型在多轮、跨语言场景下的指令执行能力。
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
本文第一作者为上海科技大学信息学院硕士生徐京伟和忆生科技的王晨宇,指导老师为香港大学的马毅教授和高盛华教授。 王晨宇毕业于上海科技大学并获得工学硕士学位。 其所在的忆生科技由马毅教授于 23 年底创立,致力于打造完整、自主、自洽的机器智能系统。
更新了!带Agent的Cursor太疯狂了
AI 辅助编程工具这条赛道越来越卷了。 新晋 AI 编程神器 Cursor,终于迎来了一次备受关注的版本更新,Cursor 0.43 来了。 新版本最大亮点之一是推出了 Composer Agent 功能,其具有完整的项目理解 / 编辑能力。
智能体竟能自行组建通信网络,还能自创协议提升通信效率
Hugging Face 上的模型数量已经超过了 100 万。 但是几乎每个模型都是孤立的,难以与其它模型沟通。 尽管有些研究者甚至娱乐播主试过让 LLM 互相交流,但所用的方法大都比较简单。
小学二年级数学水平,跟着这篇博客也能理解LLM运行原理
「小白学 AI 该从哪里下手? 」去互联网上搜索一圈,最高赞的回复往往是高数起手,概率论也要学一学吧,再推荐一本大名鼎鼎的「西瓜书」。 但入门的门槛足以劝退一大波人了。
指令跟随大比拼:Meta 发布多轮多语言基准 Multi-IF,覆盖 8 种语言超 4500 种任务
Meta 全新发布的基准 Multi-IF 涵盖八种语言、4501 个三轮对话任务,全面揭示了当前 LLM 在复杂多轮、多语言场景中的挑战。
和梁朝伟同获港科荣誉博士,黄仁勋与沈向洋对谈Scaling Law、后训练、机器人和爱情
11 月 23 日,香港科技大学举行了今年度的学位颁授典礼。 英伟达创始人和 CEO 黄仁勋又新增一个荣誉工程学博士头衔,与他一同获得荣誉博士学位的还有著名影星梁朝伟、2013 年诺贝尔化学奖得主 Michael Levitt、菲尔兹奖得主 David Mumford。 典礼现场照片,图源:X 用户 @biogerontology行程中,黄仁勋与著名计算机科学家、香港科技大学校董会主席沈向洋身穿同款皮衣,进行了主题为「技术、领导力和企业家精神」的炉边谈话,内容涉及 AI 的发展和对社会的影响、AI 在科学领域的应用、大湾区的硬件生态系统、领导力和企业管理甚至爱情等主题。
将活体神经元植入大脑,他和马斯克闹掰后开辟脑机接口新路线
“向大脑中植入活体神经元。 ”和马斯克闹掰了的Neuralink联创Max Hodak,宣布了新型脑机接口技术路线! 不同于传统的电极方案,这种新方法不仅能获得更丰富的神经活动信息,关键还不会损伤大脑。
好东西!又来个播客界的谷歌NotebookLM,靠记笔记画脑图,月入近5万
AI好好用报道编辑:Sia这个 AI 科代表,可以领回家了。 听播客,尤其是时长几小时的硬核类节目,是件特别花时间的事情。 为了不听也能 get 到内容,今年 3 月,我们利用了大模型( AI 在用 | 有了这个超级提示和Claude 3,不听播客也能搞定节目内容 )。
AI推演OpenAI内斗结果:奥特曼仅有20%胜率,马斯克也有机会接盘???
奥特曼“熹妃回宫”已一周年,具体内情还是不清楚,咋办? 搞几个Agent模拟OpenAI董事会各个成员,把这出热闹模拟推演了一遍(doge)。 结果你还别说,在20场模拟宫斗大戏中,奥特曼仅有4次顺利回宫。
将活体神经元植入大脑,原 Neuralink 联创 Max Hodak 和马斯克闹掰后开辟脑机接口新路线
“向大脑中植入活体神经元。”和马斯克闹掰了的 Neuralink 联创 Max Hodak,宣布了新型脑机接口技术路线!
中国铁塔发布经纬大模型:可服务于山水林田湖草沙等空间治理领域
IT之家从中国铁塔官微获悉,在中国铁塔2024年科技创新大会上,“经纬大模型”正式发布,其将服务于“山水林田湖草沙”等空间治理领域。
20种复杂Excel操作一句话搞定!北大ChatExcel全新升级,所有人免费可用
AI做Excel表,现在next level了——北大团队ChatExcel最新升级,一句话搞定线性分析,图表、文字总结全都有。 比如分析各地区数据增长与时间之间是否存在相关性。 它清晰列出具体步骤计划:先对数据预处理,计算每年增长率,绘制各地区增长率和时间的折线图,最后进行分析。
经典卡尔曼滤波器改进视频版「分割一切」,网友:好优雅的方法
Meta的视频版分割一切——Segment Anything Model 2(SAM 2),又火了一把。 因为这一次,一个全华人团队,仅仅是用了个经典方法,就把它的能力拔到了一个新高度——任你移动再快,AI跟丢不了一点点! 例如在电影《1917》这段画面里,主角穿梭在众多士兵之中,原先的SAM 2表现是这样的:嗯,当一大群士兵涌入画面的时候,SAM 2把主角给跟丢了。
英伟达 CEO 黄仁勋盛赞香港科技大学:是“中国的 MIT”
据第一财经 24 日报道,黄仁勋称香港科技大学为“中国的 MIT(麻省理工学院,Massachusetts Institute of Technology)”,并称大湾区非常擅长机电一体化,这是机械技术和电子技术的交汇点。
低成本机器人“皮肤”登上Nature子刊:实现三维力的自解耦,来自法国国家科学研究中心&香港大学
触觉是人类感知外部环境并与之交互的重要知觉形式。 现在,科学家们也正在制作柔性皮肤,试图将这种能力赋予机器人,使之能完成更为灵巧、复杂的操作。 比如,自适应地稳稳夹紧一颗鸡蛋:现在流行的柔性触觉传感器包括:视触觉传感器:广泛应用于研究领域,可以提供高分辨率的触觉图像。
Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控:GUI智能体的黎明
Claude操控电脑,究竟可以做到什么程度? 新加坡国立大学团队在20多个场景下做了全面测试,其中最引人瞩目的是:AI可以自动玩手游清日常任务了! 研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成今天的模拟宇宙”,然后,Claude就会立即依次打开游戏菜单、找到星穹里的”黄金花萼”、自动设置6次挑战次数:甚至还可以启动自动战斗、等待战斗结束后退出,这一套组合操作简直行云流水……而且注意哦,这不仅是传统游戏外挂那样的机械操作,Claude还能智能理解游戏规则和目标,根据界面上不同的任务进行调整。