资讯列表
“清华系”面壁智能与华为云合作,推进大模型端云协同解决方案
面壁智能与华为云于 6 月 22 日在华为开发者大会 2024(HDC2024)上达成正式合作。华为云推进大模型端云协同解决方案中,面壁智能是首个端侧大模型合作方。双方将共同推进大模型端云协同解决方案的研发和部署,进一步降低大模型使用成本、提升响应速度;将大模型放在“离用户最近的地方”,在各个场景和不同领域进一步拓展大模型的应用价值。面壁核心研发团队脱胎于清华自然语言处理实验室,此前他们的开源模型“小钢炮”MiniCPM-Llama3-V 2.5 被斯坦福大学 AI 研究团队的 Llama3-V 开源模型抄袭。据I
大模型测试题爆火,GPT-4 和 Claude3 都跪了,LeCun 转发:新 Benchmark
一项新的“大模型 Benchmark”在推特上爆火,LeCun 也点赞转发了!而且无论是 GPT-4 还是 Claude 3,面对它都如同被夺了魂,无法给出正确答案。难倒一众大模型的,是逻辑学当中经典的“动物过河”问题,有网友发现,大模型对此类问题表现得很不擅长。甚至有人观察到,几个不同的模型都给出了一致的(错误)答案,让人怀疑他们是不是用了相同的训练数据。针对这项测试,网友还定义了一个新的名词叫“劣效比率”(crapness ratio),让 LeCun 打趣说到,一项新的“Benchmark”诞生了。“模见模愁
WAIC论坛报名|齐聚多家央国企与AI公司,共议产业融通发展
作为新质生产力的引擎,人工智能正快速与千行百业融合。3 月 5 日,国务院总理李强在政府工作报告中介绍今年政府工作任务时提出,深化大数据、人工智能等研发应用,开展“人工智能 ”行动,打造具有国际竞争力的数字产业集群。自此,人工智能赋能产业发展的战略加速落地。为进一步助力“人工智能 ”的进程,展现、分享成功探索者的经验,助力人工智能领域供需双方展开合作,由机器之心主办、人工智能场景化应用与智能系统测评工业和信息化部重点实验室协办的 「2024 WAIC 人工智能赋能产业融通发展论坛」将于 7 月 6 日上海世博展览馆
跟骑手学习送外卖,这家具身智能公司的机器人已经上岗挣钱了
你点过无人机送的外卖吗?在深圳、上海等一线城市,让无人机给自己送个外卖已经不是什么新鲜事。但它送的方式可能和你想的不太一样。想象中的无人机送外卖 be like:而现实中的无人机送外卖 be like:也就是说,它不会把外卖直接送到你家阳台,而是和你家有一段距离的外卖柜。你需要下楼走一段距离才能拿到。于是,有些网友发出灵魂追问:「你猜我为什么点外卖?」所以,现在问题就变成了:从家到外卖柜这段距离怎么办?解决思路也很简单:让一个送货机器人帮你送完这段路。这是具身智能机器人公司推行科技(Infermove)最近放出来的
营销效果大幅提升,AIGC视频创作就该这么用
经过一年多的发展,AIGC 已经从文字对话、图片生成逐步向视频生成迈进。回想四个月前,Sora 的诞生让视频生成赛道经历了一场洗牌,大力推动了 AIGC 在视频创作领域的应用范围和深度。在人人都在谈论大模型的时代,我们一方面惊讶于视频生成带来的视觉震撼,另一方面又面临着落地难问题。诚然,大模型从技术研发到应用实践还处于一个磨合期,仍需结合实际业务场景进行调优,但理想与现实的距离正在被逐步缩小。营销作为人工智能技术的重要落地场景,成为了很多企业及从业者想要突破的方向。掌握了恰当方法,营销视频的创作过程就会事半功倍。如
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
方向完全搞错了?大语言模型(LLM)为什么空间智能不足,GPT-4 为什么用语言以外的数据训练,就能变得更聪明?现在这些问题有 「标准答案」了。近日,一篇麻省理工学院(MIT)等机构发表在顶级学术期刊《自然》杂志的文章观察到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技领域社区的大讨论。难道真的如语言学家乔姆斯基所言,追捧 ChatGPT 是浪费资源,大语言模型通向
AI小分子药物发现的「百科全书」,康奈尔、剑桥、EPFL等研究者综述登Nature子刊
作者 | 康奈尔大学杜沅岂编辑 | ScienceAI随着 AI for Science 受到越来越多的关注,人们更加关心 AI 如何解决一系列科学问题并且可以被成功借鉴到其他相近的领域。AI 与小分子药物发现是其中一个非常有代表性和很早被探索的领域。分子发现是一个非常困难的组合优化问题(由于分子结构的离散性)并且搜索空间非常庞大与崎岖,同时验证搜索到的分子属性又十分困难,通常需要昂贵的实验,至少是至少是模拟计算、量子化学的方法来提供反馈。随着机器学习的高速发展和得益于早期的探索(包括构建了简单可用的优化目标与效果
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:,近来Anthropic公司最新发布的Claude-3.5-Sonne
美国多家汽车经销商将 AI 用于车辆初步检查:一分钟内可生成全面报告
当前 AI 几乎是“无处不在”,以汽车领域为例,有车载大模型语音助手,还有各种各样的智能辅助驾驶,不过 AI 的潜力还远不止于此。据 Carscoops 今日报道,美国多家经销商采用了 AI 系统用于车辆初步检查。▲ 图源 Carscoops报道称,相关技术已经在全美 300 家经销商展开部署,为它们显著提高了工作效率并缩短了工时。拉斯维加斯一家安装了自动化车辆检测系统的凯迪拉克经销商表示,整个扫描过程非常简单,只需不到一分钟。客户将车开过大型扫描仪,扫描仪便可以从各个角度(IT之家注:包括车底)拍摄多张照片。然后
2012 年以来 AI 领域首个,科大讯飞获 2023 年度国家科学技术进步奖一等奖
据“合肥发布”消息,2023 年度国家科学技术奖励大会今日在京召开,科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目,获得国家科学技术进步奖一等奖。这是 2012 年深度学习引发新一代人工智能浪潮以来,人工智能领域首个国家科学技术进步奖一等奖。据介绍,2023 年度国家科学技术奖共评选出 250 个项目。国家自然科学奖 49 项:一等奖 1 项,二等奖 48 项;国家技术发明奖 62 项:一等奖 8 项,二等奖 54 项;国家科技进步奖 139 项:特等奖 3 项,一等奖 16 项,二等奖 120
华为音乐与科大讯飞达成全面深度合作:音乐内容发行、手机铃音 AI 创作等
感谢在华为开发者大会 2024(HDC 2024)期间,华为音乐与科大讯飞股份有限公司在东莞举行全面深度合作签约仪式。双方将基于 HarmonyOS 发展面向全场景时代的新生态,在已有的音乐内容发行、艺人合作、手机铃音 AI 创作等方面展开更加深入的合作。华为互动媒体军团 CEO、华为终端云服务互动媒体 BU 总裁吴昊表示:“华为音乐与科大讯飞将持续紧密合作,基于 Audio Vivid 音频编解码标准共同创作更多空间音频作品。”科大讯飞股份有限公司 AI 文娱业务群副总裁,讯飞音乐主理人郭嘉表示:“科大讯飞作为一
消息称字节跳动与博通合作开发 AI 芯片:5nm 制程,台积电制造
感谢路透社报道,字节跳动正在与美国博通公司合作开发 AI 处理器,以确保有足够多的高端芯片。知情人士透露,这款 AI 处理器制程为 5nm,将由台积电制造。虽然设计工作进展顺利,但标志着设计阶段结束和制造开始的“流片”尚未开始。字节跳动和博通一直是业务合作伙伴,博通曾在声明中表示,字节跳动购买了其 Tomahawk 5nm 芯片以及其用于 AI 计算机集群的 Bailly 交换机。字节跳动与博通的合作将有助于大幅削减采购成本,并确保高端芯片的稳定供应。除抖音和 TikTok 外,字节跳动还运营一个类似 ChatGP
为什么都放弃了LangChain?
或许从诞生那天起,LangChain 就注定是一个口碑两极分化的产品。看好 LangChain 的人欣赏它丰富的工具和组建和易于集成等特点,不看好 LangChain 的人,认为它注定失败 —— 在这个技术变化如此之快的年代,用 LangChain 来构建一切根本行不通。夸张点的还有:「在我的咨询工作中,我花了 70% 的精力来说服人们不要使用 langchain 或 llamaindex。这解决了他们 90% 的问题。」最近,一篇 LangChain 吐槽文再次成为热议焦点:作者 Fabian Both 是 AI
从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]在人工智能领域的发展过程中,对大语言模型(LLM)的控制与指导始终是核心挑战之一,旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法(RLHF)来管理
CVPR 24|ETH Zurich等团队:重新定义小样本3D分割任务,新基准开启广阔提升潜力!
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为Serge Belongie。他硕士毕业于苏黎世联邦理工学院(ETH Zurich),在硕士期间,他在导师Luc Van Go
LeCun学生、纽大助理教授Alfredo视频上新,跟他免费学本科AI课程
喜欢学习基础人工智能知识的小伙伴们又有新的优质资源了!纽约大学计算机科学助理教授、图灵奖得主Yann LeCun的学生Alfredo Canziani开新课了!近日,Alfredo Canziani 在社媒 X 上宣布自己的春季「人工智能本科课程」放出在线视频了。一些章节的视频已经可以在Youtube上观看。视频观看地址:,这门《人工智能》课程包含两大部分。第一部分为基于知识的AI,由Ernest David教授授课。各章节讲授的知识点包括:基于知识的AI引言,搜索和约束满足问题、逻辑推理和自动推理、以及概率和简单
导师爆料:这篇CVPR最佳学生论文,从想法到成稿只用一个月,源自业余灵感
按部就班 vs. 好奇心驱动,哪个更容易出研究成果? CVPR 2024 的最佳学生论文,竟然是用一个月的时间写出来的。北京时间 6 月 20 日凌晨,CVPR 2024 正式公布了最佳论文、最佳学生论文等奖项。其中,获得最佳论文的有两篇文章 ——BioCLIP 和 Mip-Splatting。据 Mip-Splatting 论文一作 Zehao Yu 的导师、图宾根大学教授 Andreas Geiger 透露,这篇论文从想法公布到成稿,只用了一个月的时间。而且,他还提到,Zehao Yu 之前参与过多个项目,并
墙裂推荐!Karpathy大模型培训课LLM101n上线了,非常基础
让我们训练一个 Storyteller。今天外网又被 Andrej Karpathy 这一良心课程刷屏了!项目是 11 小时前被 Karpathy 上传到 Github 的,目的是要构建一个能够创作、提炼和阐释小故事的大语言模型。如今已经被许多网友转发推荐。项目地址:,这是 karpathy 老师的新冒险。它将带您从语言建模、机器学习的基础知识开始学习,然后到多模态、RLHF、模型部署。也有网友称:看起来 karpathy 正在做一门完整的、类似 cs231n 的课程, 《LLM101n》将讲授如何从头开始构建类似