LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破
在2016年的NeurIPS会议上,图灵奖得主Yann LeCun首次提出著名的「蛋糕比喻」:如果智能是一块蛋糕,那么蛋糕中的大部分都是无监督学习,蛋糕上的糖霜(锦上添花)是有监督学习,蛋糕上的樱桃则是强化学习。 If intelligence is a cake, the bulk of the cake is unsupervised learning, the icing on the ca…...- 0
- 0
- 971
o3并非独门秘技,谷歌已发背后关键机制,方法更简单、成本更低
o1/o3带火的推理计算Scaling,原来谷歌早在今年8月就曾探讨过。 当时,来自斯坦福、牛津以及谷歌DeepMind的团队提出通过重复采样来扩展推理计算量——结果在编码任务中将性能最多提高40%。 他们发现小模型通过生成多种答案/样本,其任务表现可能比一些大型模型单次尝试还要好。...- 0
- 0
- 973
使用GenAI实现缺陷检测和分析
如果制造公司能够在缺陷发生时就准确找出原因,从而避免代价高昂的生产延误并确保一流的质量,那会怎样? 生成式人工智能(GenAI)彻底改变了制造商的质量控制和缺陷监控方式,使之成为可能。 通过GenAI,制造企业就可以进行持续的缺陷监控和根本原因分析(RCA),从而进行实时质量控制,确保更高效、更可靠的生产运营。...- 0
- 0
- 971
企业为何仍挣扎于数据治理:挑战与破局之道
尽管AI和分析技术得到广泛使用,但许多企业的数据治理仍不到位,这在网络安全和合规性等多个层面都存在风险,更不用说对各种利益相关者的潜在影响了。 简而言之,随着企业对数据的依赖程度不断增加,数据治理变得越来越必要,而非减少。 Info-Tech Research Group负责数据、分析、企业架构和AI的首席研究总监Steve Willis提供了一个令人清醒的统计数字:大约50%至75%的数据治理计…...- 0
- 0
- 971
麻省理工研究人员提高机器学习模型准确性
机器学习(ML)有可能通过利用大量数据进行预测洞察来改变医疗决策。 然而,当这些模型在不能充分代表所有人口群体的数据集上进行训练时,就会出现一个严重挑战。 预测疾病患者治疗计划的模型可以在主要包含男性患者的数据集上进行训练。...- 0
- 0
- 970
微调 YOLO 做车辆、人员、交通标志检测 | 附代码+数据集
目标检测在计算机视觉中是一个至关重要的任务,而YOLO(You Only Look Once)因其速度和准确性而脱颖而出。 在本指南中,我将带你了解如何微调一个YOLO模型,以检测各种道路标志和物体,例如:车辆行人不同颜色的交通灯人行横道速度限制标志禁止标志警告标志本指南适用于使用Linux的用户。 对于Windows用户,Poetry和Cuda的安装可能会有所不同。...- 0
- 0
- 973
豆包说要「普惠」,于是大模型处理图片按「厘」计价了
这段时间,OpenAI 宣告连续 12 轮轰炸,让 2024 年底的大模型领域热闹起来了。 但坚持每个凌晨看直播的话会发现,越到后面的发布越平淡,内心的波动也越少了。 今年的大模型就卷到这里了吗?...- 0
- 0
- 970
李飞飞、谢赛宁等探索MLLM「视觉空间智能」,网友:2025有盼头了
希望 2025 年 AI 领域能带来推理之外的突破。 在购买家具时,我们会尝试回忆起我们的客厅,以想象一个心仪的橱柜是否合适。 虽然估计距离是困难的,但即使只是看过一次,人类也能在脑海里重建空间,回忆起房间里的物体、它们的位置和大小。...- 0
- 0
- 969
剖析BadGPT-40背后的真相:一个从GPT模型中移除护栏的模型
译者 | 晶颜审校 | 重楼出品 | 51CTO技术栈(微信号:blog51cto)大型语言模型(LLM)风靡全球。 从通用的智能助手到代码伙伴,这些模型似乎什么都能做——除了可靠地执行其内置的安全准则。 OpenAI等公司安装的广为人知的“护栏”旨在确保负责任的行为,保护用户免受恶意输出、虚假信息和网络利用企图的影响。...- 0
- 0
- 974
2024亚马逊研究奖获奖名单:张崇杰、魏华等人入选
上周五,亚马逊研究奖(Amazon Research Awards,ARA)公布了最新一期来自 10 所大学的 10 名获奖者。 亚马逊研究奖于 2015 年设立,旨在为多学科研究主题的研究人员提供资助奖励。 获奖者可以访问 300 多个亚马逊公共数据集,并可以通过促销积分使用 AWS AI/ML 服务和工具。...- 0
- 0
- 969
AAAI 2025|时间序列演进也是种扩散过程?基于移动自回归的时序扩散预测模型
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。...- 0
- 0
- 970
图学习新突破:一个统一框架连接空域和频域
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。...- 0
- 0
- 972
李飞飞谢赛宁新作「空间推理」:多模态大模型性能突破关键所在
李飞飞谢赛宁再发新成果:直接把o1式思考拉至下一个level——多模态大语言模型的空间思维! 这项研究系统评估了多模态大模型的视觉空间智能,结果发现:当前,即使是最先进的多模态大模型,在空间认知方面与人类相比仍有显著差距,测试中约71%的错误都源于空间推理方面的缺陷,即空间推理能力是当前主要瓶颈。 图片更为有趣的是,在这种情况下,思维链、思维树等常用的语言提示技术直接失灵了——不仅没有提升模型在空…...- 0
- 0
- 974
雷军在线挖人,传年薪千万级!DeepSeek 关键骨干罗福莉已离职加入小米,或领军小米大模型团队;小米将在大模型上奋起直追!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)AI圈的大新闻,雷总在线挖人,小米要发力大模型了! 知情人士称,雷军认为小米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才,支付的薪酬水平在千万元级别。 而且雷总已经初战告捷——帮小米赢得了DeepSeek的关键骨干罗福莉。...- 0
- 0
- 970
大模型检索增强生成之向量数据库的问题
作为技术人员我想大家或多或少应该都接触过数据库技术,数据库技术的历史可以说是由来已久了;但数据库的发展也是一路曲折,特别是随着互联网体量的快速增加,对数据库的要求也变得越来越多。 而且为了适应各种不同的业务场景,数据库系统也是紧跟潮流发展出多种类型的数据库;比如说传统的关系型数据库,缓存数据库,以及大数据处理的数据库;直到今天的向量数据库。 关系型和缓存数据库就不用说了,今天我们就来聊聊向量数据库…...- 0
- 0
- 973
百川智能发布全链路领域增强金融大模型 Baichuan4-Finance,测试成绩领先 GPT-4o
百川智能今日发布全链路领域增强金融大模型 Baichuan4-Finance,融合 100B + 中英文金融知识,采用多层次质量评估体系进行筛选,由人民大学财政金融学院金融专家团队全程参与定义和评估。...- 0
- 0
- 973
全球首个AI圣彼得大教堂上线,40万照片毫米级3D还原文艺复兴巅峰!
不用排队、不用签证,现在只需打开屏幕,就能探索圣彼得大教堂的一切——从壮美的圆顶到鲜有人见的教皇墓地,全方位感受这座文艺复兴与巴洛克建筑巅峰之作的震撼。 梵蒂冈联手Iconem和微软,仅用不到一个月的时间,就打造了这座教堂的数字双胞胎,并推出沉浸式展览和互动网站——La Basilica di San Pietro(意大利语:圣彼得大教堂)。 探索地址:,圣彼得大教堂见证了米开朗基罗与贝尔尼尼的建…...- 0
- 0
- 973
百川行业首创领域自约束训练方案,Baichuan4-Finance金融场景能力领先GPT-4o近20%
12 月 23 日,百川智能发布全链路领域增强大模型 Baichuan4-Finance。 在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,Baichuan4-Finance 实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。 其金融专业能力和场景应用能力大幅领先 GPT-4o,在中国人民大学财政金融学院新近发布的评测体系 FLAME 以及国内主流开源金融评测基准…...- 0
- 0
- 977
2 小时内收集数据学会新任务,星动纪元端到端原生机器人大模型 ERA-42 发布
模型不需要任何预编程技能,完全基于其泛化和自适应力,能在不到 2 小时内通过收集少量数据就学会执行新的任务。...- 0
- 0
- 971
素数分布规律又有新发现!赵宇飞学生与牛津教授合作成果
赵宇飞高材生、哥伦比亚大学助理教授Mehtaab Sawhney(索尼),又为数学界贡献了一项重要成果——与牛津大学教授Ben Green(格林)一起,证明了一项关于素数分布的新规律。 关键是证明中用到了与Gowers范数相关的技术,而Gowers范数一开始是拿来研究等差数列的,看上去和素数规律风马牛不相及。 甚至作者索尼自己也表示,“作为一个‘局外人’,几乎不可能判断出这些事情是相关的”。...- 0
- 0
- 973
热点资讯
- 1
刚刚,AI颠覆物理模拟:一句话精准仿真,学术圈半壁江山联手耗时24个月研究成果
- 2
历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物
- 3
细节表现超Sora,网友:真正的国产之光!MiniMax视频模型再上新
- 4
2024年AI 编程现在可以做到什么程度?
- 5
超越所有SOTA!最新UniScene:视频点云Occ三大生成任务全部暴力提升~
- 6
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
- 7
抢跑OpenAI!谷歌Gemini 2.0震撼登场:全面转向Agent,多模态输入输出,免费随便玩
- 8
实测来了!Kimi发布k1视觉思考模型,实力颠覆K12教育赛道,涌现能力强得可怕,免费可用!网友:国产之光!