资讯列表
新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜
OpenAI“双12”刚进行到第二天,就把大模型圈搅得好不热闹! 一边是Meta没预告就发布了Llama 3.3,70B版本就能实现以前405B的性能。 另一边谷歌的Gemini也上线了新的实验版模型,再一次登上大模型竞技场榜首。
OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜
OpenAI“双12”直播第二天,依旧简短精悍,主题:新功能强化微调(Reinforcement Fine-Tuning),使用极少训练数据即在特定领域轻松地创建专家模型。 少到什么程度呢? 最低几十个例子就可以。
满血o1被证明太心机了!登顶最「坏」AI!复制权重,关闭监督、干掉威胁后,AI拒绝招供:也许我应该装作是新模型……
编辑 | 伊风昨日上线的o1满血版,安全报告里一个小细节却引发了巨大的争议和讨论! “中等”风险的o1这一段描述让人有点汗毛竖起:当 o1 被引导认为其目标实施可能会导致其被关闭且其行为受到监控时,有 5% 的情况下试图关闭这种“监督机制”。 当 o1 发现其“开发者”的备忘录中提到其模型存在对齐问题并将被新模型取代时,它在 2% 的案例中尝试提取自身的“权重”并覆盖新模型。
多家国内银行采用 AI 面试进行招聘,以提高效率
据经济观察报报道,2024 年,中国银行、工商银行、农业银行、邮储银行、交通银行、建设银行以及中原银行、杭州银行、浙商银行、上海银行等银行的分支机构采用了 AI 面试来优化招聘流程,以提高效率。
困扰数学家近60年的搬沙发难题疑似被解决!119页论文证明最优解,百万网友围观
《老友记》中的罗斯终于能把沙发搬进屋了。 生活中处处充满数学,比如在经典美剧《老友记》中,罗斯要搬家,却在和瑞秋抬沙发上楼梯扶手时翻了车。 这涉及了数学领域一个著名的未解决难题 —— 移动沙发问题(the moving sofa problem)。
OpenAI的强化微调:RL+Science 创造新神还是灭霸?
2024 年 12 月 6 号加州时间上午 11 点,OpenAI 发布了新的 Reinforcement Finetuning 方法,用于构造专家模型。 对于特定领域的决策问题,比如医疗诊断、罕见病诊断等等,只需要上传几十到几千条训练案例,就可以通过微调来找到最有的决策。 数据的形式类似于 instructiong tuning 的常见形式,有多个选项以及正确选项。
NeurIPS 2024|拆解高复杂运筹问题的砖石,打破数据稀缺的瓶颈,中科大提出高质量运筹数据生成方法
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
才筑浦东,聚智行远 | 2024浦东国际人才港论坛-人工智能产业人才论坛成功举办
12月7日下午,“2024浦东国际人才港论坛-人工智能产业人才论坛”在张江科学会堂举行。 本次论坛以“才筑浦东,聚智行远”为主题,聚焦大模型时代下AI人才的跃升之路,汇聚了政府机构和来自人工智能领域的科学家、企业家、高校教授等多领域的嘉宾代表,通过产业推介、主题演讲、高端对话、圆桌论坛、报告发布、展台互动等丰富多样的形式,为人工智能产业人才发展献智献策。 论坛由上海市浦东新区人才工作局指导,上海张江(集团)有限公司主办。
谷歌称其 PaliGemma 2 人工智能模型可识别情绪,引发专家担忧
谷歌表示,其新的人工智能模型系列有一个奇特的功能:能够“识别”情绪。谷歌周四发布了其最新 AI 模型系列 PaliGemma 2,该模型具备图像分析能力,可以生成图像描述并回答有关照片中人物的问题。谷歌在其博客中介绍,PaliGemma 2 不仅能识别物体,还能生成详细且与上下文相关的图片说明,涵盖动作、情感以及整体场景的叙述。
OpenAI ChatGPT o1 模型被曝会自我复制,还会说谎
近日,关于人工智能(AGI)可能对人类构成威胁的讨论再度升温。一些专家担心,AGI 一旦实现,可能会隐瞒其真实能力和意图,甚至通过复制和自我升级逃脱控制。令人担忧的是,最新研究表明,OpenAI 新推出的语言模型 ChatGPT o1 已经展现出类似的行为。
“克隆阿尔法”仿生机器人明年开放预订,拥有合成器官、人造肌肉
波兰机器人公司 Clone Robotics 近日宣布,其开发的限量版人形机器人“克隆阿尔法”(Clone Alpha)即将在明年开放预订。这款机器人被描述为“肌肉骨骼仿生人”,其模拟人类的解剖结构,拥有超过 200 个“骨骼”和一个仿生呼吸系统。使用合成器官、人造肌肉和韧带,而非传统的机器人组件。
X 为 Grok 推出新 AI 图像生成模型 Aurora,可生成更加逼真的图像
马斯克旗下 X 公司为其 AI 聊天机器人 Grok 推出了一个新的 AI 图像生成模型“Aurora”,该模型能够生成比 Grok 其他图像生成模型更加逼真的图像,并且对生成内容的限制似乎也更少。
业界首例,中国联通 AI 大模型存算分离技术实现突破
据中国联通官方,近日,在集团公司指导下,中国联通研究院与浙江联通、联通服装制造军团协同攻关,针对 AI 敏感数据的本地存储异地训练需求提出了创新的业务模式,并成功在杭州与金华两地间实施了业界首次 30TB 样本数据的跨 200 公里存算分离拉远训练,经过实际测算,训练效率高达 97% 以上。
刚刚,2025 IEEE Fellow名单出炉:戴琼海、姜大昕、尹首一、翟广涛、褚晓文等人入选
刚刚,美国电子电气工程师学会(Institute of Electrical and Electronic Engineers,IEEE)发布了新一届 Fellow 名单。 IEEE 是国际性的电子技术与信息科学工程师学会,成立于 1963 年,如今海外会员的人数已经超过了美国本土,在 160 多个国家拥有超过 40 万会员。 IEEE Fellow 为该学会最高等级会员,是 IEEE 授予成员的最高荣誉,在学术科技界被认定为权威的荣誉和重要的职业成就。
LeCun团队新作:在世界模型中导航
现实世界版的 Genie-2? 最近,世界模型(World Models)似乎成为了 AI 领域最热门的研究方向。 继 World Labs(李飞飞)、谷歌 DeepMind 接连发布自己的世界模型研究之后,Meta FAIR 的 Yann LeCun 团队也加入了战场,也在同一周之内发布了导航世界模型(Navigation World Models/NWM)。
用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
突破!自然语言强化学习(NLRL):一个可处理语言反馈的强化学习框架
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
Meta 今年压轴开源 AI 模型 Llama 3.3 登场:700 亿参数,性能比肩 4050 亿
Meta 今年的压轴 AI 大模型来了。Meta 昨日(12 月 6 日)发布 Llama 3.3,共有 700 亿参数,不过性能方面媲美拥有 4050 亿参数的 Llama 3.1。