AI资讯列表 - AI在线

1342万考生填报志愿这件事，AI搜索可帮了大忙

大模型、AI 搜索的一次重要实践。又是一年，千军万马过独木桥。就在本月，2024 年高考刚刚结束。今年的高考报名人数达到了创纪录的 1342 万。对于很多人来说，人生正在迈入一个新的阶段。下个星期，各省市即将进入志愿填报阶段，相比考试本身，这部分工作同样重要，有关大量信息的获取和分析，也需要学生、家长和老师的共同努力。就连机器之心的公众号后台，最近也有人留言希望获得人工智能专业报考的指导。今年的高考报志愿称得上「史无前例」：除了考生人数多，另一个关键词是「新高考」。自 2014 年起，我国开启了自恢复统一高考以来最

超越CVPR 2024方法，DynRefer在区域级多模态识别任务上，多项SOTA

为了实现高精度的区域级多模态理解，本文提出了一种动态分辨率方案来模拟人类视觉认知系统。本文作者来自于中国科学院大学LAMP实验室，其中第一作者赵毓钟是中国科学院大学的2023级博士生，共同一作刘峰是中国科学院大学2020级直博生。他们的主要研究方向是视觉语言模型和视觉目标感知。简介DynRefer 通过模拟人类视觉认知过程，显著提升了区域级多模态识别能力。通过引入人眼的动态分辨率机制，DynRefer 能够以单个模型同时完成区域识别、区域属性检测和区域字幕生成（region-level captioning）任务，

徐凌杰创立魔形智能，国际头部GPU高管加盟

导语：创业方向是做大模型基础设施。作者丨马蕊蕾编辑丨陈彩娴近日，前「壁仞科技」总裁徐凌杰，离开壁仞4个月后，于2024年6月份，正式成立了上海魔形智能有限公司。据悉，徐凌杰毕业于上海交通大学电子工程系，先后在德州大学奥斯汀分校取得计算机工程硕士学位，以及加州大学伯克利分校MBA学位。

从高考到奥林匹克竞技场：大模型与人类智能的终极较量

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队，主要研究方向是：大模型训练、对齐与评估。团队主页：「在未来20年内，AI有50%的概率超越人类的智能水平」，并建议各大科

徐图智能徐东：文生视频创业，要用坚定信仰对抗 fomo 的大厂

在 GPT-4 发布一年多后，OpenAI 推出 GPT-4o，是有史以来第一个真正实现「多模态输入—多模态输出」的多模态模型。 GPT-4o 的出现所传递的信息是：在底层模型并没有变得更智能的情况下，能够跨多种模态进行推理的模型必然是更加通用的。因为其不仅具备多种功能，还能以不同模态传递知识。

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推理和操作

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文由 HMI Lab 完成。HMI Lab依托北京大学视频与视觉技术国家工程研究中心和多媒体信息处理全国重点实验室两大平台，长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作

ShareGPT4V作者团队又一力作！百万高质量视频-字幕数据助力社区提升多模态大模型视频理解及生成能力

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]继Sora官宣之后，多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来，LUMA、Gen-3 Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力，文生视频、图生

CVPR 2024全部奖项公布！近万人线下参会，谷歌华人研究员获最佳论文奖

北京时间 6 月 20 日凌晨，在西雅图举办的国际计算机视觉顶会 CVPR 2024 正式公布了最佳论文等奖项。今年共有 10 篇论文获奖，其中 2 篇最佳论文，2 篇最佳学生论文，另外还有 2 篇最佳论文提名和 4 篇最佳学生论文提名。作为计算机视觉（CV）领域的顶级会议，CVPR 每年都会吸引大量研究机构和高校参会。据统计，今年共提交了 11532 份论文，2719 篇被接收，录用率为 23.6%。根据佐治亚理工学院对 CVPR 2024 录用数据的统计分析，从研究主题来看，论文数量最多的是图像和视频合成与生成

突发！Ilya Sutskever成立新公司SSI，安全超级智能是唯一目标与产品

自 5 月 15 日从 OpenAI 离职后，OpenAI 前首席科学家 Ilya Sutskever 官宣了自己的新动向。今日凌晨，Ilya 在社媒 X 上表示自己创立了一家新公司——「安全超级智能」（Safe SuperIntelligence，SSI）。该公司的目标和产品非常明确、单一：追求安全的超级智能，希望通过一支精干顶尖的小团队取得革命性的成果，进而实现这一目标。以下是 SSI 公司的公告：超级智能已经触手可及。构建安全超级智能（SSI）是我们这个时代最重要的技术难题。我们已经启动了世界上第一个专注于S

超 1.2 万人参加 CVPR 2024，谷歌研究院获得最佳论文

作者：赖文昕马蕊蕾编辑：陈彩娴北京时间今天凌晨，美国西雅图正在召开的计算机视觉盛会 CVPR 2024 正式公布了最佳论文等奖项。今年共有 2 篇论文获得了这份全球最重要的计算机视觉领域的大奖，团队成员分别来自谷歌研究院、加州大学圣地亚哥分校、南加州大学、剑桥大学及布兰迪斯大学。本周（6.17-6.21），第四十一届国际计算机视觉与模式识别会议（CVPR）在美国西雅图拉开帷幕。

我国人工智能企业数量已超 4000 家，去年 AI 核心产业规模达 5784 亿元

IT之家从央视新闻获悉，2024 世界智能产业博览会今天在天津举行，《中国新一代人工智能科技产业发展报告 2024》发布。数据显示，我国人工智能企业数量已经超过 4000 家，人工智能已成为新一轮科技革命和产业变革的重要驱动力量和战略性技术。我国立足自主创新，已构建起包括智能芯片、大模型、基础架构和操作系统、工具链、深度学习平台和应用技术在内的人工智能技术体系、产业创新生态和企业联盟，对重塑工业体系、大力推进新型工业化的关键支撑效应正逐渐显现。2023 年，我国人工智能核心产业规模达 5784 亿元，增速 13.9

VueConf 2024 所有演讲嘉宾确定，将于 7 月 6 日在深圳举办

VueConf 2024 将于 7 月 6 日在深圳举办。目前已进入倒计时阶段。大会网站：作者尤雨溪将出席本次会议并发表主题演讲。演讲嘉宾本次大会将会有 9 位分享嘉宾给大家带来分享！演讲主题一共将有 9 个分享主题和 1 个闪电分享。现向大家公布 8 个分享主题和闪电分享的主题，尤雨溪的演讲主题将在现场揭晓！主题演讲分享人：尤雨溪十年分享人：Vue.js 核心团队成员赵锦江 (Jinjiang) 主题介绍他将分享自己加入 Vue 核心团队十年 (2014-2024) 的心路历程，希望这个分享能够给对 Vue

花旗警告华尔街：AI 时代银行业将被颠覆，被取代岗位数量可能超过其他任何行业

据彭博社今日报道，花旗集团在当地时间周三发布了一份关于 AI 的新报告，数据显示银行业中约 54% 岗位将有可能实现自动化。花旗银行表示，AI 取代银行业工作岗位的数量可能超过其他任何行业，因为 AI 将在金融层面颠覆消费者，并提高员工工作效率。与此同时，银行业还将有 12% 岗位通过 AI 得到增强。去年开始，全球各大银行逐渐尝试拥抱 AI，因为 AI 有望帮助银行提高员工工作效率并降低成本。花旗银行也不例外，其曾表示将为 4 万名员工带来试验不同 AI 技术的能力，并已经使用生成式 AI 技术来快速浏览数百页的

容量提高 10% 寿命延长 25%，英国一公司推 AI 电池管理系统

英国科技公司 Eatron Technologies 和美国 AI 芯片公司 Syntiant 共同开发了一款 AI 电池管理系统（BMS），可“释放”电池额外 10% 的容量，并将电池寿命延长 25%。据悉 AI-BMS 将 Eatron Technologies 的智能算法集成到 Syntiant 的超低功耗 NDP120 神经决策处理器中，来实现电池容量和寿命的提升。Eatron 预训练模型不仅可以对电池健康状态、充电状态和剩余使用寿命进行“极其精确”的评估，还可以提前预测电池可能存在的问题来提高安全性。芯片

百度文库宣布“橙篇”行业首创 10 万字长文生成及多模态编辑能力

百度文库昨日宣布，新产品“橙篇”行业首创 10 万字长文生成及多模态编辑能力，成为行业首个“查阅创编”一站式 AI 自由创作平台。据IT之家此前报道，百度文库于 5 月 30 日发布 AI 原生应用“橙篇”，“橙篇”是一个知识检索和问答、超长图文理解和生成、深度编辑和跨模态自由创作的综合性 AI 产品。“橙篇”有以下功能：长文生成写作资料搜索：专业学术搜索与 AI 全网搜索文档总结：支持超长 / 多个 / 多种格式（包括各类型格式文件、URL 链接、图片等）文档全文智能校正制作图表：自动理解并提取文本数据文本翻译百

“HumanPlus”机器人问世：可模仿人类动作弹钢琴、叠衣服，基于中国公司平台

斯坦福大学研究人员近日研发了一款仿人机器人 HumanPlus，它可以模仿人类的行为，并支持模仿动作来进行学习。据介绍，它可以通过模仿人类动作来学习弹钢琴、回击乒乓球、折叠衣服等。斯坦福大学团队成员傅子鹏（音译）表示，该类人机器人使用单个 RGB 摄像头和全身策略来复制人类动作。值得一提的是，傅子鹏 14 日在其个人 YouTube 频道上发布了 HumanPlus 的数个演示视频，展示了其诸多方面的“学习能力”。研究人员表示，HumanPlus 需要约 40 小时的人类运动数据来学习一项任务，然后逐步执行。此

B站开源轻量级 Index-1.9B 系列模型：2.8T 训练数据，支持角色扮演

B站昨日开源了轻量级 Index-1.9B 系列模型，包含基座模型、对照组、对话模型、角色扮演模型等多个版本。IT之家附官方简介：Index-1.9B base ：基座模型，具有 19 亿非词嵌入参数量，在 2.8T 中英文为主的语料上预训练，多个评测基准上与同级别模型比处于领先。Index-1.9B pure ：基座模型的对照组，与 base 具有相同的参数和训练策略，不同之处在于严格过滤了该版本语料中所有指令相关的数据，以此来验证指令对 benchmark 的影响。Index-1.9B chat ：基于 i

上海人工智能实验室发布首个 AI 高考评测结果：语数英总分最高 303 分，数学全部不及格

感谢上海人工智能实验室 19 日公布了首个 AI 高考全卷评测结果。据介绍，2024 年全国高考甫一结束，该实验室旗下司南评测体系 OpenCompass 选取 6 个开源模型及 GPT-4o 进行高考“语数外”全卷能力测试。评测采用全国新课标 I 卷，参与评测的所有开源模型开源时间均早于高考，确保评测“闭卷”性。同时，成绩由具有高考评卷经验的教师人工评判，更加接近真实阅卷标准。该机构表示，Qwen2-72B、GPT-4o 及书生・浦语 2.0 文曲星（InternLM2-20B-WQX）成为本次大模型高考的前三甲

资讯列表

1342万考生填报志愿这件事 ，AI搜索可帮了大忙