AI资讯列表 - AI在线

GPT-4o 再秀神操作，“复现”OpenAI 总裁讲课，网友当真了

OpenAI 总裁兼联合创始人 Greg 再次大秀 GPT-4o 操作，结果网友直接缅怀 DALL-E。直接看效果。文本拼写达到惊人的一致！手部细节、光照全都有，甚至后背上的 Logo 也完全正确。有网友表示：恍惚间还以为真的是本人在讲课。也有人感叹图像生成技术发展的飞跃：Holy Cow！从完全破碎的文本到风格一致、拼写正确的写作，只用了一次迭代。GPT-4o 让网友直接缅怀 DALL-EGPT-4o 发布以来，简直就被玩儿疯了，尤其是图像生成这块。比如有网友发现，GPT-4o 在组合任意图像上面就像是打通了任督

专访文青松｜AI时代的教育革新：深度融合，驱动未来

在人工智能科学的先锋领域，尤其是深度学习与决策智能的探索中，文青松博士凭借其在学术研究与实际应用方面的卓越贡献，已然成为业界领军人物。在最近举行的国际深度学习研究顶会 ICLR 上，文青松博士作为松鼠 Ai 首席科学家及 AI 研究院负责人，其提交的七篇论文成功获选收录，这一成就不仅充分展示了他在深度学习领域的深厚造诣，也体现了松鼠 Ai 在人工智能领域持续创新的不凡实力。为深化探究文青松博士在人工智能领域研究前沿的最新贡献，并洞悉其对于这些技术在实际应用场景中未来展望的独特视角，机器之心近期与文青松博士进行了一场

李飞飞解读创业方向「空间智能」，让AI真正理解世界

李飞飞创业选择的「空间智能」，完整的 TED 解读视频公布了。前段时间，路透社独家报道了知名「AI 教母」李飞飞正在创建一家初创公司，并完成了种子轮融资。在介绍这家初创公司时，一位消息人士引用了李飞飞在温哥华 TED 上的一次演讲，表示她在此次 TED 演讲中介绍了空间智能的概念。就在今天，李飞飞在 X 上放出了她在温哥华 TED 上的完整演讲视频。她在 X 上介绍称，「空间智能是人工智能拼图中的关键一环。这是我 2024 年有关从进化到人工智能历程的 TED 演讲，也涉及到我们如何构建空间智能。从看到变为洞察，洞

ICML 2024 | 大语言模型预训练新前沿：「最佳适配打包」重塑文档处理标准

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]在大型语言模型的训练过程中，数据的处理方式至关重要。传统的方法通常通过将大量文档拼接并切分成等同于模型的上下文长度的训练序列。这虽然提高了训练效率，但也常导致文档的不必要截断，损害数据完整

Rapidus 携手 RISC-V 设计企业 Esperanto，开发低功耗数据中心 AI 芯片

日本先进晶圆代工企业 Rapidus 昨日同美国 RISC-V 架构芯片设计企业 Esperanto 签署谅解备忘录，双方将合作开发面向数据中心领域的低功耗 AI 芯片。▲ 协议签署场景。图源 Rapidus 官网新闻稿Esperanto 是一家大规模并行、高性能、高能效计算解决方案设计企业，曾推出过一款名为的 ET-SOC-1 的 RISC-V 架构众核 AI / HPC 加速芯片。该芯片采用台积电 7nm 制程，包含 1088 个 64 位 ET-Minion 节能顺序核心和 4 个用于操作系统的 ET-Max

谷歌 2 小时复仇硬刚 GPT-4o：Gemini 颠覆搜索，视频 AI 对抗 Sora

【新智元导读】被 OpenAI 提前截胡的谷歌，昨天不甘示弱地开启反击！大杀器 Project Astra 效果不输 GPT-4o，文生视频模型 Veo 硬刚 Sora，用 AI 彻底颠覆谷歌搜索，Gemini 1.5 Pro 达到 200 万 token 上下文…… 谷歌轰出一连串武器，对 OpenAI 贴脸开大。谷歌 I / O 2024 如期来了，眼花缭乱地发布了一堆更新。跟 OpenAI 半小时的「小而美」发布会相比，谷歌显然准备得更加充分，当然，时间也相当之长……▲ 2 个多小时的发布会也是挑战着观众们的

小米 AI 大模型 MiLM 正式通过备案，将逐步应用于汽车 / 手机 / 智能家居等产品

感谢据“小米公司”官方微博，今天小米大语言模型 MiLM 正式通过大模型备案，相关模型据称将逐步应用于小米汽车、手机、智能家居等产品中，后续“将面向更多用户开放体验”。小米公司 MiLM 大模型在去年 8 月首度现身 C-Eval、CMMLU 大模型评测榜单，当时这款模型在 C-Eval 总榜单排名第 10、同参数量级排名第 1。IT之家根据 GitHub 项目页给出的信息得知，MiLM-6B 是由小米公司开发的一个大规模预训练语言模型，参数规模达 64 亿。▲ 图源 MiLM-6B 的 GitHub 页面而根据

OpenAI 发布新旗舰模型GPT-4o！实时交互犹如真人，免费开放

大家好，这里是和你们一起探索 AI 的花生。5 月 14 日凌晨 OpenAI 举办了首次「春季新品发布会」，会上 OpenAI 首席技术官 Mira Murati 从 3 方面介绍了此次更新升级的要点，并实时演示了 OpenAI 最新的旗舰模型 GPT-4o 相关功能，展示了其强大的实时多模态交互性能，今天我们就一起来看看此次发布会的具体内容。OpenAI 首席技术官 Mira Murati 在主持 OpenAI 春季新品发布会一、最新旗舰模型 GPT-4o 此次发布会最大的亮点就是新旗舰模型 GPT-4o 的

使用 AI 批量造谣，一水军团伙控制 114 个账号炒作谣言获利被端

综合央视新闻、上海广播电视台《案件聚焦》消息，日前，上海市网信办公布 2023“清朗浦江”网络生态治理专项行动典型案例。其中包括“上海 4 岁儿童走失”事件中，网上出现“儿童非其父亲生”“今年已经是第二次走失”等谣言。据报道，去年国庆长假期间，“4 岁女童在上海南汇新城海滩走失”事件引发全网关注。在此期间，“走失女童曾被丢弃”“走失女童父亲为继父”等类型的言论频频引发网友热议，一些网络账号甚至炮制阴谋论，引发人身攻击。经核查，这些信息均为谣言。事件发生后，浦东警方迅速发布警情通报，通报了事件进展和调查情况，并发布辟

北京市新增 19 款已完成备案生成式人工智能服务，含小米、快手产品

感谢IT之家从“网信北京”微信公众号获悉，根据《生成式人工智能服务管理暂行办法》，北京市委网信办今日发布了北京市新增 19 款已完成备案生成式人工智能服务名单。图源 Pexels北京市生成式人工智能服务新增已备案信息显示，新增生成式人工智能模型包括中电信人工智能科技（北京）有限公司的“星辰”、小米科技有限责任公司的“小米”、北京快手科技有限公司的“可图”、北京爱奇艺科技有限公司的“奇智”、腾讯云计算（北京）有限责任公司的“行业大模型”、高德软件有限公司的“千寻”、中文在线集团股份有限公司的“中文逍遥”等。北京市委网

大模型价格进入“厘”时代，豆包大模型定价每千tokens仅0.8厘

大模型的性价比之战已经来到了新的阶段。5月15日，2024火山引擎FORCE原动力大会上，火山引擎总裁谭待宣布，字节跳动内部自研的豆包大模型正式在火山引擎上对外开放服务。豆包大模型在价格上主打“极致性价比”：豆包通用模型pro-32k版，推理输入价格0.0008元/千tokens，较行业价格低99.3%。一元钱能买到豆包主力模型的125万tokens，相当于三本《三国演义》的输入量。谭待认为，降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。过去一年时间中，许多企业已经从探索尝试大模型，到成功将大模型与核心

Ilya官宣离职，超级对齐负责人Jan直接辞职，OpenAI还是走散了

今天，OpenAI 联合创始人、首席科学家 Ilya Sutskever 发推宣告离职。在 OpenAI 工作近 10 年后，我做出了离开的决定。OpenAI 的发展轨迹可以称得上是奇迹，我相信 OpenAI 会在 Sam Altman、Greg Brockman 和 Mira Murati 的领导下，以及 Jakub Pachocki 的出色研究领导下构建安全有益的 AGI。能够一起工作是一种荣幸，我会非常想念大家。这么久了，感谢你们大家所做的一切。我对接下来发生的事情感到兴奋，接下来从事的这个项目对我来说非常

首个中文原生DiT架构！腾讯混元文生图大模型全面开源，免费商用

中文 AI 社区迎来了一个好消息：与 Sora 同架构的开源文生图大模型来了！5 月 14 日，腾讯宣布旗下混元文生图大模型全面升级并全面开源，目前已在 Hugging Face 平台及 GitHub 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。官网地址：项目地址： Face 模型地址：：据了解，这是业内首个中文原生的 DiT 架构文生图开源模型，支持中英文双语输入及理解，参数量 15 亿。升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构，即全新的 Huny

告别3D高斯Splatting算法，带神经补偿的频谱剪枝高斯场SUNDAE开源了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本论文作者包括帝国理工学院硕士生杨润一、北航二年级硕士生朱贞欣、北京理工大学二年级硕士生姜洲、北京理工大学四年级本科生叶柏均、中国科学院大学本科大三学生张逸飞、中国电信人工智能研究院多媒体

IMF 总裁警告：AI 将对劳动力市场造成海啸般打击，影响全球四成岗位

据路透社报道，国际货币基金组织（IMF）总裁克里斯塔利娜・格奥尔基耶娃（Kristalina Georgieva）近日在瑞士苏黎世出席活动中表示，AI 将对劳动力市场造成“海啸般”的打击。格奥尔基耶娃称：“我们几乎没有时间让人们和企业为此做好准备”。正如IT之家此前报道中提到的，她认为 AI 可能在未来两年影响全球四成工作岗位，而 AI 浪潮对发达经济体的岗位影响更大，比例将达到 60%。格奥尔基耶娃补充到：“如果我们管理得当，它（AI）可以极大地提高生产力，但也可能导致更多的错误信息，同时加剧社会的不平等。”这位

谷歌 AI 视频搜索功能演示又翻车，Gemini 给出错误维修建议

在今天的谷歌 I / O 大会上，谷歌大肆宣传其名为 Gemini 的人工智能将接管搜索引擎领域。然而，在其炫酷的演示环节中，Gemini 却再次暴露了所有大型语言模型至今为止都存在的致命缺陷：自信满满地给出错误答案。在 “Gemini 时代下的搜索” 演示片段中，谷歌展示了其视频搜索功能，用户可以通过拍摄短视频并用语音提问进行搜索。演示的例子是一个卡住的胶片相机过片杆，用户询问“为什么扳杆无法移动到底”，Gemini 则识别出问题并提供了维修建议。然而问题在于，Gemini 给出的答案整体而言令人啼笑皆非。谷歌

为什么人工智能可以给数学带来革命性变化

编辑 | 白菜叶「提出一个猜想——一个被怀疑为真的命题，但需要明确的证明——对数学家来说就像是神圣灵感的时刻。数学猜想不仅仅是有根据的猜测。制定它们需要天才、直觉和经验的结合。即使是数学家也很难解释自己的发现过程。然而，与直觉相反，我认为这是机器智能最初最具变革性的领域。」英国伦敦数学科学研究所所长 Thomas Fink 说。2017 年，伦敦数学科学研究所的研究人员开始将机器学习应用于数学数据，作为一种爱好。在 COVID-19 大流行期间，他们发现简单的人工智能（AI）分类器可以预测椭圆曲线的排名——衡量其复

多功能RNA分析，百度团队基于Transformer的RNA语言模型登Nature子刊

编辑 | 萝卜芯预训练语言模型在分析核苷酸序列方面显示出了良好的前景，但使用单个预训练权重集在不同任务中表现出色的多功能模型仍然存在挑战。百度大数据实验室（Big Data Lab，BDL）和上海交通大学团队开发了 RNAErnie，一种基于 Transformer 架构，以 RNA 为中心的预训练模型。研究人员用七个数据集和五个任务评估了模型，证明了 RNAErnie 在监督和无监督学习方面的优越性。RNAErnie 超越了基线，分类准确率提高了 1.8%，交互预测准确率提高了 2.2%，结构预测 F1 得分提高