资讯列表

OpenAI o1 推理模型 API 上线,仅面向特定开发者开放

“OpenAI 12 天”活动进入第 9 天,OpenAI 今日宣布,其“推理”人工智能模型 o1 正式通过 API 向部分开发者开放,并同步更新了包括 GPT-4o、实时 API 以及微调 API 等多项开发者工具。

AI大模型时代,人才的需求已经变了

什么是 AI 发展的第一驱动力? 最近,全球科技大厂都在用行动告诉我们:人才。 本月初,谷歌 NotebookLM 的核心团队共同宣布离职创业,他们新公司的网站已经进入了「建设中」的状态。

3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源

如果给小模型更长的思考时间,它们性能可以超越更大规模的模型。 最近一段时间,业内对小模型的研究热情空前地高涨,通过一些「实用技巧」让它们在性能上超越更大规模的模型。 可以说,将目光放到提升较小模型的性能上来有其必然性。

OpenAI被偷家,谷歌Veo 2反超Sora

视频生成领先 OpenAI 了? 今天是个好日子,至少谷歌这么想。 几个小时前,该公司一键三连,一口气发布了两款视觉生成模型和一个工具:Veo 2:视频生成模型,可使用文本或图像 prompt 生成高真实感、高质量的视频;Imagen 3:文生图模型,可更忠实地遵从提示词,实现更加丰富的细节和纹理渲染;Whisk:图生图工具,基于 Imagen 3 与 Gemini 的视觉理解和描述能力打造,能让用户更加方便地调整图像的场景、风格和物体。

NeurIPS Spotlight | 基于信息论,决策模型有了全新预训练范式统一框架

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

我国科学家建立生成式模型为医学 AI 训练提供技术支持

近年来,研究者们开始探索使用生成式 AI 技术合成医学影像数据,以此来扩充数据。

举报人「自杀」,OpenAI表示震惊!NYU教授发长文悼念:警钟仍在回响

几天前,消息曝出,曾在OpenAI工作四年,指控公司侵犯版权的Suchir Balaji,上月底在旧金山公寓中被发现死亡,年仅26岁。 Suchir Balaji曾参与了ChatGPT后训练、GPT-4预训练,以及o1推理的研发工作。 今年10月,他在自己的一篇博文和「纽约时报」的专访中指出,OpenAI在使用新闻和其他网站的信息训练其AI模型时,违反了「合理使用」原则。

GPU 资源调度:k8s-device-plugin 知多少 ?

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 基于 k8s-device-plugin 机制所实现的 GPU . 资源动态调度。 近几年,随着大数据和人工智能技术的迅猛发展,AI 应用场景日益丰富,成为推动产业升级的重要驱动力。

Differential Transformer: 通过差分注意力机制提升大语言模型性能

Transformer模型已经成为大语言模型(LLMs)的标准架构,但研究表明这些模型在准确检索关键信息方面仍面临挑战。 今天介绍一篇名叫Differential Transformer的论文,论文的作者观察到一个关键问题:传统Transformer模型倾向于过分关注不相关的上下文信息,这种"注意力噪声"会影响模型的性能。 在这篇论文中,作者注意到transformer模型倾向于关注不相关的上下文。

数据分布检验利器:通过Q-Q图进行可视化分布诊断、异常检测与预处理优化

在机器学习和数据分析中,我们经常需要验证数据是否符合某种特定的分布(如正态分布)。 这种验证对于选择合适的统计方法和机器学习模型至关重要。 例如许多统计检验和机器学习算法都假设数据服从正态分布。

企业如何应对AI模型中的偏见和隐私挑战

在采访中,Holistic AI的联合首席执行官Emre Kazim讨论了公司从一开始就需要将负责任的AI实践融入其业务战略的必要性。 他探讨了如何解决偏见、隐私和透明度等问题,这需要一种积极主动且全面的方法,而不仅仅是遵守法规。 公司如何解决AI模型中的偏见、隐私问题和缺乏透明度的情况?为了应对这些挑战及其他更多问题,公司需要制定一个清晰且积极主动的AI治理计划。

视觉模型进入MoE时代!DeepSeek开源全新视觉模型VL2,逆向由图生成代码、梗图解析、几张图生成一篇童话!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)12月13日晚,国内开源模型玩家深度求索发布了视觉模型 DeepSeek-VL2。 这次DeepSeek视觉模型给这一领域带来了不少看新看点:1、模型层面,视觉模型也可以使用 MoE 架构,而且可以配合动态切图2、新增了不少生成玩法,如:视觉定位,模型可以根据提示识别出物体的边界范围,再比如梗图理解和解析。 3、图表理解:可以根据plot图逆向生成代码。

北大开源全新图像压缩感知网络:参数量、推理时间大幅节省,性能显著提升 | 顶刊TPAMI

压缩感知(Compressed Sensing,CS)是一种信号降采样技术,可大幅节省图像获取成本,其核心思想是「无需完整记录图像信息,通过计算即可还原目标图像」。 CS的典型应用包括:降低相机成本:利用廉价设备就能拍摄出高质量图像;加速医疗成像:将核磁共振成像(MRI)时间从40分钟缩短至10分钟内,减少被检查者的不适;探索未知世界,助力科学研究:将「看不见」的事物变为「看得见」,如观测细胞活动等转瞬即逝的微观现象,以及通过分布式射电望远镜观测银河系中心的黑洞。 CS的两个核心问题是:如何设计采样矩阵,从而尽可能多地保留图像信息?

宇树机器人强化学习代码全面开源,还有训练到仿真和实操手把手教学

9.9万元起,还能够大规模量产的国产人形机器人,表现得实在是太6了:而且还走上了开源路线,就在刚刚,宇树机器人开源的强化学习代码又更新了! 更新之后不再是只能训练——不仅能够仿真运行,还能部署到实体机器,整个过程所有代码全部开放。 一开始,宇树开源的是英伟达Issac Gym平台上的训练代码,这次新增了对MuJoCo模拟仿真的支持。

消息称马斯克与台积电董事长魏哲家见面,透露特斯拉未来的重心是 Optimus 人形机器人

据中国台湾媒体工商时报报道,特斯拉 CEO 埃隆・马斯克上周在美国会见了台积电董事长魏哲家。会面中,马斯克强调了台积电为特斯拉提供足够产能以生产其自主研发的 Dojo 芯片的重要性,该芯片将使用台积电的 5nm 工艺制造并采用 InFO-SoW 先进封装。

语言游戏让 AI 自我进化,谷歌 DeepMind 推出苏格拉底式学习

近日,谷歌 DeepMind 的研究人员推出了苏格拉底式学习,在没有外部数据的情况下,让 AI 通过语言游戏不断变强。

语言游戏让AI自我进化,谷歌DeepMind推出苏格拉底式学习

没有外部数据,AI自己也能进化? 听起来有点吓人,于是谷歌DeepMind的这项研究很快引起了广泛关注。 图片论文地址:「苏格拉底式学习」(Socratic Learning),能够使AI系统自主递归增强,超越初始训练数据的限制。

开源Llama版o1来了,3B小模型反超80B,逆向工程复现OpenAI新Scaling Law

o1完整版公开仅10天,Scaling Law新范式就被逆向工程复现了! Hugging Face官方发文,开源了扩展测试时计算的方法。 用在小小小模型Llama 1B上,数学分数直接超过8倍大的模型,也超过了计算机科学博士生的平均分数(40%)。