资讯列表
GitHub超火开发者路线图库有AI学习路线了!star数近30万
学习 AI 不再迷失方向。 AI 大时代,每天都有层出不穷的新技术、新方法、新模型、新应用…… 想要去学却又似乎无从下手? 这里正好有一个你需要的资源:开发者路线图资源库(developer-roadmap)!
当视觉大模型陷入认知失调,马里兰大学构建了一个幻觉自动生成框架
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
OpenAI大改下代大模型方向,scaling law撞墙?AI社区炸锅了
大模型的 scaling law 到头了? 行业龙头 OpenAI 在转换策略。 有研究预计,如果 LLM 保持现在的发展势头,预计在 2028 年左右,已有的数据储量将被全部利用完。
字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图
11月11日,字节在豆包大模型团队官网上公布最新通用图像编辑模型SeedEdit。 SeedEdit支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。 目前,该模型已经在豆包PC端及即梦网页端开启测试。
字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图
11月11日,字节在豆包大模型团队官网上公布最新通用图像编辑模型SeedEdit。 SeedEdit支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。 目前,该模型已经在豆包PC端及即梦网页端开启测试。
六位专家探讨如何平衡IT项目、支出和风险
要构建一个具有韧性的技术体系,高管董事会必须在拥抱新技术的同时管理风险,并使支出与业务目标相一致。 企业技术领导者已从其企业获得了明确的指示:利用最佳技术支持更广泛的业务目标。 为了实现这一目标,CIO需关注两个关键因素:成本和风险。
Gartner公布2025年十大技术趋势:代理AI、机器人和虚假信息安全
IT研究公司Gartner预测了2025年的十大技术趋势,其中包括代理AI技术的兴起、对虚假信息网络安全解决方案的需求、以及可以遵循人类指令的多功能机器人。 Gartner最大胆的一些预测包括,到2028年至少有15%的日常工作决策将通过代理AI自主做出,而今年这一比例是0%。 AI代理的兴起,将需要AI治理方面的完善和需要新技术以打击虚假信息。
哈佛推出全新类ChatGPT癌症诊断AI,登上Nature!准确率高达96%
近日,来自哈佛医学院等机构的科学家们开发了一种名为CHIEF(Clinical Histopathology Imaging Evaluation Foundation,临床组织病理学成像评估基础)的多功能AI癌症诊断模型。 并于9月4日登上「Nature」。 论文地址:,尽管最近出现了其他用于医学诊断的病理图像基础AI模型,但CHIEF是第一个能够预测患者预后并在多个国际患者群体中验证的模型。
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密
到现在为止,我们仍旧对大模型「幻觉」如何、为何产生,知之甚少。 最近,来自Technion、谷歌和苹果的研究人员发现,LLM「真实性」的信息集中在特定的token,而且并得均匀分布。 正如论文标题所示,「LLM知道的往往要比表现出来的更多」。
湾区聚力 开源启智
当下,全球数字化浪潮席卷而来,开源技术已成为科技创新和产业升级的关键驱动力。 11月9-10日,以“湾区聚力 开源启智”为主题的2024 CCF中国开源大会在深圳隆重举行。 本届大会由中国计算机学会主办,CCF开源发展委员会、鹏城实验室、新一代人工智能产业技术创新战略联盟(AITISA)联合承办,中电金信软件有限公司、华为技术有限公司协办,天工开物开源基金会提供特别支持。
OpenAI奥特曼最新对话:将很快进入智能体阶段;OpenAI最初三个目标一个已失效;智慧和能源可解锁AGI;马斯克比我做更多
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)2025,OpenAI会有哪些动作? Sam Altman定下了哪些目标? 如何看待自“宫斗”后相创始员工离职潮,以及大模型创业公司的壁垒和未来在哪里?
学生党狂喜,物理图表动起来!受力分析、光学、电路图等全自动交互
在上物理课的时候,大家应该都有过那种「图太抽象了」的体会吧,需要靠空间想象力才能感受到出题人的想法。 而在电子教学时代,物理图可以是动态、可交互的,有助于更深入地理解复杂原理,能够比教科书或视频提供更丰富、更难忘的学习体验,也可以让学生更积极参与到复杂概念的实验中,但是创建交互式模拟既耗时又需要大量的编程工作,所以大部分教学场景只能用已经制作好的模拟图,有时无法完全满足学生对学习材料的特定需求,甚至切换教科书和外部交互视频的过程还会分散学生注意力。 最近,卡尔加里大学、科罗拉多大学博尔德分校及Adobe的研究人员提出了一个全新的方法增强物理(Augmented Physics),通过从静态教科书图表中提取和增强内容来创建交互式物理模拟;利用「Segment-Anything」和多模态LLM等先进的计算机视觉技术,可以半自动地从教科书页面中提取图表,并基于提取的内容生成交互式模拟。
奥特曼专访自曝OpenAI掌握AGI密钥,2025年降临!1人1万块GPU缔造十亿独角兽
1个人 10000个GPU,就能打造价值10亿美元的公司? OpenAI已经掌握了通往AGI的内部路径,我们距ASI只有几千天时间了? 就在最近,OpenAI CEO奥特曼在最新访谈里,再次爆出不少金句。
多模态模型免微调接入互联网,即插即用新框架,效果超闭源商用方案
一个5月份完成训练的大模型,无法对《黑神话·悟空》游戏内容相关问题给出准确回答。 这是大模型的老毛病了。 因为《黑神话》8月才上市,训练数据里没有它的相关知识。
腾讯语音合成技术:模型优化与推理加速实践
一、背景-产品展示首先,让我们来看一下腾讯自研的知音语音大模型在语音合成领域的应用展示。 该模型能够提供更自然、韵律丰富且实时性更强的语音合成体验。 其两大显著优点如下:声音复刻:仅需 10 秒音频即可完成声音复刻。
我为什么离开OpenAI?六年元老发离职长文:AGI将至,我们远没准备好
OpenAI的「员工叛逃」还没有结束。 近日,OpenAI又有一位6年元老、研究主管Miles Brundage发表长文官宣离职,并详细解释了自己为何「出走」。 作为一家年轻的AI独角兽,成立于2015年的OpenAI如今刚刚9岁,因此在公司待了6年之久的Brundage足以被称为「元老」,见证了OpenAI如何一路起伏、筚路蓝缕地走到今天。
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队! HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。 通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。
最小化的递归神经网络RNN为Transformer提供了快速高效的替代方案
译者 | 李睿审校 | 重楼Transformer如今已经成为大型语言模型(LLM)和其他序列处理应用程序的主要架构。 然而,它们固有的二次方计算复杂性成为了将Transformer扩展至超长序列时的巨大障碍,显著增加了成本。 这引发了人们对具有线性复杂性和恒定内存需求的架构的兴趣。