今年最被低估的AI模型之一,重现李小龙功夫音
AI好好用报道编辑:Sia音频视频的同步生成,是时候开卷了~承认吧,虽然谷歌 Veo2 在视频生成上完虐了 Sora,但生成的还是个默片。 没声音的 AI 视频,说白了就是个半成品。 看看这组数字:谷歌开放的大规模音频数据集 AudioSet 显示,82% 以上的视频都有人声或音乐;去年抖音上传的 100 多亿条视频里,差不多八成都配了背景音乐。...- 0
- 0
- 972
突破数据瓶颈!交大研发电脑智能体,让 AI 替你熬夜做 PPT
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。...- 0
- 0
- 971
GPT5基本玩崩了!谷歌和Meta胜算很大!AI投资人爆料:Meta承接谷歌搜索后,或收购某独角兽,OpenAI其实贼挣钱
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)临近年尾,相信很多朋友都在盘点这一年。 很多人都在有意无意地在围观大模型这场全明星球赛。 OpenAI、谷歌、Anthropic、Meta,还有马斯克的 XAI,以及AI应用层面比如Perplexity等一众新秀球员,究竟谁会技压群雄,赢得接下来的2025?...- 0
- 0
- 973
Agent 的基本架构
根据《A survey on large language model based autonomous agents》智能体综述文章,Agent核心是需要具备以下几个核心特性与模块:Profile模块: Profile 模块的目的主要是做Agent角色认定,回答的核心问题有: 我是谁? 我在哪? 我该干什么?...- 0
- 0
- 971
OpenAI发布推理模型o3及其精简版o3-mini
12月23日消息,据外媒报道,在为期12天的发布会上,OpenAI宣布了其新一代推理模型o3和精简版o3-mini,专门设计用于在回答问题之前进行更深入的思考,以提高准确性。 据介绍,o3模型在ARC-AGI基准上取得了优异的表现,成为第一个超越这一基准的AI模型,展示了接近人类水平的问题解决能力。 o3系列在ARC-AGI基准上的最低性能可以达到75.7%,加上额外的计算资源,性能可以提高到87…...- 0
- 0
- 971
2025年技术趋势预测:采用AI技术的公司面临众多安全挑战
12月23日,据SUSE发布的2025年技术趋势预测,到2025年,企业将面临新兴威胁和机遇并存的复杂环境。 要在这个充满变化的环境中保持领先,企业必须把数字韧性、安全和创新放在首位。 第一,云原生可观测性:数字韧性的基石。...- 0
- 0
- 970
时隔6年BERT升级!仅编码器架构没被杀死,更快更准确更长上下文
时隔6年,一度被认为濒死的“BERT”杀回来了——更现代的ModernBERT问世,更快、更准、上下文更长,发布即开源! 去年一张“大语言模型进化树”动图在学术圈疯转,decoder-only枝繁叶茂,而曾经盛极一时的encoder-only却似乎走向没落。 ModernBERT作者Jeremy Howard却说:encoder-only被低估了。...- 0
- 0
- 974
106万一只骑士狗!国产机器狗燃爆外网:在悬崖俯冲、水面冲刺,还能给人当坐骑!英伟达大佬揭秘技术跃迁:2025是奖励工程元年!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)这可能是你今年看过最燃、最刺激的机器人影片! 从悬崖边翻个跟头然后一路加速俯冲:图片狂奔到水库中,在水面上仍然全速前行:图片穿越杂草丛生的森林坡地:图片还能当坐骑,驮着成年人翻阅山丘! 图片 106万一只骑士狗!...- 0
- 0
- 972
LeCun最新访谈:距离AGI可能不到10年,下一代AI需要情感和视觉训练
头戴Meta爆火智能眼镜,LeCun再次表示人类距离AGI的时间没有那么近,“大约在5-10年”,对语言模型发展的判断更是不乐观。 未来在哪? 还是得看世界模型。...- 0
- 0
- 973
图森未来董事长陈默:图森未来重生了,股价回到 40 元时才会原谅自己
图森未来董事长陈默今日发文感谢各股东在图森未来发生了许多不愉快的事后,仍选择相信管理团队和自己!直言“今天是图森未来重生的一天。”...- 0
- 0
- 972
OpenAI被曝数据崩溃GPT-5难产,团队抢算力冲突激烈!Ilya预言成真?
OpenAI轰轰烈烈搞出一场12天圣诞特别活动,结果期间发布最轰动成果的,居然是谷歌。 谷歌一发发密集的核弹,让OpenAI分成12天的挤牙膏黯然失色,毫无还手之力。 原生多模态Gemini 2.0 Flash,demo惊艳的Project Astra,组团出道的AI智能体,效果吊打Sora掀起全网狂潮的Veo 2……显得OpenAI的圣诞活动仿佛是个笑话。...- 0
- 0
- 973
空间蛋白质组学:构建复杂组织的尺度图谱
编辑丨toileter当人类前行至远方,我们以自己的脚步衡量出道路,以道路为丝线绘制出这片大地的地图。 而现在,我们将目光望进自己的体内,意图探索生物系统的交错复杂。 与此,空间蛋白质组学为我们带来了更清晰的笔迹,使得人类在对抗疾病的道路上得以踏上更便捷的道路。...- 0
- 0
- 970
超三万种材料,近百万真实材料合成表征信息,LLM精准构建材料知识图谱MKG,登NeurIPS 2024
编辑 | ScienceAI知识图谱集成多源数据信息为结构化知识,以阐明复杂科学领域的数据结构并介导研究进展、创新和应用的结构化知识交流。 为了统筹和分析分散在数以百万计的文献中的材料学知识,新南威尔士大学(UNSW)、同济大学、香港城市大学以及 GreenDynamics 律动造物,构建了材料知识图谱(MKG)。 该团队依托于大型语言模型独立设计的本体论,并自动化地提取及清洗了大量的材料学文献中…...- 0
- 0
- 970
AI视频生成平台全球前3,成本暴降50%方案开源!500元GPU算力免费薅
近期免费上线的视频生成平台Video Ocean,支持任意角色、任意风格,可以文生视频、图生视频、角色生视频,引起广泛关注与肯定,登上Product Hunt全球产品热度榜单第三。 体验地址: Ocean如何以极低成本快速完成迭代? 开源解决现已方案发布。...- 0
- 0
- 972
2025年科技领域的七个预测
过去一年,科技领域竟可被奇特地描述为平静而持续进步的一年。 经历了2023年的动荡,包括OpenAI的首席执行官Sam Altman的离职与回归、英伟达的崛起和FTX的陨落,2024年的故事则平稳得多。 今年,AI模型和应用取得了有意义的进步,增加了更深的记忆、更长的上下文窗口、更快的计算速度、广泛可用的视频生成以及更高的智能。...- 0
- 0
- 971
Anthropic预测:2025是智能体系统年!年终总结分享最佳实践
模型到应用之间的距离,就是烧钱与搞钱之间的距离。 这条路上,Agent已经身经百战,万事俱备。 在这个2024的结尾,Anthropic开发者关系主管Alex Albert表示:2025年将是智能体系统之年!...- 0
- 0
- 975
Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理
对 AI 研究者来说,数学既是一类难题,也是一个标杆,能够成为衡量 AI 技术的发展重要尺度。 近段时间,随着 AI 推理能力的提升,使用 AI 来证明数学问题已经成为一个重要的研究探索方向。 著名数学家陶哲轩就是这一方向的推动者,他曾表示:未来数学家可以通过向类似 GPT 的 AI 解释证明,AI 会将其形式化为 Lean 证明。...- 0
- 0
- 970
o3智商高达157?每13333人中才有一个这么高,网友:编码分数无意义
从韦氏智商测试来看,如果 o3 的 IQ 真这么高,则称得上非常优秀。 OpenAI o3 的智商(IQ)竟然已经这么高了吗今天,Reddit 上一则热帖宣称「OpenAI o3 的 IQ 估计为 157」,并放出了一张数据图。 这意味着什么呢?...- 0
- 0
- 970
字节整新活!照片+音频让蒙娜丽莎秒变播客主理人
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。...- 0
- 0
- 973
热点资讯
- 1
刚刚,AI颠覆物理模拟:一句话精准仿真,学术圈半壁江山联手耗时24个月研究成果
- 2
历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物
- 3
细节表现超Sora,网友:真正的国产之光!MiniMax视频模型再上新
- 4
2024年AI 编程现在可以做到什么程度?
- 5
实测来了!Kimi发布k1视觉思考模型,实力颠覆K12教育赛道,涌现能力强得可怕,免费可用!网友:国产之光!
- 6
超越所有SOTA!最新UniScene:视频点云Occ三大生成任务全部暴力提升~
- 7
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
- 8
抢跑OpenAI!谷歌Gemini 2.0震撼登场:全面转向Agent,多模态输入输出,免费随便玩