AI在线 AI在线

开源

开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测来了!

当很多 AI 公司还就是否该走开源路线而感到左右为难时,阿里的技术团队又开源了一个新的模型 —— 万相(Wan)视频生成大模型(包括全部推理代码和权重,最宽松的开源协议)。 经常玩视频生成模型的同学应该知道,当前的很多模型仍然面临多方面挑战,比如难以还原复杂的人物动作,处理不好物体交互时的物理变化,遇到长文本指令就「选择性遵循」等。 如果三个方面都做得比较好,那模型厂商多半是不舍得开源的。
2/26/2025 9:44:14 AM
机器之心

DeepSeek开源周第3天:发布DeepGEMM,FP8 GEMM库助力AI训练与推理

中国人工智能公司DeepSeek在其“开源周”第3天宣布推出DeepGEMM——一款支持FP8通用矩阵乘法(GEMM)的开源库。 这一工具专为密集型和混合专家(MoE)矩阵运算设计,为DeepSeek V3和R1模型的训练与推理提供强大支持。 官方消息通过X平台发布,迅速引发技术社区的热烈反响。
2/26/2025 9:33:00 AM
AI在线

阿里通义千问推出推理模型QwQ-Max预览版 可在qwen.ai域名体验

2月25日,阿里巴巴宣布推出基于Qwen2.5-Max的推理模型QwQ-Max-Preview,并计划全面开源其最新推理模型QwQ-Max和Qwen2.5-Max。 此次发布的QwQ-Max-Preview是一个预览版本,阿里巴巴表示,正式版本将很快推出,并基于Apache2.0许可证全面开源。 与以往不同的是,此次开源不仅包括模型本身,还涵盖了更小的版本,如QwQ-32B,这些版本可以部署在本地设备上,进一步推动AI技术的普及和应用。
2/25/2025 8:35:00 AM
AI在线

DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

就在刚刚,DeepSeek放出了开源周首日的重磅炸弹——FlashMLA。 这是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核,特别针对变长序列进行了优化,目前已正式投产使用。 经实测,FlashMLA在H800 SXM5平台上(CUDA 12.6),在内存受限配置下可达最高3000GB/s,在计算受限配置下可达峰值580 TFLOPS。
2/24/2025 11:32:57 AM
dream

国外权威认证!DeepSeek超150万模型,成最受欢迎开源大模型

今天凌晨3点,全球最大开源平台之一huggingface联合创始人兼首席执行官Clement Delangue发布了最新数据:中国开源大模型DeepSeek-R1在150万模型中,成为该平台最受欢迎的开源大模型,点赞超过1万。 前不久,Clement还特意发文恭喜DeepSeek-R1的下载量超过1000万次,同样创造了huggingface平台有史以来最受欢迎的模型。 看来,Clement也吃到DeepSeek的红利了,对它是真爱啊连续表扬。
2/24/2025 10:01:23 AM
AIGC开放社区

月之暗面开源改进版Muon优化器,算力需求比AdamW锐减48%,DeepSeek也适用

算力需求比AdamW直降48%,OpenAI技术人员提出的训练优化算法Muon,被月之暗面团队又推进了一步! 团队发现了Muon方法的Scaling Law,做出改进并证明了Muon对更大的模型同样适用。 在参数量最高1.5B的不同Llama架构模型上,改进后的Muon算力需求仅为AdamW的52%。
2/24/2025 9:15:00 AM
量子位

不到1美元,打造全球第3超强AI助手!港大3人开源最强Deep Research

OpenAI的Deep Research一经发布便引发了全网的热议。 作为新一代通用AI助手,它具备自主搜索和分析互联网海量信息的能力,并能通过编程手段对复杂数据进行深度分析,迅速在全球范围内获得了极大反响。 在即将到来的AGI时代,各行各业都需要这样的智能助手来提升工作效率。
2/24/2025 8:47:00 AM
新智元

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

DeepSeek啥都开源了,就是没有开源训练代码和数据。 现在,开源RL训练方法只需要用1/30的训练步骤就能赶上相同尺寸的DeepSeek-R1-Zero蒸馏Qwen。 国内大模型六小强之一的阶跃星辰联与清华联合发布Open Reasoner Zero(ORZ),由AI大拿沈向洋、阶跃星辰创始人/CEO姜大昕、ResNet作者张祥雨等一众大佬亲自署名。
2/24/2025 8:40:00 AM
量子位

国产 AI 大模型加速迭代,厂商迈向开源、集聚化

据央视新闻报道,在上海举行的 2025 全球开发者先锋大会上,多家厂商展示了自家在 AI 大模型方面的落地应用,涉及“可跟随使用者的抚摸和语言随机互动的AI仿生宠物”、“城市节水AI智能系统”等。
2/23/2025 9:19:42 PM
归泷(实习)

阿里国际开源Ovis2系列多模态大语言模型 共有六个版本

2025 年 2 月 21 日,阿里巴巴国际化团队宣布其新型多模态大语言模型Ovis2 系列正式开源。 Ovis2 是阿里巴巴国际化团队提出的Ovis系列模型的最新版本。 与前序1.
2/21/2025 5:23:00 PM
AI在线

刚刚,DeepSeek官宣:下周将是重磅开源周!网友:真正的OpenAI来了!

DeepSeek在X上发布推文,为即将到来的开源周预热。 下周起,DeepSeek将连续开源5个代码库! DeepSeek的通知翻译如下:我们是一个小团队@deepseek_ai ,正在探索 AGI。
2/21/2025 3:18:20 PM

超给力!DeepSeek 宣布下周开源五个项目

近日,DeepSeek 在其官网 X 账号上发布了重磅消息,宣布将在接下来的一个星期内陆续开源五个代码库。 该公司表示,当前已经完成的在线服务模块经过严格的测试和部署,已具备投入生产环境的条件。 DeepSeek 强调,分享代码的初衷在于希望每一行代码都能成为推动行业前进的强大动力。
2/21/2025 1:45:00 PM
AI在线

Deepseek宣布将连续五天发布5个开源项目 推动社区创新

北京时间,2025年2月21日,专注于探索通用人工智能(AGI)的 DeepSeek AI 团队在社交媒体上发布了一则振奋人心的消息,正式拉开了他们参与 #OpenSourceWeek 活动的序幕。 这家小型但充满雄心的技术团队宣布,从下周开始,他们将开源5个代码仓库,以完全透明的方式与全球开发者社区分享他们的研究进展。 在2月25日北京时间12:00发布的推文中,DeepSeek AI 用轻松而真诚的语气写道:“我们是 @deepseek_ai 的一个小团队,正在探索 AGI。
2/21/2025 12:51:00 PM
AI在线

DeepSeek R1范式复现笔记

作者 | yulei自DeepSeek R1技术报告🐳开放以来,开源社区涌现了多种「复现」工作。 本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标,探索R1/R1-zero中强化学习步骤带来的模型效果提升,并尝试展望R1技术在未来模型训练与业务落地上的前景。 一、R1 开源项目梳理目前主流的 R1 系列复现工作如表 1 所示。
2/20/2025 3:32:28 PM
腾讯技术工程

李彦宏解读文心大模型 4.5 开源的意义:开源促进技术普及

在最近的财报电话会上,百度创始人李彦宏就文心大模型4.5系列的开源决策进行了深入的分析。 他表示,从其自主研发的 DeepSeek 项目中,百度深刻认识到开源的最佳模型将大大推动用户的使用和接受程度。 当一个强大的模型实现开源时,自然会吸引更多的人出于好奇心进行尝试,这样的行为不仅能够促进技术的普及,也会带来更广泛的应用。
2/19/2025 10:02:00 AM
AI在线

李彦宏回应开源文心4.5:DeepSeek让我们明白要开源

近日,百度创始人李彦宏在百度2024年四季度及全年财报电话会上,就公司决定开源文心大模型4.5系列的原因进行了详细阐述。 李彦宏指出,百度从DeepSeek项目中汲取了宝贵经验,即开源最佳模型能够极大地促进用户对该模型的采用和认可。 他解释称,当一个模型被开源后,人们的好奇心会驱使他们进行尝试,这种自然的探索行为有助于模型更广泛地应用于实际场景中。
2/19/2025 9:00:24 AM
AI在线

OpenAI突宣开源计划:端侧模型or小模型二选一!奥特曼在线征集投票全球最大开源视频模型,现在也Created in China了,阶跃出品

刚刚,阶跃星辰联合吉利汽车集团,开源了两款多模态大模型! 新模型共2款:全球范围内参数量最大的开源视频生成模型Step-Video-T2V行业内首款产品级开源语音交互大模型Step-Audio多模态卷王开始开源多模态模型,其中Step-Video-T2V采用的还是最为开放宽松的MIT开源协议,可任意编辑和商业应用。 (老规矩,GitHub、抱抱脸、魔搭直通车可见文末)在两款大模型的研发过程中,双方在算力算法、场景训练等领域优势互补,“显著增强了多模态大模型的性能表现”。
2/18/2025 1:30:00 PM
量子位

OpenAI 要开源新模型?CEO 奥尔特曼公开征求意见

OpenAI 首席执行官萨姆・奥尔特曼于当地时间 2 月 17 日在 X 社交平台上发文,就公司下一个开源项目的方向征询公众意见。他提出了两种可能的开源模型方向:一种是“相当小但仍需在 GPU 上运行的 o3-mini 级模型”,另一种则是“尽可能优化的手机大小模型”。这或许意味着 OpenAI 即将开源新的大模型,也将是 2019 年 OpenAI 开源 GPT-2 之后再次开源某个大模型。
2/18/2025 12:06:39 PM
远洋