开源

Open-Sora 2.0全面开源，20万复刻百万级大片！11B媲美闭源巨头，224张GPU创奇迹

今天，视频生成领域迎来开源革命！ Open-Sora 2.0——全新开源的SOTA（State-of-the-Art）视频生成模型正式发布，仅用20万美元（224张GPU）成功训练出商业级11B参数视频生成大模型，性能直追HunyuanVideo和30B参数的Step-Video。权威评测VBench及用户偏好测试均证实其卓越表现，在多项关键指标上媲美动辄数百万美元训练成本的闭源模型。

3/13/2025 10:26:45 AM

新智元

百万美金炼出「调参秘籍」！阶跃星辰开源LLM最优超参工具

近日，阶跃星辰研究团队通过大规模实证探索，耗费了近 100 万 NVIDIA H800 GPU 小时（约百万美元），从头训练了 3,700 个不同规模，共计训了 100 万亿个 token，揭示了 LLM 超参数优化的全新的普适性缩放规律，为更好地提升 LLM 性能，提供了开箱即用的工具。该研究也是第一个全面研究模型最优超参随着 Model Shape、Dense/MoE、预训练数据分布的变化，是否稳定不变的工作。研究中凸显出 Step Law 的鲁棒性，大大增加了该工具的实用性和普适性。

3/13/2025 9:20:20 AM

机器之心

Manus逼OpenAI开源智能体框架，网友：已从行业领导者变为跟随者

OpenAI又开源了，这次是一套智能体开发框架。联网搜索、文件搜索、计算机使用（Computer Use），统统打包，GitHub 8小时上千星。图片奥特曼认为其中的API是有史以来（并没有限定在OpenAI范围内）设计最完善、最实用的之一。

3/12/2025 11:34:35 AM

DeepSeek 开源的 DualPipe，居然是梁文峰写的，你感性？

继DeepGEMM之后，deepseek开源了第四弹DualPipe。今天来简单聊聊DualPipe，包懂。 DualPipe是干嘛的？

3/12/2025 10:36:32 AM

架构师之路

微软开源多模态AI基础模型！无需额外微调轻松拿捏网页、机器人

微软研究院官宣开源多模态AI——Magma模型。首个能在所处环境中理解多模态输入并将其与实际情况相联系的基础模型。该模型近期已被计算机视觉顶会CVPR接收，只要给定一个目标描述，Magma就能制定计划、执行行动，无论是在数字界面中还是物理世界里，都能展现出灵活而高效的交互能力。

3/11/2025 9:35:00 AM

量子位

Manus被破解了？曝出系统提示词和背后大模型，CTO也回复了

最近几天，一个叫「Manus」的通用 AI Agent 产品刷屏网络。它能完成复杂的文件处理、数据分析、代码编写等多种任务。刚上线不久，大家纷纷在线求购邀请码，都想亲自上手一试这个突然火起来的智能体。

3/11/2025 8:42:04 AM

机器之心

「古董」GPU也能跑DeepSeek同款GRPO！显存只需1/10，上下文爆涨10倍

开源微调神器Unsloth带着黑科技又来了：上次更新把GRPO需要的内存见到了7GB，这次只需要5GB的VRAM，就能训练自己的推理模型Qwen2.5（1.5B），比上次要少2GB。这次彻底把推理模型训练显存打下来了！这次把GRPO训练推理模型的上下文变长10倍，同时需要的显存少了90%。

3/10/2025 1:11:26 PM

新智元

Ollama的配置修改与接口调用

一、修改环境变量1.1 配置远程访问在我们本地部署好ollama之后，仅支持本机访问，我们可以通过修改环境变量让其他人可以远程访问。在wins电脑上增加环境变量：复制1.2 配置本地模型路径1.2.1 本地模型默认路径wins本地模型默认路径：C:\Users\%username%\.ollama\models。这里 %username% 是当前登录的用户名。

3/10/2025 9:00:00 AM

Python伊甸园

Ollama的介绍与测试

一、Ollama介绍Ollama是一个开源工具，专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计。它提供了一个简洁高效的界面，让用户能够轻松地创建、执行和管理这些复杂的模型。此外，Ollama还配备了一个丰富的预构建模型库，使得这些模型能够无缝集成到各种应用程序之中，大大提升了开发效率和用户体验。

3/10/2025 8:30:00 AM

Python伊甸园

无需邀请码，免费下载！中国五人团队三小时攻破Manus壁垒，如何做到的？

出品 | 51CTO技术栈（微信号：blog51cto）五人小团队3小时复刻出一个开源版的Manus项目，通用Agent的门槛在哪里呢？这里为大家梳理一下OpenManus的情况，enjoy：1. 项目背景与开源情况OpenManus是一个开源项目，由国内团队仅用三小时开发完成。

3/7/2025 5:11:11 PM

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

凌晨，阿里重磅开源全球最顶尖AI模型——通义千问QwQ-32B推理模型。它仅用320亿参数，便与目前公认的开源最强6710亿参数的满血版DeepSeek-R1（370亿被激活）相媲美。甚至，QwQ-32B在多项基准测试中全面超越o1-mini。

3/7/2025 8:30:00 AM

新智元

开源中国完成数亿元C轮融资，加速AI战略布局

3月6日，开源技术生态领军企业开源中国（开源共识(上海）网络技术有限公司)宣布完成数亿元C轮融资。本轮融资由北京信息产业发展投资基金(北京信产基金)领投，深报一本股权投资基金(深报一本)及北京上河动量私募股权基金(上河动量)跟投，指数资本担任财务顾问。融资将用于深化AI战略，扩展产品矩阵，推进软硬件协同的智能解决方案，促进AI在产业领域的落地。

3/6/2025 5:12:00 PM

AI在线

腾讯混元发布图生视频模型HunyuanVideo-I2V，并上线对口型等玩法

腾讯宣布开源其新研发的图像转视频生成框架 ——HunyuanVideo-I2V。该模型的发布是在其成功开源 HunyuanVideo 之后的又一重要进展，旨在推动开放源代码社区的深入探索。 HunyuanVideo-I2V 结合了先进的视频生成技术，能够将静态图像转换为生动的视频内容，为创作者提供了更多的可能性。

3/6/2025 4:34:00 PM

AI在线

360智脑开源Light-R1！1000美元数学上首次从零超越DeepSeek-R1-Distill

2025 年 3 月 4 日，360 智脑开源了 Light-R1-32B 模型，以及全部训练数据、代码。仅需 12 台 H800 上 6 小时即可训练完成，从没有长思维链的 Qwen2.5-32B-Instruct 出发，仅使用 7 万条数学数据训练，得到 Light-R1-32B，在 AIME24 测试基准中取得 76.6 分、AIME25 取得 64.6 分，在数学评测上开源首次实现从零大幅超越 DeepSeek-R1-Distill-Qwen-32B 的 72.6 分和 54.9 分。一周前，360 智脑联合北大开源了 TinyR1-32B-Preview，从 DeepSeek-R1-Distill-Qwen-32B 训练，在数学、科学和代码上取得了接近 DeepSeek-R1 满血版的优异效果。

3/6/2025 10:00:00 AM

机器之心

无缝集成知识图谱，开源Python框架BioChatter降低LLM生物医学使用门槛

编辑丨coisini大型语言模型（LLMs）已经改变了人们的工作方式，从支持内容创作、编程到改进搜索引擎等。然而，LLMs 在透明度、可重复性和定制化方面的不足仍然是一个挑战，限制了它们在生物医学研究中的广泛应用。对生物医学研究人员来说，针对特定研究问题优化 LLMs 可能是一项艰巨的任务，因为这需要编程技能和机器学习专业知识。

3/5/2025 12:58:00 PM

ScienceAI

视觉强化微调！DeepSeek R1技术成功迁移到多模态领域，全面开源

今天给大家重磅推荐一个突破性的视觉强化微调开源项目 —— Visual-RFT (Visual Reinforcement Fine-Tuning)。论文地址: : Visual-RFT 将 DeepSeek-R1 背后的基于规则奖励的强化学习方法和 OpenAI 的强化微调（Reinforcement Fine-Tuning，RFT）范式成功从纯文本大语言模型拓展到了视觉语言大模型（LVLM）。通过针对视觉的细分类、目标检测等任务设计对应的规则奖励，Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知，为视觉语言模型的训练开辟了全新路径！

3/4/2025 5:27:05 PM

机器之心

豆包团队开源SuperGPQA：挑战285学科AI推理极限

近日，字节跳动豆包大模型团队联合M-A-P开源社区发布SuperGPQA，一个覆盖285个研究生级学科、包含26，529道专业问题的知识推理基准测试。该数据集不仅涵盖数学、物理等主流学科，还首次将轻工业、农业、服务科学等长尾学科纳入评估体系，填补了现有基准测试在长尾知识领域的空白。 SuperGPQA已被用于揭示开源与闭源模型的性能差距，成为AI发展的重要工具。

3/4/2025 2:03:00 PM

AI在线

火山引擎宣布大模型应用开源：上线“大模型应用实验室”，释放 AI 创新潜力

火山引擎今日通过 X 平台宣布，其大模型应用正式开源，并推出全新“大模型应用实验室”平台。这一举措标志着火山引擎在 AI 技术生态建设上的重大突破，旨在通过开放核心应用和技术资源，加速开发者社区的创新步伐。此次开源的应用包括手机助手、Deep Research、DeepSeek 联网版、实时视频理解、互动双语视频生成器以及语音实时通话-青青等一系列前沿 AI 工具，引发了 X 用户的广泛热议。

3/4/2025 11:23:00 AM

AI在线

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练