视觉信息

豆包：视频生成模型 “VideoWorld” 已开源实现纯视觉学习

据豆包大模型团队官方公众号消息，在北京交通大学和中国科学技术大学的联合研究下，由豆包大模型团队提出的 “VideoWorld” 视频生成实验模型近日正式开源。这个模型的最大亮点在于，它不再依赖传统的语言模型，而是仅凭视觉信息就能认知和理解世界。这一突破性的研究灵感来源于李飞飞教授在 TED 演讲中提到的 “幼儿可以不依靠语言理解真实世界” 的理念。

2/10/2025 2:22:00 PM

AI在线

资讯热榜

纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Ollama 支持全线的 Qwen 3 模型 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion Gemini 马斯克算法蛋白质芯片生成式代码英伟达腾讯神经网络研究计算 Anthropic Sora 3D AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集应用训练大型语言模型科技亚马逊特斯拉 2024 AGI

视觉信息

豆包：视频生成模型 “VideoWorld” 已开源 实现纯视觉学习

豆包：视频生成模型 “VideoWorld” 已开源实现纯视觉学习