Flow
扩散模型、最优传输存在什么关系?法国数学家4页论文引网友围观
扩散模型和最优传输之间到底存在怎样的联系? 对很多人来说还是一个未解之谜。 但有一点很清楚的是:在相似的数据集上训练的不同扩散模型倾向于恢复出相似的映射关系。
12/3/2024 8:57:00 PM
机器之心
快手联合推出 Pyramid Flow 开源文生视频 AI 模型:最高 10 秒 768P@24fps,创新金字塔流匹配让推理 tokens 降至 1/4
由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型,用户在输入文本之后,即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等,提供更高效、更灵活的视频生成解决方案,目前已经在 Hugging Face 平台上线,并完全开源。 AI在线查询官方介绍,附上 Pyramid Flow 的核心特点如下:高效生成:Pyramid Flow 采用新技术,通过统一 AI 模型分阶段生成视频,大多数阶段为低分辨率,只有最后阶段为全分辨率。
10/12/2024 9:28:42 AM
故渊
字节跳动提速 AI:Flow 部门下设四大业务线,挖角大批百度阿里员工
3 月 25 日下午消息,近日,字节跳动推出 AI 角色互动 App“话炉”,从而引发外界对其探索 AI 社交赛道的关注。据了解,“话炉”由字节跳动的 Flow 部门打造。新浪科技独家获悉,Flow 部门隶属于字节跳动的产品研发与工程部(内部简称“PDI”),目前下设四大业务线,包括 AI 教育、国际化、社区和豆包,“话炉”则属于社区业务线旗下。在今年 1 月的 2024 年年度全员会上,字节跳动 CEO 梁汝波提到,公司直到 2023 年才开始讨论 GPT,而业内做得比较好的大模型创业公司都是在 2018 年至
3/25/2024 4:30:38 PM
徐苑蕾
- 1
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
本地部署DeepSeek+DiFy平台构建智能体应用
ChatGPT重磅更新:新增图像库功能,可查看自己用GPT生成的所有图片
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
深度学习
AI视频
模态
人形机器人
xAI
驾驶
文本
搜索
字节跳动
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
训练
DeepMind