Soul
Soul App实时人像视频生成研究成果获国际学术顶会CVPR2025录用
近期,IEEE国际计算机视觉与模式识别会议( Conference on Computer Vision and Pattern Recognition)CVPR 2025公布论文录用结果,社交平台Soul App技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》(《基于自回归动作生成的实时流式音频驱动人像动画系统》)被接收。 Soul App团队在论文中提出了一个新的面向实时音频驱动人像动画(即Talking Head)的自回归框架,解决了视频画面生成耗时长的行业挑战外,还实现了说话时头部生成以及人体各部位运动的自然性和逼真性。 此次论文的入选,也证明了Soul App在推动多模态能力构建特别是视觉层面能力突破上取得了阶段性成果。
3/21/2025 5:14:00 PM
新闻助手
别只盯着ChatGPT版「Her」,在多模态AI拟人互动上,国内玩家也支棱起来了
如今的 AI 在识别人类情感方面发展到什么程度了?本月初,一场向更具情感 AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 AI 顶会 IJCAI2024 上发起举办,探讨如何利用文本、音视频等多模态数据来进行 AI 情感识别,并推动相关技术在真实人机交互场景中的落地应用。
7/31/2024 3:55:00 PM
机器之心
Soul创新多模态互动体验,携「异世界回响」亮相WAIC2024
7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)正式开幕。 今年主题为“以工商促共享 以善治促善智”,围绕核心技术、智能终端、应用赋能三大板块,集中展示一批“人工智能 ”创新应用最新成果。 作为当下“AI 社交”领域代表,社交平台Soul App受邀参展,并重点展出了“数字分身”“狼人魅影”和“异世界回响”等AI能力落地的新功能、新场景。
7/8/2024 4:03:00 PM
王悦
AI时代如何重构社交?Soul App 通过媒体开放日活动这样回答
5月30日,社交平台Soul App在上海举办媒体开放日活动,以“人与人工智能是否能够真正成为「朋友」”为主题,分享了平台前沿技术探索和最新产品应用实践,并邀请了复旦大学教授肖仰华以及众多行业观察者,一同探讨AIGC+社交的应用及未来发展可能性。媒体开放日活动是Soul与外界达成长效、深度链接的重要桥梁。在AI为各行各业带来颠覆式发展新机会的当下,Soul作为“AIGC 社交”领域前沿探索者,希望通过本次活动,全面展示Soul在AI方面的技术积累及落地实践,为行业提供可行的方向参考。模应一体:AI重构关系链与社交体
5/31/2024 2:04:00 PM
新闻助手
Soul正式上线自研大模型“SoulX”,持续丰富用户社交体验
近日,新型社交平台Soul正式上线自研语言大模型SoulX。作为生成式人工智能最基础、最核心的工具,SoulX将作为Soul “AIGC 社交”布局的重要基建,垂直应用于平台上多元社交互动场景,例如智能对话机器人“AI苟蛋”、AI辅助聊天、虚拟陪伴等诸多工具和创新功能,进一步丰富平台用户的社交体验。据了解,SoulX的优势在于平台深耕行业过程中,大量公域场景社交类型数据的积累。该模型基于海量数据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,Soul
12/11/2023 2:49:00 PM
新闻助手
- 1
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
本地部署DeepSeek+DiFy平台构建智能体应用
韩国初创公司 RLWRLD 获 1480 万美元融资,致力于机器人基础模型开发
ChatGPT重磅更新:新增图像库功能,可查看自己用GPT生成的所有图片
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
深度学习
AI视频
模态
人形机器人
驾驶
xAI
文本
搜索
字节跳动
大语言模型
Copilot
Claude
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练