Soul创新多模态互动体验,携「异世界回响」亮相WAIC2024

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)正式开幕。 今年主题为“以工商促共享 以善治促善智”,围绕核心技术、智能终端、应用赋能三大板块,集中展示一批“人工智能 ”创新应用最新成果。 作为当下“AI 社交”领域代表,社交平台Soul App受邀参展,并重点展出了“数字分身”“狼人魅影”和“异世界回响”等AI能力落地的新功能、新场景。

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)正式开幕。今年主题为“以工商促共享 以善治促善智”,围绕核心技术、智能终端、应用赋能三大板块,集中展示一批“人工智能+”创新应用最新成果。作为当下“AI+社交”领域代表,社交平台Soul App受邀参展,并重点展出了“数字分身”“狼人魅影”和“异世界回响”等AI能力落地的新功能、新场景。

 Soul创新多模态互动体验,携「异世界回响」亮相WAIC2024

Soul App CTO陶明表示,“Soul围绕社交场景中用户的核心需求布局‘AIGC+社交’,开展语言、语音、视觉等多模态大模型自研工作的同时,快速推动大模型在社交场景的应用。在‘模应一体’方向下,致力于在社交体验提升、AI社交、AI游戏等多个维度探索 AI Native应用的理想形态。”

三大新功能亮相,集中展现多模态互动能力

在WAIC 2024活动现场,Soul App以“科技无界,心与智连”为主题呈现展台,并重点展示了“数字分身”“狼人魅影”和“异世界回响”三个新功能/场景,这也是Soul在探索“AIGC+社交”场景深度融合的最新实践。

 Soul创新多模态互动体验,携「异世界回响」亮相WAIC2024

其中,“数字分身”致力于帮助用户打造虚拟数字人,实现高效社交。用户可以直接授权平台基于聊天记录、发帖内容,或者以自定义方式,设置数字分身的形象和特征,在人设、图像、声音等丰富维度上,使数字分身达到最大程度复刻真人的效果。

坚持兴趣社交,Soul平台不支持使用真人头像,用户通过捏脸系统为自身打造虚拟形象在数字空间进行互动。如今,具备私聊辅助能力的“数字分身”上线,不仅可以帮助用户打造更理想的“另一个自己”,也能实现更个性化、更千人千面的智能回复推荐,帮助用户进行社交破冰,在助力人设搭建和认知决策中,提升社交沟通效率。

而游戏互动场景“狼人魅影”中引入的AI 智能体,则集中展现了大模型的多模态互动能力。在该场景中,用户可以选择任意的AI+真人游戏组合模式开启互动,与具备自主推理、发言、“伪装”的AI一起进行真实游戏对决。而“AI游戏陪玩师”也能帮助玩家快速适应门槛相对较高、玩法复杂的狼人游戏,轻松开启交流互动,在更沉浸、即时的交互中获得趣味体验。

在站内场景融入AI能力的同时,Soul还上线了独立新产品“异世界回响”。该产品定位为AI社交平台,用户可与虚拟角色进行沉浸式即时交流,还可根据喜好自定义角色人设,实现不同的对话风格,人物的形象可通过文字描述或上传心仪的图片生成,平台提供多种基础音色,用户可自行创建、融合出属于该角色的专属声音,实现多模态互动。

“模应一体”实践,从社交提效到人机互动新体验

在活动现场,观众可体验与“异世界回响”中的虚拟角色进行实时通话。“拨通”电话后,具备类真人音色的虚拟角色实时回应对话,并自然地进行交流互动,实现了即时的“跨次元”通话。

 Soul创新多模态互动体验,携「异世界回响」亮相WAIC2024

在这背后是Soul最新升级的语音大模型。事实上,作为较早开始思考将AI应用于社交领域的平台,Soul在2016年上线后,便开始了围绕AI的底层技术和应用落地的探索。

例如,平台通过推出基于用户站内全场景画像的智能推荐引擎“灵犀”,以去中心化机制帮助用户找到兴趣相同的人,平等地实现多元关系建立和即时的情绪反馈,切实提升用户体验。此外,平台的NAWA引擎能够帮助用户打造个性化的虚拟形象和场景,实现沉浸式互动。

2020年,Soul启动了对AIGC的系统研发工作,并在智能对话、图像生成、语音技术(如语音生成、音乐生成、语音动画等)等方面拥有了前沿能力积累。2023年,Soul上线自研垂类语言大模型Soul X,该模型具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力,能够实现有情感、有温度的交互。

2024年,Soul语音生成大模型上线,同时自研语音大模型正式升级。现阶段,Soul语音大模型包括了语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等,可支持真实音色生成、语音DIY、多语言切换、多情感拟真人实时对话等能力。

Soul在语言、语音、视觉等方向自研大模型的同时,实现的多模态互动能力也快速融入到包括Soul “AI苟蛋”、狼人魅影、数字分身、异世界回响等具体的应用场景中,进一步实现交互效率、交互质量、交互体验、交互对象等多方面的提升和拓展,也受到了用户的欢迎和认可。

“用户愿意持续与AI进行对话交互,这已经证明了对平台提供体验的认可,也表明了Soul坚持‘模应一体’方向的可持续性。”Soul App CTO陶明表示,AI对于Soul就像是为钉子找到了合适的锤子,“Soul是当下最受年轻人欢迎的互联网平台之一,是天然的应用场景和流量入口,我们的优势便是能够在场景中发现用户实际需求,大模型落地应用也能第一时间面向用户获得反馈,快速验证、迭代,这也确保了Soul在深化‘AIGC+社交’战略中的不断前进。”

 

相关资讯

Soul正式上线自研大模型“SoulX”,持续丰富用户社交体验

近日,新型社交平台Soul正式上线自研语言大模型SoulX。作为生成式人工智能最基础、最核心的工具,SoulX将作为Soul “AIGC 社交”布局的重要基建,垂直应用于平台上多元社交互动场景,例如智能对话机器人“AI苟蛋”、AI辅助聊天、虚拟陪伴等诸多工具和创新功能,进一步丰富平台用户的社交体验。据了解,SoulX的优势在于平台深耕行业过程中,大量公域场景社交类型数据的积累。该模型基于海量数据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,Soul

AI时代如何重构社交?Soul App 通过媒体开放日活动这样回答

5月30日,社交平台Soul App在上海举办媒体开放日活动,以“人与人工智能是否能够真正成为「朋友」”为主题,分享了平台前沿技术探索和最新产品应用实践,并邀请了复旦大学教授肖仰华以及众多行业观察者,一同探讨AIGC+社交的应用及未来发展可能性。媒体开放日活动是Soul与外界达成长效、深度链接的重要桥梁。在AI为各行各业带来颠覆式发展新机会的当下,Soul作为“AIGC 社交”领域前沿探索者,希望通过本次活动,全面展示Soul在AI方面的技术积累及落地实践,为行业提供可行的方向参考。模应一体:AI重构关系链与社交体

别只盯着ChatGPT版「Her」,在多模态AI拟人互动上,国内玩家也支棱起来了

如今的 AI 在识别人类情感方面发展到什么程度了?本月初,一场向更具情感 AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 AI 顶会 IJCAI2024 上发起举办,探讨如何利用文本、音视频等多模态数据来进行 AI 情感识别,并推动相关技术在真实人机交互场景中的落地应用。