华为昇腾适配阶跃星辰Step-Video和Step-Audio开源大模型,上线魔乐社区

今日,魔乐社区(Modelers)宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。 开发者和企业用户在魔乐社区中可以直接下载并体验。 Step-Video-T2V 是目前全球参数量最大的开源视频生成模型,达到300亿参数。

今日,魔乐社区(Modelers)宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。开发者和企业用户在魔乐社区中可以直接下载并体验。

Step-Video-T2V 是目前全球参数量最大的开源视频生成模型,达到300亿参数。可直接生成204帧、540P分辨率的高质量视频。根据阶跃星辰此前公布评测结果,Step-Video-T2V 在指令遵循、运动平滑性、物理合理性、美感度等方面的表现均显著超过市面上既有的效果最佳的开源视频模型;而 Step-Audio 是行业内首款产品级开源语音交互大模型,能生成多种情感、方言、语言、唱腔及个性化风格的语音。阶跃星辰在不久前的生态开放日上透露,3月份还将开源图生视频模型。

据了解,魔乐社区由天翼云与华为联合打造,面向 AI 开发者与技术爱好者,提供模型、数据集、开发工具链与应用 的一站式托管与展示服务。为了方便模型及应用的展示,社区还提供免费算力支持, 让用户可以在线体验模型推理,无需复杂环境搭建,即可快速验证 AI 方案。

目前,头部技术社区已纷纷上架阶跃星辰两款开源多模态模型,除魔乐社区外,魔搭社区(ModelScope)、模力方舟(Gitee AI)、HuggingFace、Replicate 平台上均可体验。此外,阶跃星辰开源引发了芯片企业、云厂商、智能终端厂商和创作者平台的关注,包括天数智芯、阿里云、火山引擎、TCL、LiblibAI、欢瑞世纪等各行各业的标杆企业均已接入阶跃星辰开源生态。

相关资讯

搞 AI,孩子必须学好数学:马斯克 Altman 罕见达成一致,LeCun / Jeff Dean 等 31 位大佬签署联名信

【新智元导读】基础数学已经被拔高到研究 AI 的必经之路!UC 伯克利教授发起最新倡议,31 位 AI 大佬共同签署联名信,马斯克和 Altman 竟达成一致。就在刚刚,UC 伯克利 EECS 教授 Jelani Nelson 联合发起了一个倡议,强调「坚实的数学基础对人工智能至关重要」。地址:「虽然 Elon Musk 和 Sam Altman 最近在很多问题上都有分歧,但他们都认同,AI 的构建是以代数和微积分等坚实的数学基础为支撑的。」目前,已经有 31 位业内大佬在上面签署了自己的名字。要想搞好 AI,就必

NeurIPS 2024 Workshop 科学基础模型: 进展, 机遇, 挑战

Workshop背景人工智能 (AI) 和机器学习 (ML) 在科学领域的应用代表了传统科学发现方法的重大转变。几个世纪以来,探索自然世界的过程遵循着系统和逻辑的方法。然而,人工智能和机器学习技术的出现,正在深刻改变现代基础科学的发现方式。这种变化对于促进跨学科交流、激发创新的解决方案,并最终提高科学界应对现代科学中最紧迫和复杂问题的能力至关重要。与此同时,经过大量多样化数据集训练的基础模型,在计算机视觉和自然语言处理等任务中展示了强大的适应性。这些模型,例如语言模型 GPT-4 和图像文本处理模型 CLIP,通过

AI加速优化求解,达摩院连续两年获求解器全国赛事冠军

以“AI 优化求解器”助力能源绿色转型,达摩院自研“敏迭”求解器连续获得权威赛事冠军。 1月17日消息,达摩院自主研发的“敏迭”求解器在工信部产业发展促进中心组织的第二届能源电子产业创新大赛上,再次斩获“国产求解器技术专题赛”冠军。 这是继近期入选工信部“人工智能赋能新型工业化”典型应用案例后的又一殊荣。