建模
出门问问发布TicVoice 7.0 支持超自然语音克隆与跨语种生成能力
3月6日,出门问问(Mobvoi)联合香港科技大学、上海交通大学、南洋理工大学、西北工业大学等顶尖学术机构,共同开源新一代语音生成模型Spark-TTS,并重磅推出其商业化高品质TTS引擎——TicVoice7.0。 作为出门问问第七代TTS引擎,TicVoice7.0在语音生成领域实现了重大突破,开启了全新的语音生成范式。 TicVoice7.0的核心优势在于其创新的语音编码方式和建模结构。
3/7/2025 8:50:00 AM
AI在线
Exists 发布新 AI 平台:零编程经验者也可制作高质量 3D 游戏
AI 初创公司 Exists 于 8 月 15 日发布新闻稿,介绍最新上线的生成式 AI 平台,没有任何编程经验的用户通过文本输入,就能创建高质量的 3D 游戏。 该公司创始人兼首席执行官约塔姆・赫特林格博士(Dr. Yotam Hechtlinger)表示:我们的目标是像文本、图像、视频和音频创作一样,让生成式 AI 在游戏领域带来范式转变。根据官方公布的宣传视频,整个游戏 AI 工具易于上手,在生成后用户还能指令调整细节。不过这款 AI 目前也有局限性,人脸建模看起来有点不自然,这一点可以在 0:43 分钟体现
8/17/2024 8:04:47 AM
故渊
快手可灵上线图生视频与最长 3 分钟的视频续写功能
感谢快手可灵新功能“图生视频”和“视频续写”今日上线。图生视频功能,支持将静态图像转化为 5 秒钟视频,用户可通过提示词文本控制图像中物体的运动;视频续写功能,支持对生成视频一键续写和连续多次续写,最长可生成约 3 分钟视频;此外文生视频新增 9:16 和 1:1 视频尺寸选择。 IT之家附快手可灵官方网站:,能够生成大幅度的合理运动,模拟物理世界特性。可灵使用了 DiT 架构,快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。在隐空间编 / 解码上,快手自研了 3D VAE 网络,实现时空同步压缩,
6/21/2024 5:06:01 PM
沛霖(实习)
可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT
编辑 | 萝卜皮几个世纪以来,研究人员一直在寻找连接不同领域知识的方法。随着人工智能的出现,我们现在可以探索跨领域(例如,力学-生物学)或不同领域(例如,失效力学-艺术)的关系。为了实现这一目标,麻省理工学院(MIT)原子与分子力学实验室 (Laboratory for Atomistic and Molecular Mechanics,LAMM)的研究人员使用了经过微调的大型语言模型 (LLM),来获取多尺度材料失效的知识子集。该方法包括使用通用 LLM 从原始来源中提取问答对,然后进行 LLM 微调。由此产生的
11/15/2023 11:01:00 AM
ScienceAI
Meta开源文本生成音乐大模型,我们用《七里香》歌词试了下
年初,谷歌推出了音乐生成大模型 MusicLM,效果非常不错。有人称这比大火的 ChatGPT 还重要,几乎解决了音乐生成问题。近日,Meta 也推出了自己的文本音乐生成模型 MusicGen,并且非商业用途免费使用。
6/12/2023 2:54:00 PM
机器之心
国产工业软件弯道超车迎曙光,首款云原生CAD取得重大突破
《道德经》有云,道生一,一生二,二生三 ,三生万物。“三”往往引向无穷之数。三维家耕耘8年的科技实力即将迎来全面丰收,由此,“三体计划”横空出世。“三体计划”既包含三维家结盟三个世界顶尖技术伙伴的合作成果、在三个前沿学科的不懈探索、以及在三大科技盛会上的实力展现,也代表三维家坚持对先进技术的探索,用技术为产业开拓无限想象空间。“三体计划”最终导向三大目标:降维打击、打破边界、重塑视界。10月10日首款云原生CAD的发布开启了“三体计划”的第一篇章。2021年10月9日-10日,“智能制造和智能化管理”交流会议暨安徽
10/12/2021 11:00:00 AM
新闻助手
DataWorks数据建模 - 一揽子数据模型管理解决方案
作者:DataWorks产品经理 刘天鸢在当下的商业环境中,正确的数据治理策略对于数据增值是非常重要的。据统计,企业的数据一直都在以每年50%的速度增长,因此企业数据治理与整合的难度就不断加大了。DataWorks一直以来都致力于成为用户更方便、更快捷地进行数据开发与数据治理的好帮手。此次发布的数据建模,是对已有数据治理领域能力的补齐,为用户带来了在数据开发前,实施事前治理的能力。一、为什么要数据建模引用《大数据之路:阿里巴巴大数据实践》中的内容:“如果把数据看作图书馆里的书,我们希望它们在书架上分门别类地放置;如
8/25/2021 2:45:00 PM
阿里云大数据AI技术
- 1
资讯热榜
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型
上海AI实验室开源InternVL3系列多模态大型语言模型
50组多风格提示词,全面测评Midjourney V7生图效果!
全日程揭晓!ICLR 2025论文分享会我们北京见
斯坦福2025 AI指数出炉!中美AI对决差距仅剩0.3%,DeepSeek领衔
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
AI设计
Anthropic
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
模态
AI视频
驾驶
文本
xAI
搜索
人形机器人
大语言模型
Copilot
神器推荐
LLaMA
字节跳动
具身智能
Claude
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练