氛围感拉满:微软新专利探索 Copilot AI 应用,匹配视频等生成音乐

科技媒体 Windows Report 昨日(10 月 4 日)发布博文,报道称微软公司获得了一项新的专利,构想 Copilot 在未来能辅助用户创建和视频、文本、PowerPoint 等匹配的音乐或者背景音乐。AI在线注:微软该专利名为《Artificial intelligence model for composing audio scores》,主要探讨了基于输入内容,来创建音乐的方法。该专利主要概述了以下步骤:收集数据:收集大量的训练数据,这些数据包括许多包含视频和音频组件的视听数据集。分析提取:分析数据

科技媒体 Windows Report 昨日(10 月 4 日)发布博文,报道称微软公司获得了一项新的专利,构想 Copilot 在未来能辅助用户创建和视频、文本、PowerPoint 等匹配的音乐或者背景音乐。

AI在线注:微软该专利名为《Artificial intelligence model for composing audio scores》,主要探讨了基于输入内容,来创建音乐的方法。

氛围感拉满:微软新专利探索 Copilot AI 应用,匹配视频等生成音乐

该专利主要概述了以下步骤:

收集数据:收集大量的训练数据,这些数据包括许多包含视频和音频组件的视听数据集。

分析提取:分析数据集并提取不同类型的特征。例如文本视频中的颜色、形状、运动和场景等等。

关联:Copilot 会分析这些特征并寻找它们之间的相关性。例如,某些场景(如日落)通常伴随着特定类型的音乐(如平静、舒缓的旋律)。

Copilot 将通过这些特性进行训练,并利用关联系统,生成与新视频的视觉和文本特征相匹配的适当音频评分。

在现实生活中,这项技术可以用于各种应用,例如:

电影和视频制作: 自动为电影、电视节目或在线视频生成背景音乐。

广告: 创作与商业广告的氛围和信息完美契合的音乐。

游戏: 制作基于游戏视觉和动作变化的动态配乐。

虚拟现实: 通过与视觉环境相适应的音频增强沉浸式体验。

其它场景:例如可以在求婚等场景下自动匹配合适的音乐。

给TA打赏
共{{data.count}}人
人已打赏
应用

谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用:腰斩击穿价 0.15 美元买百万 tokens 输出

2024-10-5 12:40:26

应用

号称击败Claude 3.5 Sonnet,媲美GPT-4o,开源多模态模型Molmo挑战Scaling law

2024-10-5 15:05:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索