应用
「音乐界Sora」Udio来了:前DeepMind员工创业,比Suno可定制性更强
我们已经看到,AI 已经能够理解和生成文本、图像、视频,尽管各个产品目前能达到的准确性和审美水准还不相同。自带曲谱的音乐生成似乎是 AI 要征服的下一座山峰,而这场竞争正在白热化。近日,音乐生成领域再次迎来新玩家「Udio」。与前段时间大火的 Suno V3 相似,Udio 仅通过一些人工输入的文本提示(包括用户提供的歌词),就可以创建高保真音乐音频。但它拥有比 Suno 更多的自定义能力,风格涵盖乡村音乐、理发店四重唱(Barbershop)、德国流行乐(German pop)、古典音乐、硬摇滚、嘻哈、演唱曲调等
睿蓝汽车与科大讯飞签署战略合作协议,星火大模型上车
感谢4 月 15 日,睿蓝汽车与科大讯飞战略合作签约仪式在科大讯飞总部安徽合肥举行。据介绍,本次战略合作协议,双方将从智能座舱、智能音效、数字营销等多个板块展开全面深入合作。此次与睿蓝汽车展开合作,也将为睿蓝品牌十五万级车型带来全新的数智 AI 升级。睿蓝 7 汽车已上线飞鱼智能音频管理系统,支持 50 吋巨幕 AR-HUD 和星火专属调音,还可根据个人喜好自由调节 ESE 声浪模式。接下来,睿蓝汽车旗下睿蓝 7、睿蓝 9 等代表车型,将全面搭载科大讯飞星火大模型,AI 不仅可以通过用户情绪感知,进行个性化推荐和共
AI神器Udio详细拆解教程!一键生成高质量歌曲,效果不输 Suno
大家好,这里是和你们一起探索 AI 的花生~
前不久为大家介绍了一款 AI 歌曲生成神器 Suno V3,如今不到一个月的时间就又出现了一款新的工具 Udio,它也支持通过文本生成高质量的的歌曲,并且在某些方面的表现比 Suno 还要好。今天就为大家详细介绍一下 Udio 的特点及用法~
相关推荐:一、Udio 简介
网址直达:
Udio 是最新推出的一款 AI 音乐创作工具,支持通过文本生成高质量的歌曲或纯音乐。在 Suno V3 风头正盛的时候,Uido 仅凭一个内测用户放出来的音乐片段就立刻在网上引起了广泛
英国着手起草 AI 法规,确保其发展处于可控状态
根据彭博社报道,英国目前正在起草 AI 监管草案,进一步加强对 GPT-4 等 AI 模型的监管力度,确保 AI 发展处于可控状态,不会对人类造成潜在危害。英国科学、创新和技术部(DSIT)目前已经开始起草相关的法案,最早可能会在 2024 年年底前发布,或者于 2025 年年初在法国举行的人工智能会议上公布。IT之家从报道中获悉,英国此前对待 AI 一直采取谨慎的态度,英国首相苏纳克(Rishi Sunak)在去年举行的首届世界领导人人工智能峰会上表示,各国不应“急于监管”人工智能。不过英国文化、媒体与体育部的官
Adobe Premiere Pro 引入全新 AI 功能,文本转视频、添加 / 删除视频对象等
Adobe 今日宣布将为其专业视频编辑软件 Premiere Pro 加入一系列由生成式人工智能驱动的强大功能,这些新功能将帮助视频剪辑师们更高效地完成工作。得益于全新的人工智能功能“生成扩展”,Premiere Pro 将能够为视频片段添加额外的帧,方便剪辑师们对场景进行恰当的时长调整并加入平滑的转场效果,例如延长某个场景的画面。此外,通过智能选取和跟踪工具,用户还可以轻松添加或移除视频中的物体。Adobe 表示,视频剪辑师们可以利用这一功能移除不需要的元素,例如画面中的杂物,或是为演员更换虚拟服装,甚至还能为场
大厂实战案例!京东物流AI问答助手体验设计完整复盘
随着技术的不断成熟,AI 越来越多的被运用到各种项目中。AI 在项目中主要有两大作用,一是作为技术支撑,在产品实现功能时借助 AI 技术提供预测数据、推荐数据,从而帮助企业预测/预警风险发生,提前实现调度工作,减少重复劳动,帮助企业实现降本增收。另一个则是用户通过键盘或者语音输入,对系统发出指令,AI 通过对语言识别去回答用户问题,这类主要用于客服或者知识问答,利用 AI 技术减少人工成本,减少重复劳动力,同时能将知识类文档进行收口,形成企业知识库。本文主要围绕设计师如何利用 AI 技术赋能物流行业。一、人机对话发
轻松搞定!AI视频+微动效生成神器 PixVerse 生成秘籍
AI 在当下对于视频&微动效的处理能力如何?是否已经达到了可以商用的程度?曾经试过一些 AI 视频工具但是体验不好,应该如何操作?不会 AE、C4D 但是我想做个动态效果怎么弄?接下来将对此进行详细解答。
一、为什么要AI做视频 & 动效
1. 省时间
通过 AI 可以快速完成视频&动效设计,仅需要几分钟的时间就能完成传统需要拍摄或渲染等几个小时才能完成的工作,在短时间内提供有效的解决方案。
2. 高质量
拍摄高质量镜头画面时,传统需要使用高清摄像设备,并且需要利用补光灯确保视频画面明亮而均匀,避免出现强烈的阴影区
大模型首次接入天文望远镜:“星语 3.0”发布,基于阿里通义千问
4 月 14 日,中国科学院国家天文台人工智能工作组发布新一代天文大模型 ——“星语 3.0”。“星语 3.0”基于阿里云通义千问开源模型打造,目前已成功接入国家天文台兴隆观测站望远镜阵列 —— Mini“司天”。据介绍,随着望远镜数量的不断增加,如何控制大型望远镜阵列已成为当今天文界共同面临的挑战。以往天文观测主要依赖观测助手和科研人员的配合。科研人员往往需要根据观测所在地气象情况修改观测计划,在观测室等待数据返回并实时分析数据,再根据结果修改观测计划。重要观测目标的每个环节都需要人工参与,效率低且难以同时控制多
RBR50 2024:OpenAI上榜,人形机器人势不可挡
机器之能报道编辑:吴昕2024 年,发那科公司交付了第 100 万台工业机器人。同时,OpenAI 上榜也展示出生成式 AI 与机器人技术的日益相关性。Robotics Business Review RBR 50 榜单已经成为全球机器人行业重要风向标。每年 4 月,Robotics Business Review 都会评选出全球最具创新性和影响力的 50 家机器人企业和机构,许多业内知名企业波士顿动力、发那科、亚马逊、英伟达、优傲、Locus Robotics 等都曾入选 RBR50 榜单。2024 年,传统工业
三星 Galaxy AI 即将支持粤语、阿拉伯语等更多语言
三星电子宣布 Galaxy AI 即将支持更多语言,包括阿拉伯语、印尼语、俄语、澳大利亚英语、粤语和加拿大法语,将于 4 月起未来数月陆续上线,每种语言都可以在设置中,以语言包的形式下载使用。结合既有的 13 种语言,三星将为全球更多 Galaxy 用户提供 Galaxy AI 的能力。此外,除前述语言外,三星计划在今年稍晚进一步扩大支持语言,包括罗马尼亚语、土耳其语、荷兰语、瑞典语、繁体中文和欧洲葡萄牙语。三星电子移动通信部门总裁卢泰文表示:“三星致力于将移动 AI 普及给所有人,Galaxy AI 翻译功能的语
GPT-4 整治学术不端:人大 / 浙大团队实测 7000 篇论文,撤稿预测与人类 95% 一致
【新智元导读】人大与浙大学者发现,GPT-4 对于论文给出的撤稿预测结果,竟然和人类审稿人有将近 95% 的相似性。看来大模型虽然有可能引发学术不端,但也有办法维护科研诚信啊。学术论文的撤稿事件时有发生,这不仅损害了科研诚信,也可能对公众信任和科学进展产生负面影响。传统上,学术界依赖同行评审和出版后的读者反馈来识别和纠正问题论文,但这些方法可能无法及时发现所有问题,尤其是在当前科研论文出版数量急剧增加的背景下。在这种情况下,如何快速识别存在问题的论文,并促进它们的撤稿,成了学术界亟待解决的一个难题。最近,来自中国人
Marvell 美满电子获得新 AI 芯片订单,到 2026 财年相关业务收入将达 25 亿美元
Marvell 美满电子在上周举办的一场有关 AI 基础设施领域的投资者活动上表示其新近获得了一份来自大型科技公司的 AI 芯片订单。Marvell 宣称,包括这份订单在内,其已从“四家美国超大型企业”中的三家拿下定制芯片订单,包括为客户 A 定制 AI 训练加速器和 AI 推理加速器,为客户 B 定制 Arm 架构 CPU 和近日的为客户 C 定制 AI 加速器。▲ 图源 Marvell 美满电子官方,下同Marvell 表示,客户 A 的 AI 训练加速器和客户 B 的 Arm 架构 CPU 已处于产能爬坡阶段
上海举办国内首个 AI 音乐会
4 月 13 日至 14 日,上海民族乐团国乐与 AI 音乐会《零・壹|中国色》,在第 39 届上海之春国际音乐节首演,这是全国首台 AI 创作的国乐音乐会。据悉,《零・壹|中国色》由上海民族乐团、腾讯音乐娱乐集团(TME)、1862 时尚艺术中心联合主办,参演曲目以颜色为创作灵感,由腾讯音乐娱乐集团和腾讯 AI Lab 联合研发的 AI 音乐大模型“琴乐大模型”创作,并经过乐团演奏家们二度创作最终成曲,通过大自然色彩的起承转合千变万化,让观众从乐曲中感受到不同的色彩演绎。IT之家附重点节目名单如下:笙曲《东方既白
除了唱歌,AI还能替你演出?又一AI公司将虚拟人推到新高度
用 Suno 十秒写歌,是不是已经很震撼?现在不仅如此,用最新的 AI 工具,我们还可以快速生成歌手唱歌 MV。最近,一家名为 AKOOL 的 AI 公司推出了一个唱歌虚拟人工具,用户只需在平台上选择虚拟人,简单输入歌词指令,便可生成能唱歌的虚拟人 MV。视频中的 “歌手” 在雪地里随着音乐翩翩起舞,“假唱” 对口型也毫不逊色。声音、面容,一键替换 AKOOL 拥有丰富的 AI 换脸视觉表现技术以及成熟的声音克隆技术。在 Tiktok 上,用 AKOOL 制作的换脸、换声视频非常风靡,受到很多人的欢迎。去年, A
马斯克的首款多模态大模型来了,GPT-4V又被超越了一次
自从 2023 年 11 月 Grok 首次亮相以来,马斯克的 xAI 正在大模型领域不断取得进步,向 OpenAI 等先行者发起进攻。在 Grok-1 开源后不到一个月,xAI 的首个多模态模型就问世了。昨天,xAI 推出了 Grok-1.5V,该模型不仅能理解文本,还能处理文档、图表、截图和照片中的内容。官方博文表示:「Grok-1.5V 在许多领域都能媲美当前顶尖的多模态模型,从多学科推理到理解文档、科学图表、图表、截图和照片。」 xAI 还表示,在接下来的几个月里,预计将在图像、音频和视频等各种模态上显著提
培育发展金融领域新质生产力,“AI+金融”论坛在浦东新区成功举办
4 月 12 日,在上海市浦东新区科技和经济委员会指导下,由上海市浦东新区产业发展促进中心、上海市浦东新区投资促进二中心、上海陆家嘴(集团)有限公司主办,上海浦东科技创业中心、中国建设银行上海浦东分行、机器之心(上海)科技有限公司承办的 “AI 金融” 论坛在张江科学城・数智天地成功举办。浦东新区科技和经济委员会副主任夏玉忠,北蔡镇人民政府党委书记殷宏、上海陆家嘴(集团)有限公司总经理蔡嵘,建行上海浦东分行党委书记邹林出席了本次论坛。来自大模型企业、金融科技企业、金融机构及高校的嘉宾和 300 多位专业观众参加了本
GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式
新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了!使 GPT 风格的自回归模型在图像生成首次超越扩散模型,并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task Generalization 泛化能力: 论文标题: "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale P
全球AI顶会NeurlPS开始收高中生论文了
卷高考之后的下一步,卷论文?培养 AI 人才,要从娃娃抓起,这句话似乎越来越不像开玩笑了。本周五,顶级学术会议 NeurIPS 开设高中生论文 Track 的消息引爆了人工智能社区。消息援引自大会组织方的一项新公告。请注意,这不是 workshop,是主会议:NeurIPS 2024 邀请高中生提交有关机器学习社会影响主题的研究论文。组委会将选出一部分决赛入围者以虚拟方式展示他们的项目,并将在 NeurIPS 主页上重点展示他们的作品。此外,最多五个获奖项目的主要作者将受邀参加在温哥华举行的 NeurIPS 202