资讯列表

AI 歌曲生成神器 Udio 重磅更新!可拆分音轨/控制音调/中文优化明显

大家好,这里是和你们一起探索 AI 的花生~ 之前为大家推荐过的 AI 歌曲生成神器 Udio 最近推出了最新的 v1.5 模型,整体生成质量比之前有了大幅提升;还新增了音调控制、音轨拆分、音乐视频一键分享等新功能,使用更方便;中文歌曲的表现也比之前好很多,今天就一起来看看此次更新的具体细节。 还不了解 Udio 小伙伴可以先看这里:一、生成质量整体大提升 Udio 官网直达: 在 4 月份刚推出的时候,Udio 虽然在歌曲质量上令人惊艳,但是只能生成 32s 的音乐片段,无法直接构成一首完整的歌曲,因此整体效果

让输出结果更稳定!超好用的 GPTs “窗口定向”策略

在前面几篇我分别讲解了 GPT 的基本使用、高阶技巧和 GPTs 的创建。GPTs 确实很好用,当我们预设好 prompt,可以创建一个个专属的、定向输出的 GPT 助手。然而,我在使用 GPTs 的过程中遇到了一个问题:每次使用自己创建的 GPTs 时,输出的结果仍存在随机性,难以保证一致的格式和风格。这增加了我对预设 Prompt 的顾虑,我开始的时候怀疑是因为我的 Prompt 定义的不够清楚,开始反复调试,并针对输出格式做三令五申般的限制,但在测试中仍然发现 GPT 的输出具有不稳定性。 为了应对这一问题,

AI有哪些提高效率的落地应用场景?实战案例来了!

如果说今年的风口,那一定是 AI。不过 AI 像一把双刃剑,既有助益也有风险。我们将从 IBM Watson 的高飞与坠落,到 Google Allo 的黯然失色,探索 AI 应用中的教训。同时,瑞幸咖啡的成功故事展现了凭借策略得当的 AI 应用,即使在困境中也能崛起。通过 ChatGPT 实践案例,我们进一步揭示 AI 在日常工作中的潜能,从 PRD 文档编写到内容管理的自动化。最后,我们讨论如何与 AI 高效交流,确保 AI 是成为推动进步的力量而非阻碍。在整篇文章中,我将分享 AI 的正确应用价值,和如何嵌入

FBI-LLM低比特基础大语言模型来了,首个完全从头训练的二值化语言模型

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]作者介绍:论文一作Liqun Ma目前是MBZUAI机器学习系的博士生,导师为Zhiqiang Shen助理教授,同时也是该论文的最后作者,其在加入MBZUAI之前为CMU博士后,研究领域

损坏不可逆?英特尔13/14代酷睿桌面CPU崩溃后续,不会召回

最近一段时间,部分使用英特尔第 13/14 代酷睿台式机处理器的游戏玩家遇到了一些麻烦。他们反馈称,这些处理器在运行虚拟引擎(Unreal Engine)游戏时会出现崩溃。比如使用了虚拟引擎 5.3 的《泰坦之路》(Path of Titans),它的开发商 Alderon Games 提供了弹出窗口,以警告可能的游戏崩溃。从下图可以看到,游戏由于英特尔酷睿 i7 13700K 处理器而意外终止。这并不是这些处理器第一次出现问题。澳大利亚游戏视觉特效工作室 ModelFarm 内部人员报告称,英特尔酷睿 i9 13

陶哲轩点评谷歌AlphaProof:AI在数学竞赛中展现「超凡智慧」

在奥数问题面前,AI 的「智商」往往不太够用。不过,这已经是过去式了。谷歌 DeepMind 用 AI 做出了今年国际数学奥林匹克竞赛 IMO 的真题,并且距拿金牌仅一步之遥。对于 AI 来说,奥数不再是问题了。IMO 2024 中六个问题的每一个问题满分为 7 分,总分最高 42 分。DeepMind 的系统最终得分为 28 分,意味着解决的 4 个问题都获得了满分 —— 相当于银牌类别的最高分。DeepMind 文章连接: AI 辅助证明的数学家陶哲轩近期正处在出差的忙碌中,对问题求解引擎 AlphaProof

Llama 对决 GPT:AI 开源拐点已至?|智者访谈

人工智能的卓越发展 源于对技术与产业本质的洞察 机器之心全新视频栏目「智者访谈」 邀请领域专家,洞悉 AI 核心技术与行业趋势 为从业者量身打造 深化行业认知,激发创新思考 与智者同行,共创 AI 未来

防不胜防:黑客可利用 AI 通过 HDMI 线远程窃取屏幕信息

乌拉圭的研究人员发现,黑客可以使用人工智能通过拦截电脑显示器和主机之间 HDMI 线缆泄露的电磁辐射来窥探屏幕内容。他们表示,这种攻击可能已经存在,但普通家庭电脑用户不必过于担心。图源 Pexels据AI在线了解,攻击者可以通过多种方式实施攻击,包括使用放置在建筑物外的天线来拦截 HDMI 线缆的信号,这种间谍活动通过拦截从电脑 HDMI 线缆泄露的电磁辐射进行。研究人员表示,虽然数字视频传输比模拟信号复杂得多,但仍然存在可乘之机。乌拉圭共和国大学的费德里科・拉罗卡和他的团队开发了一种人工智能模型,可以从几米外的泄

Meta 训练 Llama 3 遭遇频繁故障:16384 块 H100 GPU 训练集群每 3 小时“罢工”一次

Meta 发布的一份研究报告显示,其用于训练 4050 亿参数模型 Llama 3 的 16384 个英伟达 H100 显卡集群在 54 天内出现了 419 次意外故障,平均每三小时就有一次。其中,一半以上的故障是由显卡或其搭载的高带宽内存(HBM3)引起的。由于系统规模巨大且任务高度同步,单个显卡故障可能导致整个训练任务中断,需要重新开始。尽管如此,Meta 团队还是保持了 90% 以上的有效训练时间。AI在线注意到,在为期 54 天的预预训练中,共出现了 466 次工作中断,其中 47 次是计划中断,419 次

阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进

最新消息,阿里大模型元老杨红霞入职香港理工大学,任电子计算机系教授。杨红霞是 AI 领域知名科学家。她曾在 IBM T.J.沃森研究中心担任研究人员,并在雅虎担任首席科学家。2016 年加入阿里巴巴,就职于达摩院智能计算实验室;2023 年 3 月入职字节跳动。她在达摩院期间领导了通义千问前身 M6 大模型的研发,是 M6 大模型从百亿、千亿参数量进化到万亿规模的主要功臣,并领导通义大模型核心技术“统一学习范式 OFA-M6”的开发。任职字节期间,她主要负责大模型研发,向字节 AML 和豆包大模型 Foundati

OpenAI SearchGPT 官方演示大翻车,源代码竟暴露搜索机制

SearchGPT 发布刚过两天,已有人灰度测试到了。今天,网友 Kesku 自制的 demo 全网刷屏,SearchGPT 结果输出如此神速,让所有人为之震惊。当询问 Porter Robinson 出了新唱片吗?只见,SearchGPT 眨眼功夫之间,即刻给出了答案「Smile」,最后还附上了链接。再来看移动版本的回答速度,回答延迟几乎为 0。评论区下方,震惊体铺屏。但另一方面,OpenAI 当天放出的官方演示,被外媒《大西洋月刊》曝出其中的问题。在回答「8 月在北卡罗来纳 Boone 举办的音乐节」的问题时,

密苏里大学许东:大模型时代,Prompt 为生物信息学研究带来新动力丨IJAIRR

自ChatGPT在2022年横空出世,人工智能领域便迎来了一场新的革命。 大语言模型(LLMs)以其卓越的文本处理能力,迅速成为研究者和开发者的新宠。 随着这些模型的崛起,如何与它们有效交互的问题也日益凸显,提示词(Prompt)的概念逐渐成为研究的热点。

为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下

让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗?不知道 9.11 和 9.9 哪个大,数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点,大模型都只能接受人们的无情嘲笑。嘲笑之后,大家也冷静了下来,开始思考:低级错误背后的本质是什么?大家普遍认为,是 Token 化(Tokenization)的锅。在国内,Tokenization 经常被翻译成「分词」。这个翻译有一定的误导性,因为 Tokenization 里的 token 指的未必是词,也可以

反转了?在一场新较量中,号称替代MLP的KAN只赢一局

KAN 在符号表示中领先,但 MLP 仍是多面手。多层感知器 (Multi-Layer Perceptrons,MLP) ,也被称为全连接前馈神经网络,是当今深度学习模型的基本组成部分。MLP 的重要性无论怎样强调都不为过,因为它是机器学习中用于逼近非线性函数的默认方法。然而,MLP 也存在某些局限性,例如难以解释学习到的表示,以及难以灵活地扩展网络规模。KAN(Kolmogorov–Arnold Networks)的出现,为传统 MLP 提供了一种创新的替代方案。该方法在准确性和可解释性方面优于 MLP,而且,它

贾扬清点赞:3K star量的SGLang上新,加速Llama 405B推理秒杀vLLM、TensorRT-LLM

用来运行 Llama 3 405B 优势明显。最近,Meta 开源了最新的 405B 模型(Llama 3.1 405B),把开源模型的性能拉到了新高度。由于模型参数量很大,很多开发者都关心一个问题:怎么提高模型的推理速度?时隔才两天,LMSYS Org 团队就出手了,推出了全新的 SGLang Runtime v0.2。这是一个用于 LLM 和 VLM 的通用服务引擎。在运行 Llama 3.1 405B 时,它的吞吐量和延迟表现都优于 vLLM 和 TensorRT-LLM。在某些情况下(运行 Llama 系列

万亿token!史上最大多模态数据集诞生

开源多模态大模型或将开始腾飞。值此 Llama 3.1 占领各大头条之际,又突然冒出了另一个也非常重要的发布 —— 一个规模空前的开源多模态数据集。对大模型来说,数据集的重要性无需多言,甚至可以说没有大型数据集就不可能有大模型。现在正是多模态大模型(LMM)发展正盛的时候,规模足够大的优质且开源的多模态数据集已经成为该领域的一大「刚需」。不过,相比于开源的文本数据集,现有的开源多模态数据集都比较小、多样性也不足,并且来源基本都是 HTML 文档 —— 这就限制了数据的广度和多样性。这无疑限制了开源 LMM 的发展,

ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文第一作者皮仁杰是香港科技大学三年级博士生,师从张潼教授和周晓方教授。此前获得香港大学计算机工程学士学位。研究兴趣为多模态大语言模型,以数据为中心的人工智能,以及自动化机器学习。随着大型

无视网站反 AI 抓取政策,Anthropic 爬虫机器人惹多个网站所有者不满

据 The Verge 当地时间 26 日报道,Anthropic 公司使用的 ClaudeBot 在短短 24 小时之内,就访问了 iFixit 网站近百万次,此举违反了该网站的使用条款。这一显得有些疯狂的举动,引起 iFixit 的 CEO Kyle Wiens 直接在 X(推特)上开怼,AI在线附大意如下:“如果这些请求(指访问)中的任何一个访问了我们的使用条款,那么它会告诉你我们的内容被明确禁止使用。别问我,去问 Claude!”“我知道你渴望获得数据,Claude 也真的很聪明!但是,你真的有必要在 24