资讯列表
2024 IEEE Fellow名单出炉:胡事民、崔斌、林倞等入选
今年同样有多位华人入选。本周三,美国电子电气工程师学会(Institute of Electrical and Electronic Engineers,IEEE)发布了新一届 Fellow 名单。IEEE 是国际性的电子技术与信息科学工程师学会,成立于 1963 年,如今海外会员的人数已经超过了美国本土,在 160 多个国家拥有超过 40 万会员。IEEE Fellow 为该学会最高等级会员,是 IEEE 授予成员的最高荣誉,在学术科技界被认定为权威的荣誉和重要的职业成就。当选 Fellow 需要对工程科学与技术
历数5年89篇研究,这篇综述告诉我们深度学习中的代码数据增强怎么样了
当今深度学习以及大模型的飞速发展,带来了对创新技术的不断追求。在这一进程中,代码数据增强技术显现出其不可忽视的价值。最近,由蒙纳士大学、新加坡管理大学、华为诺亚方舟实验室、北京航空航天大学以及澳大利亚国立大学联合进行的对近 5 年的 89 篇相关研究调查,发布了一份关于代码数据增强在深度学习中应用的全面综述。论文地址::,还展望了其未来的发展潜力。作为一种在不收集新数据的情况下增加训练样本多样性的技术,代码数据增强已在机器学习研究中获得广泛应用。这些技术对于资源匮乏领域的数据驱动模型性能提升具有显著意义。然而,在代
Speaking AI!效果真实的文本转语音神器,可以一键克隆自己的声音
大家好,这里是和你们一起探索 AI 的花生~
之前推荐过 AI 无痕翻译视频的相关内容,它的实现条件包括文本内容的准确翻译、人物语音克隆及嘴型匹配。今天我们就来看一款效果非常不错的 AI 语音克隆工具 Speaking AI,它可以将文本转为如真人说话一般自然的语音,还支持用户免费克隆自己的声音。
上期回顾:一、Speaking AI 介绍
网站直达:
Speaking AI 是一个初创公司,创始人为 Harry Zheng,其团队成员也都是中国人。公司创立的初衷是坚信对话式生成语音代表着人类与人工智能之间的未来
马斯克爆料OpenAI前员工举报信,指出Altman和Greg七宗罪,ChatGPT一度宕机
在与 OpenAI 有关的重大事件里,马斯克从不缺席,哪怕是以旁观者的身份。刚刚,马斯克声称,他收到一份关于 OpenAI 的信件,「(里面提到的)这些问题似乎值得调查。」但很快,这份信件就被删除了。不过,根据相关报道可知,这份信件原本是 OpenAI 前员工写给董事会的。在信中,他们陈述了对 Sam Altman 和 Greg Brockman 的不满,并要求董事会「彻查这些指控,并采取适当行动」。这和「700 多名员工签署联名信,要求董事会恢复 Altman 职位」的举动形成鲜明对比。虽然信的原件被删除了,但一
Stable Video Diffusion来了,代码权重已上线
Stability AI 的视频生成模型看来效果不错。AI 画图的著名公司 Stability AI,终于入局 AI 生成视频了。本周二,基于 Stable Diffusion 的视频生成模型 Stable Video Diffusion 来了,AI 社区马上开始了热议。很多人都表示「我们终于等到了」。项目地址:,你可以基于原有的静止图像来生成一段几秒钟的视频。基于 Stability AI 原有的 Stable Diffusion 文生图模型,Stable Video Diffusion 成为了开源或已商业行列中
PyTorch团队重写「分割一切」模型,比原始实现快8倍
我们该如何优化 Meta 的「分割一切」模型,PyTorch 团队撰写的这篇博客由浅入深的帮你解答。从年初到现在,生成式 AI 发展迅猛。但很多时候,我们又不得不面临一个难题:如何加快生成式 AI 的训练、推理等,尤其是在使用 PyTorch 的情况下。本文 PyTorch 团队的研究者为我们提供了一个解决方案。文章重点介绍了如何使用纯原生 PyTorch 加速生成式 AI 模型,此外,文章还介绍了 PyTorch 新功能,以及如何组合这些功能的实际示例。结果如何呢?PyTorch 团队表示,他们重写了 Meta
Altman大胜收局:重返OpenAI任CEO,董事会重组
机器之能报道编辑部靴子终于落地——上演几天的 OpenAI 大戏迎来最终结局:博弈双方原则上达成协议,Sam Altman 重返 OpenAI 担任 CEO,董事会成员出现重大变更。早先被媒体爆料与 Altman 存在分歧的独立董事乔治城大学安全与新兴技术中心战略总监海伦·托纳(Helen Toner),以及另一位独立董事Tasha McCauley 没有出现在新名单中。新增的两位董事分别是 Bret Taylor (曾是推特创始人之一以及董事会主席)和 Larry Summers(美国经济学家,曾担任过美国财政部
涵盖500多项研究、50多个模型,代码大模型综述来了
本文带你全面洞悉用LLM写代码的各式方法。随着 BERT 和 GPT 等预训练 Transformer 的出现,语言建模近些年来取得了显著进步。随着大型语言模型(LLM)的规模扩展至数以千万计的参数数量,LLM 开始展现出通用人工智能的迹象,它们的应用也已经不局限于文本处理。Codex 首次展现出了 LLM 在代码处理方面的出色能力,之后更是出现了 GitHub Copilot 这样的商业产品以及 StarCoder 和 Code LLaMA 等开源代码模型。但是,预训练 Transformer 在代码处理方面的应
用深度催眠诱导LLM「越狱」,香港浸会大学初探可信大语言模型
尽管大语言模型 LLM (Large Language Model) 在各种应用中取得了巨大成功,但它也容易受到一些 Prompt 的诱导,从而越过模型内置的安全防护提供一些危险 / 违法内容,即 Jailbreak。深入理解这类 Jailbreak 的原理,加强相关研究,可反向促进人们对大模型安全性防护的重视,完善大模型的防御机制。 不同于以往采用搜索优化或计算成本较高的推断方法来生成可 Jailbreak 的 Prompt,本文受米尔格拉姆实验(Milgram experiment)启发,从心理学视角提出了一种
达摩院医疗AI突破胰腺癌早筛难题,成果登上Nature Medicine,首次实现大规模胰腺癌筛查
编辑 | 白菜叶这或许是人类与「癌症之王」的斗争中第一次掌握了主动权。2023 年 11 月 21 日,国际医学顶级期刊《Nature Medicine》最新研究表明,通过「平扫CT AI」,人类首次拥有了大规模早期胰腺癌的筛查手段。阿里达摩院(湖畔实验室)联合全球十多家顶尖医疗机构,将AI用于体检中心、医院等无症状人群的胰腺癌筛查,只需要最简单的平扫CT,就在2万多真实世界连续病人群体中发现了31例临床漏诊病变,其中2例早期胰腺癌病患已完成手术治愈。《Nature Medicine》 就此专门刊发评论文章:「基于
通识+产业大模型,「Alaya元识」的赋能路径
2023 年 11 月,国家工业信息安全发展研究中心、工信部电子知识产权中心发布的《中国 AI 大模型创新和专利技术分析报告》显示,我国大模型专利申请总数已突破 4 万余件,大模型相关领域的创新日益活跃。相对于 “能做诗会画画” 的针对 to C 市场的大模型而言,面向 to B 市场的大模型如何深耕行业,充分了解行业知识,并且深入到行业客户的业务流程中,是形成行业壁垒或者说差异化竞争优势的关键。新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告 3.0》显示,大模型厂商在技术实力上呈现出百家争鸣的态势
天玑8300发布:CPU、GPU性能超越8Gen2,实现旗舰级生成式AI能力
最高支持 100 亿参数 AI 大语言模型。
OpenAI董事会被踢爆曾与竞争对手Anthropic讨论合并,Altman 去留仍存变数
机器之能报道编辑:吴昕OpenAI 大戏尚未真正落幕,今天媒体又爆出新闻,抓马到让人惊掉下巴。据 The Information 消息,知情人士透露,OpenAI 董事会曾就两家公司合并的可能性接洽了其竞争对手 Anthropic 的联合创始人兼 CEO Dario Amodei。该知情人士称,此举是 OpenAI 说服 Amodei 接替 Altman 担任 CEO 努力的一部分。目前尚不清楚,这一合并提议是否经过严肃讨论。不过,Amodei 很快拒绝了邀请。这家成立两年的初创公司销售与 ChatGPT 竞争的
可在数据限制下训练高维因果结构,德国DZNE团队提出一种深度神经架构
编辑 | 萝卜皮因果学习是科学人工智能的一个关键挑战,因为它使研究人员能够超越纯粹的相关或预测分析,学习潜在的因果关系,这对于科学理解以及广泛的下游任务非常重要。受新兴生物医学问题的启发,德国神经退行性疾病中心(German Center for Neurodegenerative Diseases,DZNE)的研究人员提出了一种深度神经架构,用于从高维数据和先验因果知识的组合中学习变量之间的因果关系。该团队将卷积神经网络和图神经网络结合在因果风险框架内,提供了一种在高维、噪声和数据限制条件下明显有效的方法,这些条
华科大团队开发几何三角形感知蛋白质语言模型,预测蛋白质-蛋白质接触
编辑 | 萝卜皮有关相互作用蛋白质之间的残基-残基距离的信息对于蛋白质复合物的结构建模非常重要,并且对于理解蛋白质-蛋白质相互作用的分子机制也很有价值。随着深度学习的出现,人们开发了许多方法来准确预测单体的蛋白质内残基-残基接触。然而,准确预测蛋白质复合物,尤其是异源蛋白质复合物的蛋白质间残基-残基接触仍然具有挑战性。华中科技大学的研究人员开发了一种基于蛋白质语言模型的深度学习方法,通过在深度神经网络中引入三角形更新和三角形自注意力的三角形感知机制来预测蛋白质复合物的蛋白质间残基-残基接触(称为 DeepInter
锐思智芯完成数亿元Pre-B轮融资,重点投入量产交付
近日,新一代融合视觉传感器芯片公司锐思智芯宣布完成数亿元Pre-B轮融资。国投创业、元禾辰坤联合领投,联想创投、清科创投、谷雨嘉禾、同歌创投、中科先进产业基金、深圳天使母基金、讯飞创投、追远创投等老股东持续跟投。创始人邓坚表示,本轮资金主要用于企业产品量产、加速新产品研发及新领域开拓等。锐思智芯是一家新型融合视觉传感领域的芯片研发及整体方案提供商,核心技术为其独创的Hybrid Vision融合视觉传感技术,核心产品是融合式视觉传感器芯片ALPIX系列,为智能手机、消费电子、智能安防、智能汽车领域提供一体化智能视觉
Sam Altman要加入微软,推动者Ilya却后悔了,超500名员工请辞逼宫董事会
当我们以为一切尘埃落定的时候,事情又有了新进展。上个周末,AI 领域技术最领先,炙手可热的公司经历了史无前例的巨震。自周六早晨 Sam Altman 被 OpenAI 董事会开除后,我们见证了 OpenAI 这个提出 ChatGPT,引爆生成式 AI 革命的公司,48 小时疯狂的两换 CEO。全世界科技公司都在围观这场不可思议的宫斗。周一早晨,Sam Altman 以访客的身份回到了 OpenAI 旧金山总部进行谈判。据媒体称此次谈判志在夺回 CEO 之位。在今日下午,数小时过去后,谈判终于有了新的结果:Sam A
用检索增强生成让大模型更强大,这里有个手把手的Python实现
自从人们认识到可以使用自己专有的数据让大型语言模型(LLM)更加强大,人们就一直在讨论如何有效地将 LLM 的一般性知识与专有数据整合起来。对此人们也一直在争论:微调和检索增强生成(RAG)哪个更合适?本文首先将关注 RAG 的概念和理论。然后将展示可以如何使用用于编排(orchestration)的 LangChain、OpenAI 语言模型和 Weaviate 向量数据库来实现一个简单的 RAG。检索增强生成是什么?检索增强生成(RAG)这一概念是指通过外部知识源来为 LLM 提供附加的信息。这让 LLM 可以