应用

美加州大学团队发明自供电贴片,借助机器学习可使聋哑人“说话”

据外媒 NotebookCheck 今日报道,美国加州大学洛杉矶分校生物工程师近日发明了一种新型自供电贴片,可借助机器学习技术,将喉部肌肉运动等转化为说话的声音。据悉,这种可穿戴贴片可让声带损伤、疾病而导致丧失语言能力或无法正常说话的人“说话”。该粘合贴片可感知喉部肌肉运动,贴片的外层是聚二甲基硅氧烷(PDMS),中间夹着两层铜线圈作为磁感应(MI)层,两层铜线圈被单层聚二甲基硅氧烷和磁铁作为磁机械耦合(MC)层隔开。MC 层上有许多切口,使其在喉部肌肉弯曲时更容易膨胀和收缩。人在发出声音时,需要喉部肌肉的协调运动

15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型

感谢OpenAI 公司近日发布公告,有限开放 Voice Engine 的访问权限,该模型可以根据某人的 15 秒语音片段创建合成语音。OpenAI 在新闻稿中表示:“通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业”。OpenAI 公司表示,目前已经向教育技术公司 Age of Learning、视觉故事平台 HeyGen、前线健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespa

联合国际顶尖高校 昆仑万维开源数字智能体研发工具包AgentStudio

AgentStudio旨在为研究人员和开发者提供一个覆盖智能体完整开发流程的综合性平台,让开发者们能够轻松、高效、灵活地构建专属数字智能体。

阿里出品!用一篇文章帮你了解AI数字人行业

人工智能(AI)技术的进步不仅改变了我们生活的方方面面,还在各行各业中展现出了巨大的潜力。AI 数字人,作为人工智能技术的一个重要分支,正在逐渐成为众多行业关注的焦点。这些虚拟的数字角色不仅具有逼真的外观和行为,还能够以超乎想象的方式与人类交互,从而提供全新的服务体验和业务机会。本文整理了 AI 数字人相关的基础概念、趋势报告、热点案例、AI 数字人平台和开源项目,以及作为设计师我们能用这些 AI 能力产出哪些有意思的工作。 :一、AI 数字人基础概念 1. 什么是 AI 数字人? "数字人"是指利用先进的计算机图

消息称微软携手 OpenAI 打造新 AI 超算:代号“星际之门”、投入 1000 亿美元

感谢根据国外科技媒体 The Information 报道,微软正携手 OpenAI,投入 1000 亿美元(IT之家备注:当前约 7240 亿元人民币),开发代号为“Stargate”的全新人工智能超级计算机。Stargate 也是一部 1994 年上映的电影名称,中文译名为《星际之门》。IT之家查询相关资料,米高梅和华纳兄弟公司有意重启 1994 年的经典科幻电影《星际之门》,由著名导演罗兰・艾默里奇 (Roland Emmerich) 来执导,重启之后的《星际之门》将拍摄成三部曲形式。回归到微软和 OpenA

微软照片应用加入 Copilot 插件,可创建幻灯片和设置桌面壁纸

微软悄悄为其照片应用加入了一个 Copilot 的插件,旨在帮助用户以一种更智能的方式管理照片。不过这项功能目前尚处于初始阶段,其功能比较有限。这一消息由 Windows 爱好者 @PhantomOfEarth 率先在社交平台 X 上披露,搭载此项新 AI 功能的照片应用版本号为 2024.11030.22001.0。如果你的应用是此版本,只需前往插件设置区,即可找到开启 Copilot 功能的开关。但需要注意的是,目前版本的 Copilot 插件仅能帮助用户在应用内创建和浏览照片幻灯片,以及将指定照片设置为桌面背

印度总理莫迪会见比尔・盖茨,探讨科技“平民化”等话题

据《印度斯坦时报》等当地传媒报道,印度总理莫迪当地时间周五会见了微软联合创始人比尔・盖茨,双方共同讨论了人工智能、数字鸿沟及技术赋能等一系列话题。莫迪称相信技术的平民化,它为每个人提供了平等的机会,目前正在将技术带入乡村。他还表示,自己经常听说世界上存在数字鸿沟,决定不允许印度出现类似情况。“我决定不允许印度出现数字鸿沟,因此将基础设施带到了全国各地的村庄…… 公共基础设施的数字化,本身就是一项重大要求。”莫迪表示印度需要数字化的公共基础设施,盖茨补充说“印度在这方面处于领先地位”。盖茨还称,吸引他访问印度的不仅是

AI 在用 | 有了这个超级提示和Claude 3,不听播客也能搞定节目内容

机器之能报道编辑:Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。 因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。不用听完冗长的播客就能迅速掌握节目内容?X 用户 @genie0309 利用 Claude 3 Opus  做到了这一点。这位用户是一位连续创业者、投资人,平时重度依靠播客获取深度信息,然而优质播客节目时长至少 45 分

在好莱坞发动“魅力攻势”,消息称 OpenAI 向派拉蒙、环球等影业巨头展示 Sora

感谢据英国《金融时报》报道,OpenAI 近期在好莱坞发动了一场“魅力攻势”—— 与派拉蒙、环球和华纳兄弟探索等主要电影公司举行会议,展示其视频生成技术 Sora,并缓解对人工智能模型将损害电影行业的担忧。报道援引多位知情人士消息称,OpenAI 首席执行官山姆・阿尔特曼和首席运营官布拉德・莱特凯普在近期数日间举行的会议上,向影业巨头高管们做了 Sora 的产品介绍。参与会议的人员表示,OpenAI 正在就如何推出 Sora 寻求影业高管们的意见。一些观看了演示的人说,他们可以看到 Sora 或类似的人工智能产品如

AI创业吧!不缺计算资源那种

大模型技术革命爆发一年多,对大众来说,大模型神秘的样子逐渐清晰,AI 创业也从兴奋期慢慢开始务实。当前 AI 技术创业周期已经进入应用层,甚至已经开始快速迭代。3 月 13 号,a16z 发布了 TOP50 AI 应用,和半年前相比,已换血一半。技术改变世界的过程,正是创业浪潮大浪淘金的过程。创业项目逐渐成熟的同时,暴露出更多问题,技术、成本、场景、商业化…… 每个环节都需要解决。技术创业进入应用落地阶段,创业者所需要的创新要素和资源一直在变化。阿里云伴随着时代周期,和创业者来到关卡,为时代浪潮提供助力。3 月 2

Attention isn’t all you need!Mamba混合大模型开源:三倍Transformer吞吐量

Mamba 时代来了?自 2017 年开创性研究论文《Attention is All You Need》问世以来,transformer 架构就一直主导着生成式人工智能领域。然而,transformer 架构实际上有两个显著缺点:内存占用大:Transformer 的内存占用量随上下文长度而变化。这使得在没有大量硬件资源的情况下运行长上下文窗口或大量并行批处理变得具有挑战性,从而限制了广泛的实验和部署。 随着上下文长度的增加,推理速度会变慢:Transformer 的注意力机制随序列长度呈二次方扩展,并且会降低吞

马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文

马斯克搞大模型,速度也奇快。Grok 1 开源才刚有 10 天,Grok 1.5 就来了。本周五早上,马斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。新一代模型实现了长上下文理解和高级推理能力,计划将在未来几天内向早期测试人员和 X 平台(前 Twitter)上的现有 Grok 用户提供。上周一,马斯克刚刚开源了 3140 亿参数的混合专家(MoE)模型 Grok-1。通过开源 Grok-1 的模型权重和网络架构,Gork 项目已展示了 xAI 截至去年 11 月所取得的

Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩

一张照片 一段视频,就能让照片活起来!近日,由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该模型仅开源 5 天 GitHub 即收获 1k 星,在 Twitter 更是「火出圈」,吸引了大量博主二创,浏览量总量达到 300K。目前 Champ 已经开源推理代码与权重,用户可以直接从 Github 上下载使用。官方 Hugging Face 的 Demo 已经上线,封装的 Champ-ComfyUI 也正在同步推进中。GitHub 主页显示团队将会在近期开源训练代码及数据集,感兴

WeFit-2024:女性科技精英共话AI新质生产力,展望未来科技新篇章

2024年3月28日,春意盎然的午后,深圳市南山区妇女联合会携手深圳市人工智能学会,在深圳西丽湖人才服务中心迎来了第三届信息科技女性精英论坛——WeFit-2024。 本次盛会以“AI助推新质生产力”为主题,汇聚了众多科技领域的女性精英,共同探讨人工智能如何引领生产力的革新与进步。 在开幕式上,深圳市人工智能学会常务副理事长兼秘书长、北京大学深圳研究生院党委副书记邹月娴博士担纲主持。

提前 0.9 秒预测,Emo 机器人问世:能同步模仿你的面部表情

名为 Emo 的仿人机器人近日问世,它会观察你的面部表情,然后可以镜像模仿你的面部表情,达到你笑它也笑的效果。人工智能(AI)目前快速发展,现在固然可以在很大程度上模仿人类语言,不过放在实体机器人中,互动往往会产生“恐怖谷理论”(Uncanny Valley),一个重要的原因是机器人无法复制复杂的非语言暗示和举止。纽约哥伦比亚大学的霍德・利普森(Hod Lipson)及其同事们创造了一个名为 Emo 的机器人,它利用人工智能模型和高分辨率摄像头预测人们的面部表情,并试图复制这些表情。它能在某人微笑前约 0.9 秒预

OPPO / 一加 ColorOS AI 功能上新:支持英语教学、面试培训和问答互动

OPPO 官方今日宣布,ColorOS 全新 AI 功能上线,IT之家整理此次更新重点内容如下:新增小布英语老师,支持 AI 模拟真人教学,提供一对一口语陪练。新增小布面试官,支持 AI 模拟面试,帮助用户掌握面试技巧。新增小布问答,该功能旨在帮助用户完成各类商品评论、社交平台文案,以及全套旅行规划等。上述功能体验路径:在负一屏搜索“小布助手”,点击进入,选择对应的功能模块便可开启使用。IT之家附已支持该功能的机型和注意事项如下:适配机型OPPO Find N3 系列OPPO Find X7 系列OPPO Find

AMD潘晓明:携手产业链合作伙伴迈入AI PC新时代

近日,在北京举办的 AMD AI PC 创新峰会上,AMD 携手 OEM 合作伙伴联想和华硕,以及生态系统合作伙伴百川智能、有道、游戏加加、生数科技、始智 AI 等共庆 AI PC 腾飞之年,展示了 Ryzen AI PC 生态系统的强大实力,以及 AMD 在中国 AI PC 生态系统中的良好发展势头,将创新领先的 AI PC 体验带给最终用户。在峰会上,AMD 高级副总裁,大中华区总裁潘晓明首先做了隆重的开场致辞,形象地从 “天时、地利、人和” 三个角度谈及,“AI 是当前最热门、最火爆的话题,AI 的爆炸式增长

聚焦AI科技与医疗的跨学科融合,CAIR香港人工智能与机器人医疗论坛开幕

2024年3月28日至29日,“CAIR香港人工智能与机器人医疗论坛”在香港科学园举行。 论坛由中国科学院香港创新研究院人工智能与机器人创新中心主办,聚焦人工智能与机器人在医疗领域的创新应用。 来自全球的专家学者参与,探讨如何透过科技提升医疗服务质量、优化资源配置、提升效率,并促进医学研究发展。