应用
AMD 发布 ROCm 6.1.3,支持 RX 7900 GRE 显卡及 TensorFlow
AMD 正式推出了最新的 ROCm(Radeon Open Compute)平台,宣布支持多 GPU 集群,例如双 RX 7900XTX 或 W7900 显卡、2 张或 4 张 PRO W7900 双槽工作站显卡。除此之外,ROCm 还支持了更多 RDNA3 显卡,包括 Radeon RX 7900 GRE,以及本月新推出的 PRO W7900 双槽工作站显卡,后者定价 3499 美元(IT之家备注:当前约 25433 元人民币)。除此之外,新版 ROCm 最重要的一点还在于增加了对 WSL 2 (Windows
吊打阿里EMO?让马斯克唱Rap、奥特曼说脱口秀的AI神器出圈,人人免费可用
机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。最近,AI 圈刮起一股「让照片开口唱歌」的风潮。例如,让霉霉唱碧昂丝《Halo》的 Hallo、斯坦福创业团队的 Proteus、以及之前阿里出品的 EMO。就在昨天,又有一家名为 Hedra 的公司前来踢馆,推出了基础模型 ——
前百度高管景鲲创立Genspark获4.35亿融资;CuspAI获3000万美元融资;Hinton担任董事会顾问丨AI情报局
情报局直击CVPR2024 超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文 : 2024 年的 CVPR 会议在美国西雅图举办,成为了该会议历史上最大规模和最多参与人数的一届,共有 1.2 万人参与。 本届会议共有 35691 位注册作者,提交了 11532 篇论文,其中 2719 篇论文被接收,录用率为 23.6%。 与去年相比,论文数量增加了 20.6%,但录用率略有下降。
AI 新研究可用手机检测中风:准确率达 82%,分析面部肌肉运动
来自皇家墨尔本大学(RMIT)生物医学工程师团和圣保罗州立大学的博士生 Guilherme Camargo de Oliveira 共同开发了一款基于 AI 的面部筛查工具,医护人员只需要借助智能手机,在几秒钟内就可以确定患者是否中风。▲ 博士生 Guilherme Camargo de Oliveira 与 RMIT 大学客座副教授 Nemuel Daniel Pah(画面中人物)展示了面部筛查工具该工具在检测中风方面的准确率达到了 82%,但不会取代中风的综合临床诊断测试,仅用于帮助更快地识别需要治疗的人。RM
与大模型交手近 1500 天,智源仍在坚持原始创新
2024 上半年, OpenAI 的成果从世界模拟器 Sora,到首个实现多模态 in 到多模态 out 的 GPT-4o ,仍在强势推进着迈向 AGI 的节奏。 面对技术上的差距,追赶 OpenAI ——是这场人工智能革命浪潮发展至今, AI 界仍在追求的目标和努力的方向。 但其实,当下的 AI 技术尚处于高速迭代的过程,依然有非常多有挑战性的问题没有被解决,而其中的研究趋势和范式也不一定只有 OpenAI 才能引领。
1342万考生填报志愿这件事 ,AI搜索可帮了大忙
大模型、AI 搜索的一次重要实践。又是一年,千军万马过独木桥。就在本月,2024 年高考刚刚结束。今年的高考报名人数达到了创纪录的 1342 万。对于很多人来说,人生正在迈入一个新的阶段。下个星期,各省市即将进入志愿填报阶段,相比考试本身,这部分工作同样重要,有关大量信息的获取和分析,也需要学生、家长和老师的共同努力。就连机器之心的公众号后台,最近也有人留言希望获得人工智能专业报考的指导。今年的高考报志愿称得上「史无前例」:除了考生人数多,另一个关键词是「新高考」。自 2014 年起,我国开启了自恢复统一高考以来最
超越CVPR 2024方法,DynRefer在区域级多模态识别任务上,多项SOTA
为了实现高精度的区域级多模态理解,本文提出了一种动态分辨率方案来模拟人类视觉认知系统。本文作者来自于中国科学院大学LAMP实验室,其中第一作者赵毓钟是中国科学院大学的2023级博士生,共同一作刘峰是中国科学院大学2020级直博生。他们的主要研究方向是视觉语言模型和视觉目标感知。简介DynRefer 通过模拟人类视觉认知过程,显著提升了区域级多模态识别能力。通过引入人眼的动态分辨率机制,DynRefer 能够以单个模型同时完成区域识别、区域属性检测和区域字幕生成(region-level captioning)任务,
徐凌杰创立魔形智能,国际头部GPU高管加盟
导语:创业方向是做大模型基础设施。 作者丨马蕊蕾编辑丨陈彩娴近日,前「壁仞科技」总裁徐凌杰,离开壁仞4个月后,于2024年6月份,正式成立了上海魔形智能有限公司。 据悉,徐凌杰毕业于上海交通大学电子工程系,先后在德州大学奥斯汀分校取得计算机工程硕士学位,以及加州大学伯克利分校MBA学位。
徐图智能徐东:文生视频创业,要用坚定信仰对抗 fomo 的大厂
在 GPT-4 发布一年多后,OpenAI 推出 GPT-4o,是有史以来第一个真正实现「多模态输入—多模态输出」的多模态模型。 GPT-4o 的出现所传递的信息是:在底层模型并没有变得更智能的情况下,能够跨多种模态进行推理的模型必然是更加通用的。 因为其不仅具备多种功能,还能以不同模态传递知识。
突发!Ilya Sutskever成立新公司SSI,安全超级智能是唯一目标与产品
自 5 月 15 日从 OpenAI 离职后,OpenAI 前首席科学家 Ilya Sutskever 官宣了自己的新动向。今日凌晨,Ilya 在社媒 X 上表示自己创立了一家新公司——「安全超级智能」(Safe SuperIntelligence,SSI)。该公司的目标和产品非常明确、单一:追求安全的超级智能,希望通过一支精干顶尖的小团队取得革命性的成果,进而实现这一目标。以下是 SSI 公司的公告:超级智能已经触手可及。构建安全超级智能(SSI)是我们这个时代最重要的技术难题。我们已经启动了世界上第一个专注于S
超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文
作者:赖文昕 马蕊蕾编辑:陈彩娴北京时间今天凌晨,美国西雅图正在召开的计算机视觉盛会 CVPR 2024 正式公布了最佳论文等奖项。 今年共有 2 篇论文获得了这份全球最重要的计算机视觉领域的大奖,团队成员分别来自谷歌研究院、加州大学圣地亚哥分校、南加州大学、剑桥大学及布兰迪斯大学。 本周(6.17-6.21),第四十一届国际计算机视觉与模式识别会议(CVPR)在美国西雅图拉开帷幕。
我国人工智能企业数量已超 4000 家,去年 AI 核心产业规模达 5784 亿元
IT之家从央视新闻获悉,2024 世界智能产业博览会今天在天津举行,《中国新一代人工智能科技产业发展报告 2024》发布。数据显示,我国人工智能企业数量已经超过 4000 家,人工智能已成为新一轮科技革命和产业变革的重要驱动力量和战略性技术。我国立足自主创新,已构建起包括智能芯片、大模型、基础架构和操作系统、工具链、深度学习平台和应用技术在内的人工智能技术体系、产业创新生态和企业联盟,对重塑工业体系、大力推进新型工业化的关键支撑效应正逐渐显现。2023 年,我国人工智能核心产业规模达 5784 亿元,增速 13.9
VueConf 2024 所有演讲嘉宾确定,将于 7 月 6 日在深圳举办
VueConf 2024 将于 7 月 6 日在深圳举办。目前已进入倒计时阶段。大会网站: 作者尤雨溪将出席本次会议并发表主题演讲。演讲嘉宾本次大会将会有 9 位分享嘉宾给大家带来分享!演讲主题一共将有 9 个分享主题和 1 个闪电分享。现向大家公布 8 个分享主题和闪电分享的主题,尤雨溪的演讲主题将在现场揭晓!主题演讲分享人:尤雨溪十年分享人:Vue.js 核心团队成员 赵锦江 (Jinjiang) 主题介绍他将分享自己加入 Vue 核心团队十年 (2014-2024) 的心路历程,希望这个分享能够给对 Vue
容量提高 10% 寿命延长 25%,英国一公司推 AI 电池管理系统
英国科技公司 Eatron Technologies 和美国 AI 芯片公司 Syntiant 共同开发了一款 AI 电池管理系统(BMS),可“释放”电池额外 10% 的容量,并将电池寿命延长 25%。据悉 AI-BMS 将 Eatron Technologies 的智能算法集成到 Syntiant 的超低功耗 NDP120 神经决策处理器中,来实现电池容量和寿命的提升。Eatron 预训练模型不仅可以对电池健康状态、充电状态和剩余使用寿命进行“极其精确”的评估,还可以提前预测电池可能存在的问题来提高安全性。芯片
百度文库宣布“橙篇”行业首创 10 万字长文生成及多模态编辑能力
百度文库昨日宣布,新产品“橙篇”行业首创 10 万字长文生成及多模态编辑能力,成为行业首个“查阅创编”一站式 AI 自由创作平台。据IT之家此前报道,百度文库于 5 月 30 日发布 AI 原生应用“橙篇”,“橙篇”是一个知识检索和问答、超长图文理解和生成、深度编辑和跨模态自由创作的综合性 AI 产品。“橙篇”有以下功能:长文生成写作资料搜索:专业学术搜索与 AI 全网搜索文档总结:支持超长 / 多个 / 多种格式(包括各类型格式文件、URL 链接、图片等)文档全文智能校正制作图表:自动理解并提取文本数据文本翻译百
“HumanPlus”机器人问世:可模仿人类动作弹钢琴、叠衣服,基于中国公司平台
斯坦福大学研究人员近日研发了一款仿人机器人 HumanPlus,它可以模仿人类的行为,并支持模仿动作来进行学习。据介绍,它可以通过模仿人类动作来学习弹钢琴、回击乒乓球、折叠衣服等。斯坦福大学团队成员傅子鹏(音译)表示,该类人机器人使用单个 RGB 摄像头和全身策略来复制人类动作。值得一提的是,傅子鹏 14 日在其个人 YouTube 频道上发布了 HumanPlus 的数个演示视频,展示了其诸多方面的“学习能力”。 研究人员表示,HumanPlus 需要约 40 小时的人类运动数据来学习一项任务,然后逐步执行。此
Runway 王者归来!发布新模型 Gen-3 Alpha,直接对标 Sora
大家好,这里是和你们一起探索 AI 的花生。
自 OpenAI 发布 Sora,将文生视频拉高到一个新的高度后,各家 AI 视频工具都在努力升级模型、添加新功能,以期在这场竞赛中保住自己的一席之地,比如 Pika 已经推出了风格选择、视频配音、唇形一致等多种功能,Vidu、Kling 则是类 Sora 的新模型,在生成效果上已经十分接近 Sora。而曾经的领军产品 Runway 却始终都没有什么动静,因此很多人都在担心它未来的发展。
最近 Runway 终于放出大招,发布了第三代模型 Gen-3 Alpha,它各方
OpenAI“宫斗”核心人物 Ilya Sutskever 出走后单飞:建立“全球首个”安全超级智能实验室
北京时间今天凌晨,原 OpenAI 公司联合创始人、首席科学家 Ilya Sutskever 在 X(推特)官宣了他正式创业的消息 —— 创办了一家名为“安全超级智能”(Safe Superintelligence,简称 SSI)的新公司,旨在创造一个“纯粹的”安全超级智能。Ilya Sutskever 表示,公司将只有一个重点、一个目标和一个产品,通过一个小型破解团队来取得“革命性”的突破,去实现追求安全超级智能的目标。同时,新公司自称是“世界上第一个”直击 SSI 的实验室。Sutskever 与 OpenAI