应用

德国研究团队发布新 AI 模型,可根据网球运动员肢体语言识别情绪

据 ScienceDaily17 日报道,德国卡尔斯鲁厄理工学院和杜伊斯堡-埃森大学研究人员借助计算机辅助神经网络,准确识别了网球运动员在比赛中的肢体语言所表达的情绪。团队首次利用实际比赛数据训练了这一基于 AI 的模型,研究成果登上了最新一期人工智能领域学术期刊《知识系统》。IT之家附链接:,两所学校的体育科学、软件开发与计算机科学研究人员开发了一种特殊的 AI 模型,利用卷积神经网络识别网球运动员的情感状态,并使用模式识别程序分析了实际比赛中网球运动员的视频。卡尔斯鲁厄理工学院体育与运动科学研究所 Darko

“力压 GPT-4o 和 Gemini 1.5 Pro”,Anthropic 推出 Claude 3.5 Sonnet AI 模型

Anthropic 今天(6 月 21 日)推出了 Claude 3.5 Sonnet,这是 Claude 3.5 系列的首个模型版本,在各项评估中优于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。Claude 3.5 Sonnet 在前代的基础上迭代升级,性能更快,编码、视觉和自然语言理解能力更强。Claude 3.5 Sonnet 属于中等尺寸模型,介于小型 Haiku 和高端 Opus 之间,但 Anthropic 声称,根据内部基准测试,Sonnet 的性能甚至超过了顶级 Opu

有望不再建议往披萨里加胶水?数据显示谷歌已降低 Reddit 对 AI 搜索结果的影响

今年的谷歌 I / O 大会上,谷歌推出了“重磅功能”—— 基于 AI 的搜索(AI 摘要 / AI Overviews)。然而在此功能上线后不久,不少用户反馈称 AI 会生成一些奇怪的结果,例如往披萨里加胶水防止配料掉落、每天吃几块小石头等等。据悉,部分奇怪回复是 AI 系统从 Reddit 帖子中提取信息而造成的,例如往披萨里加胶水就来自一个 11 年前的 Reddit 帖子。根据搜索引擎优化平台 SERanking 当地时间 20 日公布的数据显示,Reddit 已经不再是谷歌“AI 摘要”功能信息来源的前十

ComfyUI 插件竟然包含病毒!做好这 5 点降低中招风险

大家好,这里是和你们一起探索 AI 的花生~ ComfyUI 是目前最受欢迎的开源 AI 绘画绘画工具之一,它具有极高的灵活性,只需安装对应的插件就可以自己搭建工作流,实现个性化出图或体验最新的 AI 模型。如果你是 ComfyUI 的深度用户,那么安装各类插件肯定是家常便饭了,不过最近出现的一起 ComfyUI 插件包含恶意病毒的事件,却让我们看到了开源社区自由繁荣背后的另一面,如果不提高防范意识,下一个受害的很可能就是我们自己。 相关推荐:一、病毒插件 ComfyUI_LLMVISION 事情的起因是网友 @_

AI 时代做 UX 个性化,没人会告诉你这些事情

编者按:这篇文章来自 Google Flights 的 UX 研究负责人 Slava Polonski ,他也是 Google's People AI Guidebook 的研究员。他拥有牛津大学博士学位,曾入选福布斯 30 Under 30 榜单。他是世界经济论坛专家网络和世界经济论坛全球塑造者社区的活跃成员。他撰写的文章涉及用户体验、社会科学和技术的交叉领域。作为一个横跨 UX 和 AI 两大领域的资深研究者,他撰写了这篇文章,不仅深入剖析了 UX 领域个性化问题的本质,而且也指出了 AI 时代 UX 领域前进

OpenAI 竞争对手 Anthropic 发布其最强 AI 大模型 Claude 3.5

感谢IT之家网友 VrianCao、Diixx、我抢了台 的线索投递!OpenAI 竞争对手 Anthropic 周四发布了其迄今为止最强大的 AI 模型 Claude 3.5 Sonnet。与 OpenAI 的 ChatGPT 和谷歌 Gemini 一样,Claude 在过去的一年里也是人气爆棚。Anthropic 由 OpenAI 前研发高管创立,赢得了谷歌、Salesforce 和亚马逊的支持。在过去的一年里,Anthropic 完成了五笔融资,总额约为 73 亿美元。今年 3 月,Anthropic 推出了

北京市首例“AI 换脸”软件侵权案宣判:国风博主短视频被“换脸”后制作成付费模板

据北京互联网法院消息,6 月 20 日,北京互联网法院一审开庭宣判了两起北京市首例“AI 换脸”软件侵权案件,认定使用他人视频“换脸”后制作模板再提供“换脸”服务的网络服务提供者侵害了他人的个人信息权益。两案原告廖某、吴某均系国风短视频模特,在全网拥有众多粉丝。被告是一款“换脸”App 的运营者。原告主张,在未经其授权同意的情况下,被告使用原告的出镜视频制作换脸模板,并上传至涉案换脸 App 中,提供给用户付费使用借此牟利。原告认为,被告的行为侵害了原告的肖像权。同时,被告未经原告同意擅自上传和使用了具有原告肖像信

AMD 发布 ROCm 6.1.3,支持 RX 7900 GRE 显卡及 TensorFlow

AMD 正式推出了最新的 ROCm(Radeon Open Compute)平台,宣布支持多 GPU 集群,例如双 RX 7900XTX 或 W7900 显卡、2 张或 4 张 PRO W7900 双槽工作站显卡。除此之外,ROCm 还支持了更多 RDNA3 显卡,包括 Radeon RX 7900 GRE,以及本月新推出的 PRO W7900 双槽工作站显卡,后者定价 3499 美元(IT之家备注:当前约 25433 元人民币)。除此之外,新版 ROCm 最重要的一点还在于增加了对 WSL 2 (Windows

吊打阿里EMO?让马斯克唱Rap、奥特曼说脱口秀的AI神器出圈,人人免费可用

机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。   我们也欢迎读者投稿亲自实践的创新型用例。最近,AI 圈刮起一股「让照片开口唱歌」的风潮。例如,让霉霉唱碧昂丝《Halo》的 Hallo、斯坦福创业团队的 Proteus、以及之前阿里出品的 EMO。就在昨天,又有一家名为 Hedra 的公司前来踢馆,推出了基础模型 ——

前百度高管景鲲创立Genspark获4.35亿融资;CuspAI获3000万美元融资;Hinton担任董事会顾问丨AI情报局

情报局直击CVPR2024 超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文 :  2024 年的 CVPR 会议在美国西雅图举办,成为了该会议历史上最大规模和最多参与人数的一届,共有 1.2 万人参与。 本届会议共有 35691 位注册作者,提交了 11532 篇论文,其中 2719 篇论文被接收,录用率为 23.6%。 与去年相比,论文数量增加了 20.6%,但录用率略有下降。

AI 新研究可用手机检测中风:准确率达 82%,分析面部肌肉运动

来自皇家墨尔本大学(RMIT)生物医学工程师团和圣保罗州立大学的博士生 Guilherme Camargo de Oliveira 共同开发了一款基于 AI 的面部筛查工具,医护人员只需要借助智能手机,在几秒钟内就可以确定患者是否中风。▲ 博士生 Guilherme Camargo de Oliveira 与 RMIT 大学客座副教授 Nemuel Daniel Pah(画面中人物)展示了面部筛查工具该工具在检测中风方面的准确率达到了 82%,但不会取代中风的综合临床诊断测试,仅用于帮助更快地识别需要治疗的人。RM

与大模型交手近 1500 天,智源仍在坚持原始创新

2024 上半年, OpenAI 的成果从世界模拟器 Sora,到首个实现多模态 in 到多模态 out 的 GPT-4o ,仍在强势推进着迈向 AGI 的节奏。 面对技术上的差距,追赶 OpenAI ——是这场人工智能革命浪潮发展至今, AI 界仍在追求的目标和努力的方向。 但其实,当下的 AI 技术尚处于高速迭代的过程,依然有非常多有挑战性的问题没有被解决,而其中的研究趋势和范式也不一定只有 OpenAI 才能引领。

1342万考生填报志愿这件事 ,AI搜索可帮了大忙

大模型、AI 搜索的一次重要实践。又是一年,千军万马过独木桥。就在本月,2024 年高考刚刚结束。今年的高考报名人数达到了创纪录的 1342 万。对于很多人来说,人生正在迈入一个新的阶段。下个星期,各省市即将进入志愿填报阶段,相比考试本身,这部分工作同样重要,有关大量信息的获取和分析,也需要学生、家长和老师的共同努力。就连机器之心的公众号后台,最近也有人留言希望获得人工智能专业报考的指导。今年的高考报志愿称得上「史无前例」:除了考生人数多,另一个关键词是「新高考」。自 2014 年起,我国开启了自恢复统一高考以来最

超越CVPR 2024方法,DynRefer在区域级多模态识别任务上,多项SOTA

为了实现高精度的区域级多模态理解,本文提出了一种动态分辨率方案来模拟人类视觉认知系统。本文作者来自于中国科学院大学LAMP实验室,其中第一作者赵毓钟是中国科学院大学的2023级博士生,共同一作刘峰是中国科学院大学2020级直博生。他们的主要研究方向是视觉语言模型和视觉目标感知。简介DynRefer 通过模拟人类视觉认知过程,显著提升了区域级多模态识别能力。通过引入人眼的动态分辨率机制,DynRefer 能够以单个模型同时完成区域识别、区域属性检测和区域字幕生成(region-level captioning)任务,

徐凌杰创立魔形智能,国际头部GPU高管加盟

导语:创业方向是做大模型基础设施。 作者丨马蕊蕾编辑丨陈彩娴近日,前「壁仞科技」总裁徐凌杰,离开壁仞4个月后,于2024年6月份,正式成立了上海魔形智能有限公司。 据悉,徐凌杰毕业于上海交通大学电子工程系,先后在德州大学奥斯汀分校取得计算机工程硕士学位,以及加州大学伯克利分校MBA学位。

徐图智能徐东:文生视频创业,要用坚定信仰对抗 fomo 的大厂

在 GPT-4 发布一年多后,OpenAI 推出 GPT-4o,是有史以来第一个真正实现「多模态输入—多模态输出」的多模态模型。 GPT-4o 的出现所传递的信息是:在底层模型并没有变得更智能的情况下,能够跨多种模态进行推理的模型必然是更加通用的。 因为其不仅具备多种功能,还能以不同模态传递知识。

突发!Ilya Sutskever成立新公司SSI,安全超级智能是唯一目标与产品

自 5 月 15 日从 OpenAI 离职后,OpenAI 前首席科学家 Ilya Sutskever 官宣了自己的新动向。今日凌晨,Ilya 在社媒 X 上表示自己创立了一家新公司——「安全超级智能」(Safe SuperIntelligence,SSI)。该公司的目标和产品非常明确、单一:追求安全的超级智能,希望通过一支精干顶尖的小团队取得革命性的成果,进而实现这一目标。以下是 SSI 公司的公告:超级智能已经触手可及。构建安全超级智能(SSI)是我们这个时代最重要的技术难题。我们已经启动了世界上第一个专注于S

超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文

作者:赖文昕 马蕊蕾编辑:陈彩娴北京时间今天凌晨,美国西雅图正在召开的计算机视觉盛会 CVPR 2024 正式公布了最佳论文等奖项。 今年共有 2 篇论文获得了这份全球最重要的计算机视觉领域的大奖,团队成员分别来自谷歌研究院、加州大学圣地亚哥分校、南加州大学、剑桥大学及布兰迪斯大学。 本周(6.17-6.21),第四十一届国际计算机视觉与模式识别会议(CVPR)在美国西雅图拉开帷幕。