AI资讯列表 - AI在线

武大等开源大幅面高清卫星影像数据集：涵盖 21 万 + 地理目标，复杂地理空间场景知识精准生成

AI 卫星影像知识生成模型数据集稀缺的问题，又有新解了。来自武汉大学、上海 AI 实验室、西工大等 9 家机构共同推出了该领域的大型数据集，涵盖了 21 万个地理目标和 40 万个目标-关系三元组。而且像机场、港口、立交桥等这样复杂地理空间场景，也都包括在了数据集当中。具体来说，该数据集名为 RSG，主要面向卫星影像中的目标检测（OBD）和场景图生成（SGG）任务。SGG 有助于促进模型对地理空间场景从感知到认知的智能理解，但一直缺乏大幅面、超高分辨率的卫星影像数据。而 RSG 的出现很好地填补了这一空白，一同提出

软银创始人孙正义：新一轮投资将致力于打造“超级人工智能”

据彭博社报道，软银集团创始人孙正义今天在年度大会上对股东表示，他计划打造一个“超级人工智能”时代。孙正义此次描绘了创造出“比人类聪明数千倍”的人工智能的雄心壮志。他表示，Arm 的芯片将支持一个由机器人和强大数据中心组成的生态系统，可以共同治疗癌症、打扫房屋、与孩子一起玩耍。孙正义在今天的大会上出现了数次情绪激动的状况，直言想在永远离开世界之前“改变世界”。他谈到了自己的故友史蒂夫・乔布斯，“当我意识到自己的遗产与乔布斯的遗产相比，实在是相形见绌时，我常常会泪流满面。”“实现超级人工智能是我要做的事情，”孙正义说道

捕捉关键球员默契度，TuGraph程序员用图计算加大模型做足球预测

2024年欧洲杯比赛正酣。在赛场之外，一些围绕观赛的自发科技创新也开始涌现，成为了一道独特的风景。近日，据TuGraph图计算官方微信，其创新小组研发了一项融合图计算、大模型等技术的足球赛事分析工具“智猜足球”，旨在探索新兴人工智能技术在体育赛事应用的可行性。据介绍，这项应用分析了一年多以来欧洲各球队和俱乐部的赛事公开数据，利用图算法构建了一张球员关系网络图，分析了近30000名球员之间的协作关系，并借助图神经网络（GNN）、Transformer、大语言模型等前沿技术，量化球员间的默契配合与竞技对抗元素，训练了近

商汤科技拟募资 20.08 亿港元用于产品开发，7 月 5 日发布日日新 5.5 大模型

商汤科技今日发布公告，拟配售 B 类股份，总筹 20.08 亿港元（当前约 18.71 亿元人民币）。据《科创板日报》报道，商汤本次配售有多家战略投资人及头部海外基金入股，现有股东增持，募集资金将用于大模型研究及产品开发等。报道称，商汤将于 7 月 5 日世界人工智能大会上发布日日新 5.5 大模型。官方没有透露关于日日新 5.5 大模型的更多信息，而此前有国内媒体报道称，商汤日日新大模型“近期”将迎来重大升级。在长文本处理能力上，升级后的商汤大模型将最新支持 100 万字以上超长文本，同时最多一次支持 50 多个

百图生科、智子引擎获新投资；Anthropic发布其最强大模型Claude3.5；Ilya创立安全超级智能公司丨AI情报局

融资快报百图生科获得港投公司的战略投资：百图生科由百度创始人李彦宏牵头发起，依托原BV百度风投生物智能团队及其50家全球被投企业的生态基础组建。计划投入上百亿元建设自主可控的生物计算平台，利用前沿算法、智能传感器、智能芯片、微纳机器人等AI能力解决生命科学问题。（IT桔子）智子引擎获得Pre-A轮投资：智子引擎是一家多模态大模型研究和开发商，发布了第一款应用级多模态ChatGPT产品“元乘象 ChatImg”。

德国研究团队发布新 AI 模型，可根据网球运动员肢体语言识别情绪

据 ScienceDaily17 日报道，德国卡尔斯鲁厄理工学院和杜伊斯堡-埃森大学研究人员借助计算机辅助神经网络，准确识别了网球运动员在比赛中的肢体语言所表达的情绪。团队首次利用实际比赛数据训练了这一基于 AI 的模型，研究成果登上了最新一期人工智能领域学术期刊《知识系统》。IT之家附链接：，两所学校的体育科学、软件开发与计算机科学研究人员开发了一种特殊的 AI 模型，利用卷积神经网络识别网球运动员的情感状态，并使用模式识别程序分析了实际比赛中网球运动员的视频。卡尔斯鲁厄理工学院体育与运动科学研究所 Darko

“力压 GPT-4o 和 Gemini 1.5 Pro”，Anthropic 推出 Claude 3.5 Sonnet AI 模型

Anthropic 今天（6 月 21 日）推出了 Claude 3.5 Sonnet，这是 Claude 3.5 系列的首个模型版本，在各项评估中优于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。Claude 3.5 Sonnet 在前代的基础上迭代升级，性能更快，编码、视觉和自然语言理解能力更强。Claude 3.5 Sonnet 属于中等尺寸模型，介于小型 Haiku 和高端 Opus 之间，但 Anthropic 声称，根据内部基准测试，Sonnet 的性能甚至超过了顶级 Opu

有望不再建议往披萨里加胶水？数据显示谷歌已降低 Reddit 对 AI 搜索结果的影响

今年的谷歌 I / O 大会上，谷歌推出了“重磅功能”—— 基于 AI 的搜索（AI 摘要 / AI Overviews）。然而在此功能上线后不久，不少用户反馈称 AI 会生成一些奇怪的结果，例如往披萨里加胶水防止配料掉落、每天吃几块小石头等等。据悉，部分奇怪回复是 AI 系统从 Reddit 帖子中提取信息而造成的，例如往披萨里加胶水就来自一个 11 年前的 Reddit 帖子。根据搜索引擎优化平台 SERanking 当地时间 20 日公布的数据显示，Reddit 已经不再是谷歌“AI 摘要”功能信息来源的前十

ComfyUI 插件竟然包含病毒！做好这 5 点降低中招风险

大家好，这里是和你们一起探索 AI 的花生~ ComfyUI 是目前最受欢迎的开源 AI 绘画绘画工具之一，它具有极高的灵活性，只需安装对应的插件就可以自己搭建工作流，实现个性化出图或体验最新的 AI 模型。如果你是 ComfyUI 的深度用户，那么安装各类插件肯定是家常便饭了，不过最近出现的一起 ComfyUI 插件包含恶意病毒的事件，却让我们看到了开源社区自由繁荣背后的另一面，如果不提高防范意识，下一个受害的很可能就是我们自己。相关推荐：一、病毒插件 ComfyUI_LLMVISION 事情的起因是网友 @_

AI 时代做 UX 个性化，没人会告诉你这些事情

编者按：这篇文章来自 Google Flights 的 UX 研究负责人 Slava Polonski ，他也是 Google's People AI Guidebook 的研究员。他拥有牛津大学博士学位，曾入选福布斯 30 Under 30 榜单。他是世界经济论坛专家网络和世界经济论坛全球塑造者社区的活跃成员。他撰写的文章涉及用户体验、社会科学和技术的交叉领域。作为一个横跨 UX 和 AI 两大领域的资深研究者，他撰写了这篇文章，不仅深入剖析了 UX 领域个性化问题的本质，而且也指出了 AI 时代 UX 领域前进

OpenAI 竞争对手 Anthropic 发布其最强 AI 大模型 Claude 3.5

感谢IT之家网友 VrianCao、Diixx、我抢了台的线索投递！OpenAI 竞争对手 Anthropic 周四发布了其迄今为止最强大的 AI 模型 Claude 3.5 Sonnet。与 OpenAI 的 ChatGPT 和谷歌 Gemini 一样，Claude 在过去的一年里也是人气爆棚。Anthropic 由 OpenAI 前研发高管创立，赢得了谷歌、Salesforce 和亚马逊的支持。在过去的一年里，Anthropic 完成了五笔融资，总额约为 73 亿美元。今年 3 月，Anthropic 推出了

北京市首例“AI 换脸”软件侵权案宣判：国风博主短视频被“换脸”后制作成付费模板

据北京互联网法院消息，6 月 20 日，北京互联网法院一审开庭宣判了两起北京市首例“AI 换脸”软件侵权案件，认定使用他人视频“换脸”后制作模板再提供“换脸”服务的网络服务提供者侵害了他人的个人信息权益。两案原告廖某、吴某均系国风短视频模特，在全网拥有众多粉丝。被告是一款“换脸”App 的运营者。原告主张，在未经其授权同意的情况下，被告使用原告的出镜视频制作换脸模板，并上传至涉案换脸 App 中，提供给用户付费使用借此牟利。原告认为，被告的行为侵害了原告的肖像权。同时，被告未经原告同意擅自上传和使用了具有原告肖像信

AMD 发布 ROCm 6.1.3，支持 RX 7900 GRE 显卡及 TensorFlow

AMD 正式推出了最新的 ROCm（Radeon Open Compute）平台，宣布支持多 GPU 集群，例如双 RX 7900XTX 或 W7900 显卡、2 张或 4 张 PRO W7900 双槽工作站显卡。除此之外，ROCm 还支持了更多 RDNA3 显卡，包括 Radeon RX 7900 GRE，以及本月新推出的 PRO W7900 双槽工作站显卡，后者定价 3499 美元（IT之家备注：当前约 25433 元人民币）。除此之外，新版 ROCm 最重要的一点还在于增加了对 WSL 2 （Windows

吊打阿里EMO？让马斯克唱Rap、奥特曼说脱口秀的AI神器出圈，人人免费可用

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。最近，AI 圈刮起一股「让照片开口唱歌」的风潮。例如，让霉霉唱碧昂丝《Halo》的 Hallo、斯坦福创业团队的 Proteus、以及之前阿里出品的 EMO。就在昨天，又有一家名为 Hedra 的公司前来踢馆，推出了基础模型 ——

前百度高管景鲲创立Genspark获4.35亿融资；CuspAI获3000万美元融资；Hinton担任董事会顾问丨AI情报局

情报局直击CVPR2024 超 1.2 万人参加 CVPR 2024，谷歌研究院获得最佳论文： 2024 年的 CVPR 会议在美国西雅图举办，成为了该会议历史上最大规模和最多参与人数的一届，共有 1.2 万人参与。本届会议共有 35691 位注册作者，提交了 11532 篇论文，其中 2719 篇论文被接收，录用率为 23.6%。与去年相比，论文数量增加了 20.6%，但录用率略有下降。

AI 新研究可用手机检测中风：准确率达 82%，分析面部肌肉运动

来自皇家墨尔本大学（RMIT）生物医学工程师团和圣保罗州立大学的博士生 Guilherme Camargo de Oliveira 共同开发了一款基于 AI 的面部筛查工具，医护人员只需要借助智能手机，在几秒钟内就可以确定患者是否中风。▲ 博士生 Guilherme Camargo de Oliveira 与 RMIT 大学客座副教授 Nemuel Daniel Pah（画面中人物）展示了面部筛查工具该工具在检测中风方面的准确率达到了 82%，但不会取代中风的综合临床诊断测试，仅用于帮助更快地识别需要治疗的人。RM

代码大模型安全规范正式定稿：百度阿里小米 vivo 等参与，中国信通院启动首轮评估

近年来，代码大模型已成为企业研发人员辅助编程必备助手，能够生成、翻译、补全代码，帮助定位和修复错误。然而，代码大模型背后隐藏的风险挑战还有待讨论。中国信息通信研究院（以下简称“中国信通院”）依托中国人工智能产业发展联盟（AIIA），联合业内近 30 家单位共同编制了《代码大模型安全风险防范能力要求及评估方法》规范（简称“规范”），聚焦代码大模型的安全能力，从基础功能出发，评估代码大模型的基础能力和安全风险防范能力。2024 年 6 月 18 日，规范第三次研讨会成功举办，对规范内容做出进一步的完善和修订，现已完成定

登Nature，超越GPT-4V，MIT、哈佛开发人类病理学多模态AI「副驾驶」

编辑 | KX多年来，计算病理学领域在基于图像、基因组学数据开发越来越准确、针对特定任务的预测模型方面取得了显著进步。然而，尽管生成式人工智能 (AI) 呈爆炸式增长，但在构建针对病理学的通用、多模态 AI 助手和「副驾驶」（Copilot）方面的研究却有限。近日，哈佛大学和 MIT 的研究团队提出了一种用于人类病理学的视觉语言通才 AI 助手：PathChat。研究人员将 PathChat 与几种多模态视觉语言 AI 助手和 GPT-4V 进行了比较。PathChat 在来自不同组织来源和疾病模型的病例的多项选择