应用

Adobe 售卖 AI 生成的“安塞尔・亚当斯风格”图片,惹怒摄影师遗产管理方

知名图片素材平台 Adobe Stock 因销售由人工智能 (AI) 生成、模仿已故摄影大师安塞尔・亚当斯 (Ansel Adams) 作品的图片而陷入舆论漩涡。上周五,亚当斯遗产管理委员会在社交媒体上发布了一张截图,显示 Adobe Stock 上有标注为“安塞尔・亚当斯风格”的 AI 生成图片,并公开指责 Adobe 公司这种行为“令人忍无可忍”。IT之家注意到,尽管允许在平台上发布和销售 AI 生成图片,但 Adobe Stock 的用户须拥有上传内容的相应权利或所有权,平台的“贡献者条款”明确禁止 “使用包

谁最美?全球首届 AI 选美大赛拉开帷幕:入围名单已公布,奖金 1.6 万英镑

根据英国《镜报》报道,全球首届 AI 模特小姐选美大赛 WAICAs 已经于上月拉开帷幕,总奖池达到 1.6 万英镑(IT之家备注:当前约 14.8 万元人民币),全球有超过 1500 个 AI 角色、1 万名 AI 团队成员参与。WAICAs 全称是未来派世界人工智能创造者大奖,由 Fanvue 主办,将会根据 AI 的现实性、影响力和技术性来评判人工智能的影响力。Fanvue 联合创始人威尔・莫南奇(Will Monange)解释说:该奖项显示了 AI 领域创作者的参与程度,入围名单的水准令人难以置信。我们估计

亚马逊推出“侦探”项目:AI 火眼金睛确保商品发货前无瑕疵

为了让顾客收到满意的商品,亚马逊祭出利器 ——“Project PI”(侦探项目)。这项结合生成式 AI 和计算机视觉技术的系统,能够在商品运送给顾客之前,就找出损坏、颜色错误或尺寸不对的产品。具体工作流程是这样的:即将送达的商品会通过一个装有扫描装置的隧道。计算机视觉程序 (一种能分析图像内容的 AI 技术) 会检查商品是否存在瑕疵。如果发现问题,系统就会将这件商品分离出来,并进行缺陷评估,同时检查是否有类似问题存在于其他批次商品中,以便追根溯源。据亚马逊介绍,Project PI 目前已在美国多个仓库投入使用,

OpenCV 4.10.0 版本更新发布,首次支持 Windows ARM64、苹果 VisionOS

OpenCV 是一款跨平台的计算机视觉和机器学习软件平台,在计算机视觉领域广泛使用,是目前人工智能应用中的重要基础平台。OpenCV 4.10.0 版本更新于昨日发布(点此查看),对其深度神经网络(DNN) 模块进行了许多改进、实验性 NumPy 2.0 支持、Android 改进、NVIDIA CUDA 12.4 平台支持、RISC-V 和 ARM 改进、oneAPI 2024 支持、实验性 Windows ARM64 支持、实验性苹果 VisionOS 支持,以及 Linux 上的本机 Wayland 后端。

手把手教程!5步搞定超热门的AI字体海报设计

大家好,这里是和你们一起探索 AI 的花生~ 最近在小红书上看到了很多非常好看的 AI 字体海报,基本做法就是在 Stable Diffusion 中通过 Lora 风格模型 Controlnet 外形控制直接生成带字体的场景插画,加上排版就成了一张完整的字体海报,效果非常惊艳。我自己也尝试了一下发现制作方法并不难,而且可以灵活更换字体和模型获得不同的效果,出图效率很高。今天就以端午节主题海报为例,为大家详细介绍一下如何在 Stable Diffusion WebUI 制作这种字体海报。 :一、准备图片素材 由于

保姆级教程!手把手教你用AIGC快速设计端午运营图

本文以实例深入解析 AIGC 端午运营图设计,提供全面指南,涵盖通用型、IP 融合型、业务融合型三类,所用品牌 IP 仅供示例交流,无任何商业意图。 更多端午AI海报设计:前言 端午前夕,粽香隐隐,龙舟鼓点遥遥,期待如江水满涨。品牌们已蓄势,欲以创意海报提前唤醒节日的温馨与深意。 在不同设计目标和品牌关联深度的层次下,我认为节日海报设计可归纳为三大类:通用型:适用于广泛场合,侧重于传达基本的节日祝福和氛围,不特别强调特定品牌或业务。 业务融合型:巧妙结合品牌业务或产品与节日元素,有力地推动品牌认知与市场互动。 IP

Zoom 创始人谈视频会议未来:数字人“代劳”参会,本人可抽出时间陪伴家人

视频会议平台 Zoom 创始人袁征(Eric Yuan)日前接受外媒 The Verge 采访,谈到了视频会议这一新兴会议形式的未来发展。袁征先前在思科工作,后续创办了 Zoom,并意识到有机会使视频会议更加简单易用。而在当下,袁征希望 Zoom“不仅仅”是一个视频会议平台,而是在企业软件领域与微软、谷歌一较高下,力图把文档、邮件和其他生产力工具做得像“聊天平台”一样。现如今各行各业都在拥抱 AI,Zoom 也不例外,并在 AI 领域投入了巨资。袁征表示,AI 在工作中的一大好处,就是所有人都能创造一个“数字孪生”

Nature重磅:微软潘海峰华盛顿大学王晟团队发布首个全切片数字病理学模型GigaPath

编辑 | ScienceAI近年来,数字病理学的蓬勃发展成为了精准医学加速突破的重要组成部分。在癌症护理过程中,利用全切片成像技术将肿瘤组织样本转换为高分辨率的数字图像,已经成为常规技术。高达十亿像素级别的病理学图片包含多样的肿瘤微环境信息,为癌症分型诊断,生存率分析以及精准免疫治疗提供了前所未有的契机。近期,生成式人工智能革命为准确感知、分析病理学图片中的海量信息提供了强有力的解决方案。与此同时,多模态生成式人工智能技术的突破更将助力从时空多尺度理解数字病理学图片并与其他生物医学模态相融合,从而更好刻画患者疾病演

AI 在用 | 我们用Suno V3.5,打造出「另类」汪峰

机器之能报道编辑:山茶花以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。   我们也欢迎读者投稿亲自实践的创新型用例。AI 音乐创作神器 Suno V3.5,向公众免!费!开!放!了!一周前,Suno 不声不响地上线了 Suno V3.5,一开始还只是向付费会员开放,但 5 天后,Suno 大笔一挥,对所有用户都免费开放。据 Suno 官方称,

谷歌:在新加坡的技术基础设施投资已达 50 亿美元

据路透社报道,谷歌今日宣布,其在新加坡的数据中心和云设施扩建工程现已竣工,这意味着该公司在新加坡的技术基础设施投资总额已达到 50 亿美元。谷歌方面表示,其在新加坡的数据中心雇用了 500 多名员工,负责谷歌搜索和地图等服务。上周,谷歌表示将在马来西亚投资 20 亿美元 ,在该国开发首个数据中心。目前谷歌已经在 11 个国家和地区建立并运营了数据中心,为全球用户提供服务。据IT之家此前报道,谷歌近期宣布在马来西亚投资 20 亿美元,投资项目包括建设首座数据中心、新的谷歌云区域以及进一步开发人工智能等。此外,亚马逊

马斯克称将为 xAI 购买约 30 万块英伟达 AI 芯片,预估至少花费 90 亿美元

马斯克北京时间今天凌晨在回复一则投票时透露,xAI 的下一项重大举措可能是在明年夏天购买约 30 万块配备 CX8 网络的 B200 芯片。xAI 已在近期获得了 60 亿美元(IT之家备注:当前约 435.6 亿元人民币)融资,公司估值达到约 180 亿美元(当前约 1306.8 亿元人民币)。目前,xAI 计划通过加大对 GPU 集群的投资,大幅扩展其 AI 相关的产品组合。今年 4 月,X 平台(推特)博主“The Technology Brother”曾发帖表示,Meta 公司目前已经拥有约 35 万个 H

清北爸爸李永乐都搞不定的事情,这个隐身的大模型在发起挑战

最近有个热点新闻 ——「清北毕业爸爸辅导孩子数学也抓狂」。点开一看,新闻主角居然是李永乐老师。要知道,李永乐老师本科北大、研究生清华,现在还是人大附中的物理老师和知名的科普博主。如果连他都辅导不了自己的孩子,普通家长该有多崩溃。正所谓「不写作业,母(父)慈子孝;一写作业,鸡飞狗跳」。在辅导孩子这件事情上,似乎没有多少家庭能做到心平气和。巧的是,就在同一天,一个 AI 辅导孩子的视频也吸引了很多家长的注意。视频讲的是一位父亲在大模型的帮助下与女儿共同检查数学试卷。其间,大模型通过一问一答的方式,引导孩子独立思考,一步

斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库

斯坦福 Llama3-V vs 清华 MiniCPM-Llama3-V-2.5在 GPT-4o 出世后,Llama3 的风头被狠狠盖过。GPT-4o 在图像识别、语音理解上卓越的性能展现了它强大多模态能力。开源领域的领头羊 Llama3 曾在几乎所有基准测试中都超越了 GPT-3.5,甚至在某些方面超越了 GPT-4。这次就要闷声「吃瘪」了吗?5 月 29 日,一个来自斯坦福的研究团队发布了一个能够「改变现状」的产品:Llama3-V,号称只要 500 美元(约为人民币 3650 元),就能基于 Llama3 训练

全球最强GPU芯片已量产、下一代Rubin曝光,老黄继续打破摩尔定律

黄仁勋:我家的 GPU 芯片一年一更新,其他家怎么追?昨晚,英伟达创始人、CEO 黄仁勋在 2024 年 COMPUTEX 科技大会上又为全球发烧友们、显卡买家们带来了一场重磅演讲。                               经典皮肤(皮衣)老黄亮相。在会上,黄仁勋分享了有关 AI 芯片及架构、加速计算、AI 理解物理世界、机器人的成果和洞见。量产版 Blackwell 亮相下一代 AI 平台 Rubin 两年后到来今年 3 月,英伟达在其一年一度的 GTC 大会上官宣了 2080 亿晶体管的 B

物理传热启发的视觉表征模型vHeat来了,尝试突破注意力机制,兼具低复杂度、全局感受野

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文作者为VMamba的原班人马,其中第一作者王兆植是中国科学院大学和鹏城实验室的2022级联合培养博士生,共同一作刘悦是中国科学院大学2021级直博生。他们的主要研究方向是视觉模型设计和

澳大利亚拟颁布新法律:制作、传播深度伪造色情内容者将被判刑

据《卫报》报道,将在本周提交至澳大利亚联邦议会审议的一项新法律规定,若民众分享经由“数字篡改”的深度伪造色情内容,将会被处以 6 年监禁,制作这些内容的人则将被处以 7 年监禁。据报道,澳大利亚总检察长马克・德雷福斯预计将在本周三提出立法,将“在未经同意的情况下,分享利用 AI 或其他技术手段制作的露骨内容”这一行为定性为新的刑事犯罪。若这项新法律生效,就意味着无论是在私人或公开平台、无论与个人还是与大众分享这些内容,都将是非法行为。德雷福斯在周六宣布新立法时表示,政府不会容忍这种“阴险的犯罪行为”。“未经同意而分

上海交大卢策吾:具身智能与他的首个刮胡子机器人 | 智者访谈

查阅历史资料后表明,上海交通大学的卢策吾教授是世界上第一个被机器人用刀片刮胡子的人。视频展示了上海交通大学卢策吾教授亲自体验其团队研发成果的过程——在一个具身智能大模型操控下,机械臂完成了刮胡子的动作。机器人给人刮胡子,看似简单,实则蕴含巨大挑战,除了行为泛化性,更重要的是需要极致鲁棒性。可以看到,当卢教授的头部移动时,这个嵌入了高精度力反馈模块的具身智能大模型能够瞬时决策压力和切向力的变化,既把胡须刮干净,又不会伤到他。如果大模型仅通过视觉判定轨迹输出,将难以完成任务。这也无法通过遥操作实现。在大模型风靡的 20

多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」

最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征,从而成功地生成多种模态(如音频、图像或状态 - 动作序列)的新序列,从文本、蛋白质、音频到图像,甚至是状态序列。能够同时生成多种模态输出的多模态模型一般是通过某种形式的词汇扩展(将多模态表征转换为离散 token 并添加到模型的基本词汇表中)来实现的,即在预训练阶段或在后期微调阶段进行跨模态对齐。多模态预训练方法具有很强的性能优势(例如,一个模型可以原生理解多种模态),但也有缺点。例如,无法解决如何在预训练后添加新模态的问