应用
小米 Redmi Turbo 3 手机支持 AI 隔空手势与 AI 魔法消除 Pro
感谢小米 Redmi Turbo 3 手机将于 4 月 10 日 19 点发布,搭载高通骁龙 8s Gen 3 芯片。今日,小米官方对这款新机的 AI 功能进行预热。据介绍,Redmi Turbo 3 支持 AI 隔空手势,基于高通骁龙 8s Gen 3 芯片的旗舰 AI 技术,搭配全新升级的 AON 前置摄像头 实现 24 小时智能感知,实时响应用户操作。小米宣传其为“同档绝无仅有的 AI 实力”。根据网上流传的设置界面信息,隔空手势 Beta 版需要手在距离摄像头 15~40 厘米处稍作停留,待屏幕上方出现手型
马斯克预测 AI 在两年内能超越最聪明的人类
感谢特斯拉 CEO 埃隆・马斯克(Elon Musk)周一预测,AI 在明年或 2026 年就能超越最聪明的人类。马斯克当地时间周一在社交媒体平台 X(以前称为推特)语音空间上接受了挪威主权财富基金首席执行官 Nicolai Tangen 的采访。当被问及 AGI(通用人工智能)的发展时间表时,马斯克表示,如果你将 AGI 定义为比最聪明的人更聪明,我想可能是明年,或者两年内。AGI 为 Artificial General Intelligence 的首字母缩写,意为人工通用智能。通用人工智能是一个人工智能理论研
英特尔展示多模块芯片预热 Vision 2024 活动,预计为 Gaudi 3 人工智能加速器
英特尔官方账户近日在 X 平台晒出一段包含“至少十个”模块的复合芯片近照短视频,为北京时间今日 23:30 开幕的 Vision 2024 活动进行预热。根据该动态下方消息人士 Bionic_Squash 和 Raichu 的回复,以及同IT之家以往报道中概念图的对比,图中芯片基本确认为英特尔 Gaudi 3 人工智能加速器。▲ 此前报道中出现的 Gaudi 3 概念图视频显示,Gaudi 3 芯片整体包含 10 个主要模块,包含 2 个用短边相连的计算模块和 8 个内存堆栈(HBM 模块)。英特尔此前表示 Gau
特斯联完成20亿元D轮融资,推领域大模型,促AGI落地
今日,人工智能物联网(AIoT)企业特斯联宣布完成 D 轮 20 亿人民币融资交割。本轮融资由国际著名投资机构 AL Capital 与国内产业基金阳明股权投资基金共同领投,国家发改委旗下投资平台、福田资本、金地集团、重科控股、数字重庆、南昌政府平台公司、徐州产业基金、北科建集团、光大控股、商汤科技等新老股东一同跟投。据介绍,所募资金将用于完善具有多模态能力的领域大模型在园区、企业、经济、能源等多场景的应用,打造高灵活度、高性能的智算基础设施,构建技术壁垒,进一步在人工智能物联网领域的国际竞争格局中形成产业化、集群
仅次于 Meta,马斯克透露特斯拉囤积的英伟达 H100 芯片数量
埃隆・马斯克麾下的特斯拉和其神秘的以人工智能为核心的公司 xAI,储备了大量的英伟达 H100 系列芯片。特斯拉意欲借此攻克自动驾驶的终极难题 ——L5 级自动驾驶,而 xAI 则肩负着实现马斯克的“终极真相人工智能”愿景。X 平台用户“The Technology Brother”最近发布消息称,Meta 公司已经囤积了全球最多的 H100 GPU,数量达到惊人的 35 万块。然而,马斯克对该排行榜将特斯拉和 xAI 的排名边缘化表示不满(1 万颗),并指出“如果计算正确,特斯拉应该是第二名,xAI 将是第三名”
第二波!2024年4月精选实用设计工具合集
大家好,这是 2024 年 4 月的第 2 波干货合集!这一期干货合集当中,包含了 3 款 AI 工具,分别是生成网页的配色和字体排版样式的 AI 工具,专门生成产品包装设计的 AI 工具,生成 UI 界面的 AI 工具,显而易见都是好东西。另外还推荐了 3 个各有偏向的资源和设计推荐网站,它们都搜集整理了大量有用的 AI 工具和设计资源以及优秀设计。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、 基于 AI 的配色方案生成工具
UI/UX 设计师和前端的在线工具,它
实战案例!如何用 ComfyUI 给模特换服装?
一、前言
当你从优设这么多高含金量的内容里面找到这我这篇,我相信你肯定不是单纯的为了工作,很好!
技术的迭代其核心驱动一定是兴趣,而不仅仅是为了去打工!
在工作之余,给你身边的小姐姐,小哥哥们提供适当的情绪价值,回报一定会超乎你的想象。
当然,今天分享的,纯粹是技术实现路径,审美这块,我相信你肯定比我强。(在多年的甲方教育下,审美已经不存在了)
闲话就说到这里,开整!二、模特换服装和场景
1. 不一样的摄影需求
为什么要做这个事?
在学习开始之前,整明白这个事,可以很好的帮你做好心理建设,拉高你的预期,
这样在遇到
亚马逊云科技展示Claude 3大模型能力,生成式AI落地正在加速
上周日,亚马逊云科技宣布 Mistral AI 的 Mistral Large 模型在Amazon Bedrock上正式可用。随着知名 AI 初创公司 Mistral AI、Anthropic 的前沿的大语言模型(LLM)陆续登陆 Amazon Bedrock,人们在构建生成式 AI 应用程序时,已经有了一系列先进模型的选择。
大模型生产力的头场变革,从英特尔商用 AI PC 说起
作者丨郭思编辑丨陈彩娴「水利万物而不争。 」这是英特尔公司高级副总裁、英特尔中国区董事长王锐女士常说的一句话,看似没有压迫性,却切实点出了英特尔作为 AI PC 概念提出者,这场大语言模型技术革命中的思路。 在2024 年 3 月 26 日,英特尔商用 AI PC 新品发布会上,我们也确切地看到了英特尔致力于让AI无处不在的种种举措。
AI在用| Midjourney+一个提示咒语,广告摄影师可以躺平了
机器之能报道编辑:Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。无论是打开餐厅菜单、翻开一本杂志,还是点咖啡时瞟一眼上新,我们都会看到很多质感精致,极富视觉冲击力的广告图片。人工拍摄的专业广告图片为了让食物、化妆品、日用品等产品呈现出精致、极富吸引力的视觉效果,这类专业图片( 带有
千元级AI 模盒,云天励飞率先打响大模型「平民化」之战
从 Gemini、Lumiere、再到 Sora,“百模大战” 的 “战火” 延续至 2024 年。诸多的大模型已经诞生,接下来的任务是落地。但行业大模型在落地过程中,遇到的瓶颈就像是一座冰山,藏在冰山下面的问题,更加棘手。要做物理世界的解码者,为 “无形” 技术和 “有形” 世界构建通道,这是云天励飞的定位。如何构建 AI 落地的通道?2024 年,围绕 “自进化城市智能体” 的理念,云天励飞持续深耕 AI 市场,并且在 3 月发布 “深目” AI 模盒,为 AI 大模型落地长尾场景交上一份新答卷。AI 落地关键
超10秒高分辨率,北大Open Sora视频生成更强了,还支持华为芯片
北大团队联合兔展发起的 Sora 复现计划,现在有了新成果。OpenAI 在今年年初扔出一项重大研究,Sora 将视频生成带入一个新的高度,很多人表示,现在的 OpenAI 一出手就是王炸。然而,众多周知的是,OpenAI 一向并不 Open,关于 Sora 的更多细节我们无从得知。谁能率先发布类 Sora 研究成了一个热门话题。今年 3 月初,北大团队联合兔展启动了 Sora 复现计划 ——Open Sora Plan,该项目希望通过开源社区的力量复现 Sora。项目上线一个月,星标量已经达到 6.6k。项目地址
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源
最近,多模态大模型(LMM)取得了一系列引人注目的成就,特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态大模型在各个领域的实用性和灵活性,也为更多视觉场景下的应用探索了新的道路。尽管如此,在将 LMM 应用到计算机视觉任务上时,我们仍面临一个关键挑战:大多数 LMM 目前只限于文本输出,这限制了它们在处理更细粒度的视觉任务,如图像分割方面的能力。此外,图像分割领域内部的需求多样化,任务各异 —— 实例分割需为每个对象分配唯一 ID 并计算类别信赖度,指代分割(RES)则需要基于描述性语句来识别
CVPR 2024|FairCLIP:首个多模态医疗视觉语言大模型公平性研究
作者 | 哈佛大学、纽约大学团队编辑 | ScienceAI公平性在深度学习中是一个关键问题,尤其是在医疗领域,这些模型影响着诊断和治疗决策。尽管在仅限视觉领域已对公平性进行了研究,但由于缺乏用于研究公平性的医疗视觉-语言(VL)数据集,医疗VL模型的公平性仍未被探索。为了弥补这一研究空白,我们介绍了第一个公平的视觉-语言医疗数据集(FairVLMed),它提供了详细的人口统计属性、真实标签和临床笔记,以便深入检查VL基础模型中的公平性。使用FairVLMed,我们对两个广泛使用的VL模型(CLIP和BLIP2)进
加拿大政府公布人工智能领域一揽子预算,价值 24 亿加元
加拿大政府昨日公布了面向人工智能领域的一揽子措施,以确保该国在此领域的优势。这些措施将在加拿大政府本财年的预算中占到 24 亿加元(IT之家备注:当前约 127.92 亿元人民币)。具体而言,这部分 24 亿加元的预算将包含六大措施:投资 20 亿加元,为加拿大人工智能研究者和企业提供算力和基础设施,并促进主权人工智能发展;投资 2 亿加元,促进人工智能初创企业的技术商业化,加速人工智能在关键领域的应用;投资 1 亿加元,资助加拿大国家研究理事会的 IRAP AI Assist 项目,该项目通过部署人工智能解决方案
通义千问开源320亿参数模型,已实现7款大语言模型全开源
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实
效率翻倍!5 款不容错过的免费 AI 神器(三)
大家好,这里是你们一起探索 AI 的花生~
今天我们继续 AI 效率神器推荐第三期,内容包括 AI 实时绘画、AI 风格化头像、AI 高清放大工具等。
上期回顾:一、SunoMV
网址直达:
这段时间 AI 神器 Suno 爆火,想必很多小伙伴都体验过它强大的歌曲生成能力了。SunoMV 则是一个专门针对 Suno 推出的 MV 免费生成平台,用户只需提供自己的 Suno 歌曲链接,就能在几分钟内生成一个歌词同步,并且具有精美视觉效果的歌曲短片,非常方便我们在社交平台上展示推广自己的作品。
SunoMV 支持横屏
超详细!写给设计师的LoRa模型训练SOP
写在前面:
在推进 AIGC 技术在我们业务中的应用过程中,我发现许多同事,特别是设计师和跨部门协作的团队,对 LoRA 模型在图像生成中的真正价值理解还不够深入。我们似乎更多地停留在"别人在做,我也要做"的从众心态,而没有真正认识到 LoRA 模型的战略意义和变革潜力。
这种认知差距可能会导致我们在实践中走一些弯路,无法充分发挥 LoRA 模型的优势,也难以实现 AIGC 技术在业务中的最大化赋能。因此,我针对 LoRA 模型训练流程进行了系统梳理和优化,希望能给大家一些启发,帮助我们更好地理解和应用这一强大的工