资讯列表

海报素材不用愁!10 组高质量数字专题 Midjourney 提示词

大家好,这里是和你们一起探索 AI 绘画的花生~ 之前为大家系统讲解了如何在 Midjourney 中生成一套完整的数字,今天继续为大家推荐 10 组不同风格材质的数字主题 Midjourney 提示词,生成的图片可以当做海报主视觉或者装饰元素使用~ 上期回顾:一、油漆材质 Number 6, composed of colored paint, dynamic splash, floating on pure white background, minimalist, 3D rendering --v 6.0 数

拿下微软合作、旗舰模型对标GPT-4,认识一下「欧洲版 OpenAI」

机器之能报道编辑:SiaMistral 目前法国科技界的骄傲和喜悦,也是开源力量的代表。它的初期成功要归功于能巧妙地将AI技术与政治结合起来。问题是Mistral能否将这种诱人的技术与政治混合优势转化为实实在在的利润。这家法国 AI 初创的崛起就像西北风一样轻快,这也是它名字 Mistral 的由来。Mistral 翻译过来是密史脱拉风,法国南部罗纳河谷一带特有的强风,干寒强烈,持续时间长。据说,梵高和高更的决裂也与普罗旺斯刮起的密史脱拉风有关。Mistral位于巴黎的办公室,它们也是法国目前最有前途的大模型初创公

基于神经网络的偏微分方程求解器新突破:北大&字节研究成果入选Nature子刊

近年来,基于神经网络的偏微分方程求解器在各领域均得到了广泛关注。其中,量子变分蒙特卡洛方法(NNVMC)在量子化学领域异军突起,对于一系列问题的解决展现出超越传统方法的精确度 [1, 2, 3, 4]。北京大学与字节跳动研究部门 ByteDance Research 联合开发的计算框架 Forward Laplacian 创新地利用 Laplace 算子前向传播计算,为 NNVMC 领域提供了十倍的加速,从而大幅降低计算成本,达成该领域多项 State of the Art,同时也助力该领域向更多的科学难题发起冲击

让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了

有了阿里的 EMO,AI 生成或真实的图像「动起来说话或唱歌」变得更容易了。最近,以 OpenAI Sora 为代表的文生视频模型又火了起来。而除了文本生成视频之外,以人为中心的视频合成也一直是研究的焦点,比如专注于说话人头部(Talking Head)的视频生成,它的目标是根据用户提供的音频片段来生成面部表情。从技术上来看,生成表情需要捕获说话人微妙和多样化的面部动作,由此对此类视频合成任务提出了重大挑战。传统方法通常会对最终的视频输出施加限制,以简化任务。比如,一些方法使用 3D 模型来限制面部关键点, 另一些

微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41

革命性的提升来了。把大模型的权重统统改成三元表示,速度和效率的提升让人害怕。今天凌晨,由微软、国科大等机构提交的一篇论文在 AI 圈里被人们争相转阅。该研究提出了一种 1-bit 大模型,实现效果让人只想说两个字:震惊。如果该论文的方法可以广泛使用,这可能是生成式 AI 的新时代。对此,已经有人在畅想 1-bit 大模型的适用场景,看起来很适合物联网,这在以前是不可想象的。人们还发现,这个提升速度不是线性的 —— 而是,模型越大,这么做带来的提升就越大。还有这种好事?看起来英伟达要掂量掂量了。近年来,大语言模型(L

LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训

LLaMa 3 正寻找安全与可用性的新平衡点。过去的图像生成模型常被人们诟病人物主要以「白人」为主,而谷歌 Gemini 正在因为它的矫枉过正而深陷翻车风波。它「过度谨慎」的文生图结果会与历史事实出现极大偏差,让用户们瞠目结舌。谷歌表示,该模型变得比开发者预期的更加谨慎。这不仅体现在生成图片的问题上,还体现在常常将一些提示认作敏感提示,从而拒绝回答。在此事不断发酵时,这项安全与可用性如何平衡的难题也给 Meta 提出了巨大挑战。LLaMA 2 是开源领域的「强中手」,更是 Meta 的招牌模型,一经发布即改变了大模

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

作为 2024 开年王炸,Sora 的出现树立了一个全新的追赶目标,每个文生视频的研究者都想在最短的时间内复现 Sora 的效果。根据 OpenAI 披露的技术报告,Sora 的核心技术点之一是将视觉数据转化为 patch 的统一表征形式,并通过 Transformer 和扩散模型结合,展现了卓越的扩展(scale)特性。在报告公布后,Sora 核心研发成员 William Peebles 和纽约大学计算机科学助理教授谢赛宁合著的论文《Scalable Diffusion Models with Transform

ICLR 2024 Spotlight|厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型

图像匹配是计算机视觉的一项基础任务,其目标在于估计两张图像之间的像素对应关系。图像匹配是众多视觉应用如三维重建、视觉定位和神经渲染 (neural rendering) 等的基础和前置步骤,其精确度和效率对于后续处理十分重要。传统算法(SIFT)在面临长基线或极端天气等复杂场景时,其匹配的准确度和密度往往有限。为了解决这些问题,近年来,基于深度学习的匹配模型逐渐流行。然而,由于缺乏大规模且多样化的具有真值标签的训练数据,目前的匹配模型通常是在 ScanNet 和 MegaDepth 上分别训练室内和室外两个模型。这

2024国际自动驾驶挑战赛正式开始

新赛题:七大赛道,赛题新颖,全方位覆盖相关领域最新最热话题,充分挖掘大模型在自动驾驶及具身智能垂直领域中的应用。高奖金:总奖金池超过12万美金,单赛道最高奖金可达2.7万美金。据不完全统计,奖金额度在CVPR 2024百个论坛中最高。重原创:加强基础研究探索,坚持四个面向。以原创性与科学研究价值作为主要衡量指标,并不单靠成绩排名。采取原创方案加性能指标两者结合的方式进行综合排序。2024年3月1号,2024国际自动驾驶挑战赛正式启动。本次挑战赛由上海人工智能实验室主办,并联合多家国内外机构共同举办。多位国内外知名专

火山引擎弹性容器实例:从节点中心转型 Serverless 化架构的利器

在 Kubernetes 和容器化技术愈发成熟的今日,越来越多企业开始将业务应用迁移到云上,采用云原生架构支持业务高速稳定地发展。而随着云计算向开发流程纵深发展,Serverless 架构的成熟让云原生技术进入全新阶段——Serverless 把公有云弹性伸缩、免运维、快速接入等特性发挥到了极致,极大降低了用户的使用成本,让用户和企业只需要专注于其业务逻辑,实现真正意义上的敏捷开发。为了更好帮助企业业务应用真正践行 Serverless 化的新型云原生思想,火山引擎云原生团队正在从理念、系统设计、架构设计等多方面推

SDXL-Lightning 来啦!让AI出图速度提升 10 倍!

大家好,这里是和你们一起探索 AI 绘画的花生~ AI 绘画自出现以来一直在不断发展,最明显的体现就是图像生成质量越来越高,还有很重要的一点就是出图速度的提升。比如之前为大家介绍过的 LCM 和 SDXL Turbo,仅用 1-4 步就能完成图像推理,使模型出图速度比之前快了 8-10 倍 。最近,字节又推出了一个新的模型 SDXL-Lightning,它同样能在几秒之内就生成 1024px 的图像, 且出图质量比 LCM 和 Turbo 都要好,今天就为大家介绍一下 Lightning 的功能和用法。 相关推荐:

知名AI研究者深挖谷歌Gemma:参数不止70亿,设计原则很独特

想要了解谷歌 Gemma 与 Llama 2、Mistral 有哪些异同吗?这篇文章值得一读。就在几天前,开源大模型领域迎来了重磅新玩家:谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini,Gemma 更加轻量,同时保持免费可用,模型权重也一并开源了,且允许商用。谷歌发布了包含两种权重规模的模型:Gemma 2B 和 Gemma 7B。尽管体量较小,但 Gemma 已经「在关键基准测试中明显超越了更大的模型」,包括 Llama-2 7B 和 13B,以及风头正劲的 Mistral 7B。与此同时,关于

反转?OpenAI:纽约时报「黑客攻击」了ChatGPT,要求驳回版权诉讼

去年年底,《纽约时报》向微软和 OpenAI 提起侵犯版权诉讼,指控其违规使用了《纽约时报》的内容来进行人工智能开发。在这份起诉书中,《纽约时报》列出了 GPT-4 输出「抄袭」《纽约时报》的「证据」,GPT-4 的许多回答与《纽约时报》的报道段落几乎完全一致:《纽约时报》指责 OpenAI 和微软试图「搭《纽约时报》对其新闻业的巨额投资的便车」,并创建报纸的替代品。彼时,《纽约时报》发言人在一份电子邮件声明中表示:「如果微软和 OpenAI 想要将我们的作品用于商业目的,法律要求他们首先要获得我们的许可,但他们没

苹果10年造车梦「夭折」,数十亿美元打水漂,特斯拉或成最大赢家

这下子,苹果再也不用频繁变更汽车的预计发布时间了。终于,近 3 万亿美元市值的苹果在电动汽车这个赛道「折戟沉沙」,成了正在消亡的车企大军中的一员。                             图源:appsystem今天凌晨,据彭博社等多家外媒报道,苹果公司高管在与造车团队的内部会议上宣布正式放弃名为「Project Titan」泰坦计划,由此宣告了苹果努力十年、耗资数十亿美元的电动汽车梦破碎。苹果首席运营官 Jeff Williams 和负责汽车项目的副总裁 Kevin Lynch 向员工通报了造车项

数量即力量!腾讯揭秘:Agent数量越多,大语言模型效果越好

来自腾讯的研究者们做了一个关于 agent 的scaling property(可拓展性)的工作。发现:通过简单的采样投票,大语言模型(LLM)的性能,会随着实例化agent数量的增加而增强。其第一次在广泛的场景下验证了该现象的普遍性,与其他复杂方法的正交性,以及研究了其背后的原因,并提出进一步促成scaling发挥威力的办法。论文标题:More Agents Is All You Need论文地址::,来自腾讯的研究者发现:只需通过一种简单的采样投票法,大语言模型的性能就会随着实例化 agent 的数量的增大而增

AI 让公益事半功倍,第四届 Light・技术公益创造营开幕

社会的痛点就是公益的起点。

苹果汽车,虽死犹生

机器之能报道编辑:吴昕马斯克曾开玩笑说苹果是特斯拉的墓地,现在看来,结果恰好相反。就在国内新能源汽车理想实现历史最佳业绩、小米新车即将亮相之际,另一则在苹果公司内部披露的消息震惊了近 2000 名员工。研究近十年后,苹果取消了其最为神秘的电动汽车项目。彭博社消息称,该公司将缩减电动汽车团队规模,一些苹果员工可能会转到生成 AI 团队。此举是由苹果 COO Jeff Williams 和副总裁 Kevin Lynch 宣布的,他们自 2021 年以来一直领导汽车项目。马斯克曾打算把特斯拉卖给苹果。他也有句名言,“我们

AlphaFold 预测细菌生存所需的 1402 种蛋白互作,最完整的细菌必需相互作用图谱

革兰氏阴性必需相互作用组。(来源:eLife)编辑 | 紫罗细菌蛋白质组平均由约 4000-5000 个蛋白质组成,这意味着相互作用组可能多达 2000 万个相互作用。据估计,大肠杆菌中大约有 12,000 种物理相互作用。然而,并非所有这些相互作用都对细菌的生存至关重要。对生物体中蛋白质相互作用的研究,是理解生物过程和中心代谢途径的基础。然而,我们对细菌相互作用组的了解仍然有限。近日,西班牙巴塞罗那自治大学(Universitat Autònoma de Barcelona,UAB)的研究人员使用人工智能工具 A