资讯列表

ML Blocks!全新的节点式 AI 图像处理神器

大家好,我是花生~ 之前为大家介绍过不少 AI 图像处理神器,比如 Clipdrop、Pixian、Upscayl 等,可以帮我们便捷地完成抠图、修图、高清放大等任务。最近又发现了一个新的 AI 图像处理工具 ML Blocks,非常有意思,今天推荐给大家~ 相关推荐:ML Blocks 官网直达: 官方教程: 与我们常用的图像处理工具不同,ML Blocks 的工作界面是一块白板,它的各种图像处理功能则被分为一个个独立的模块,当我们想实现某种图像处理效果时,可以自己将对应的模块连接到一起形成的工作流(work

俄罗斯小哥ChatGPT找女友:聊了5239个女生,现在订婚了

有事 AI 它是真上啊。「我向一位女生求婚,ChatGPT 已经和她交流了一年。为了走到这一步,AI 已经尝试了和 5239 名女生进行过沟通……」                              来源:,社交网络上人们正在轮番向一位俄罗斯小哥送去祝福。23 岁的 Aleksandr Zhadan 是一名 AI 开发者,也是社交平台 TenChat 的一名产品经理。故事是这样开始的:GPT 除了搜索之外,还可以在配对后写入。这样在 50 次自动执行中,他可以获得 18 次配对。GPT 在没有 Aleksa

徒手搬汽车配件,波士顿动力Atlas再进化:兄弟们,准备进厂了

在如今颇为火热的人形机器人赛道,波士顿动力是较早入局的一位选手。过去几年,Atlas 人形机器人的动态跑酷能力已经让全世界的关注,后来我们还看到 Atlas 在模拟建筑工地上搬搬扛扛。Atlas 目前仍然是一个开发平台,尚不能在现实世界中工作,一部分原因是它的液压驱动设计。不过,波士顿动力最新公布的一个演示视频表明了 Atlas 和其他人形机器人一样能够完成高难度的操纵任务,包括在装备适当的情况下操纵重物。在视频中,Atlas 稳稳抓起一个比自己手臂还粗的汽车配件,搬运到目标位置:实际上,Atlas 在很长一段时间

胡渊鸣创业公司Meshy产品升级:文本转3D,25秒就能出预览

Meshy-2 的文本转 3D、图像转 3D、文本到纹理效果均有所提升。刚刚,胡渊鸣创业公司 Meshy 官宣了他们的第二代产品 ——Meshy-2。Meshy 是一款 3D 内容生成工具,只需一分钟,即可使用 Al 生成 3D 内容(模型)。公司联合创始人兼 CEO 胡渊鸣是计算机图形学知名学者,毕业于清华大学姚班,是 MIT 博士,也是「太极」(TaiChi)编程语言作者。具体来说,Meshy 提供三种很容易上手的使用方式,包括文本转 3D(输入文字 —— 输出 3D 模型)、图像转 3D(提供图片 —— 生成

通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5

超越 Claude、GPT-3.5,提升了多语言支持能力。赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 AI 社区关注。新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了 GPT 3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多语言支持。阿里通义千问团队表示,相关技术也已经上线到了通义千问官网和通义千问 App。除此以外,今天 Qwen 1.5 的发布还有如下一些重点:支持 32K

向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」

「以史为鉴,可以知兴替。」 人类的进步史,可以看作是一个不断吸取过去经验、不断推进能力边界的自我演化过程。在这个过程中,我们吸取过去失败的教训以纠正错误,借鉴成功的经验以提升效率和效果。这种自我进化的过程在我们的生活中无所不在:从如何总结经验以更好地解决工作中的问题,到如何利用规律更精确地预测天气,我们都在不断地从过去的经验中学习和进化。成功从过去的经验中提取知识并将其应用于未来的挑战,这是人类进化之路上重要的里程碑。那么在人工智能时代,AI 智能体是否也可以做到同样的事情呢?近年来,GPT 和 LLaMA 等语言

摧毁房价的,可能是Apple Vision Pro

机器之能报道编辑:吴昕公共场合,“演技”趋于浮夸的人越来越多......辛普森一家早就预言了 Apple Vision Pro:)视频链接:  Vision Pro 以来不到 48 小时,人们开始为之疯狂。一些大城市中心已经出现佩戴 Vision pro 逛街的人,甚至有人戴着它开车、上飞机旅行。有意思的是,在此之前,Meta  Quest 已售出超 2000 万台(去年 11 月份的媒体数据,其中 1800 万台是 Quest 2 ),我们几乎看不到类似场景,没人戴着它出街。据媒体披露,早在苹果发布第一代苹果手机

大语言模型加速材料发现,普林斯顿大学团队利用 LLM 准确预测晶体特性

编辑 | X晶体特性的预测在晶体设计过程中起着至关重要的作用。当前预测晶体特性的方法主要集中于使用图神经网络(GNN)对晶体结构进行建模。尽管 GNN 很强大,但准确模拟晶体内原子和分子之间的复杂相互作用仍然是一个挑战。文本数据提供了丰富的信息和表现力,但从晶体文本描述预测晶体特性的研究还不够。主要原因之一是缺乏该任务的公开数据。普林斯顿大学的研究人员创建了一种 AI 工具来预测晶体材料的行为。新方法依赖于大型语言模型(LLM)。通过综合文本描述中的信息(包括原子之间键的长度和角度以及电子和光学特性的测量等细节),

夸克大模型应用为先加持夸克网盘深挖相册使用场景

2024年将是大模型应用落地的爆发年,这已经成为业界共识。夸克大模型自去年11月份发布以来,结合自身业务小步快跑,在夸克App上已经落地了多个应用。最近,夸克网盘结合春节场景和大模型技术,升级几项图片处理智能工具。夸克网盘即将上线的“春节图片故事”,是为用户春节期间拍摄上传的图片自动智能筛选生成合辑。该功能除了基于时间、地点两个维度筛选,还会基于人物智能筛选,并剔除掉过亮或过暗等不符合要求的图片。夸克网盘还会利用AI算法为图片合辑智能生成文案,比如鲜花影集的文案是“花与美妙人间”。此前,AI技术还被应用在夸克网盘相

上海街头偶遇未来科技!机器狗和外骨骼机器人都来为2024 GDC造势

2024全球开发者先锋大会(2024 GDC)将于3月23日-24日在上海举行。在这场科技嘉年华即将拉开帷幕之际,昨日上海西岸一场别开生面的活动吸引了众多市民的目光:穿戴外骨骼机器人,牵着机器狗漫步上海街头。这一幕犹如未来科技走进现实,点燃了上海这座城市的科技热情!是的,除了敲代码,我们还可以玩转科技新宠!01 外骨骼机器人外骨骼机器人作为科幻元素的“扛把子”,是一种可以增强人体肌肉力量和精确控制能力的装置,通过硬件传感器收集人体信号,实时监测人机交互力矩,识别用户意图,并作出步态响应,特别适合重复劳作、精细操作或

「天工2.0」MoE大模型发布——「天工AI」国内首个MoE架构免费向C端用户开放的大语言模型应用全新问世

北京时间2月6日,昆仑万维正式发布新版MoE大语言模型「天工2.0」与新版「天工AI智能助手」APP,这是国内首个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用。用户即日起可在各手机应用市场下载「天工AI智能助手」APP,体验昆仑万维「天工2.0」MoE大模型的卓越性能。「天工2.0」是昆仑万维自去年4月发布双千亿级大语言模型「天工」以来的最大规模版本升级,其采用业内顶尖的MoE专家混合模型架构,应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。此次更新全面升级了AI

第一波!2024年2月精选实用设计工具合集

大家好,这是 2024 年 2 月的第1波干货合集!这一期干货合集开头是 3 个素质过硬的灵感网站,一个是关于包装,另外两个分别偏向网页领域的视觉设计和动态设计,都是相当值得收藏的网站。之后还有两款 AI 相关的工具,以及一个 3D 插画素材。 当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货: 1、包装设计领域顶级在线杂志 ,那么这个名为 Dieline 的网站一定要收藏一手,这个2007 年创建的网站如今已经是消费产品品牌和包装领域的权威媒体。网站最初是分享创新设计和优秀设计作

可多模态数据集成、插补和跨模态生成,中科院&树兰医院&北师大团队开发带有掩码模块的深度生成框架

编辑 | 红菜苔随着单细胞技术的发展,许多细胞特性可以被测量。此外,多组学分析技术可以同时联合测量单个细胞中的两个或多个特征。为了快速处理积累的各种数据,需要多模态数据集成的计算方法。树兰医院、中国科学院和北京师范大学的合作团队提出了 inClust ,一个用于多组学分析的深度生成框架。它建立在之前针对转录组数据所开发的 inClust 的基础上,并增加了两个专为多模式数据处理设计的掩码模块:编码器前面的输入掩码模块和解码器后面的输出掩码模块。InClust 可用于整合来自相似细胞群的 scRNA-seq 和 M

王长虎:PixVerse 实测效果已超过 Pika,抖音经验让我们有足够优势

今年 4 月宣布创办爱诗科技,加入视频生成赛道后,王长虎就消失在舆论场中了。他在抖音的职业经历,让爱诗科技在视频生成的牌桌上拥有一席重要位置。2017 年,王长虎加入字节跳动开始担任 AI Lab 总监,在这个岗位上,他为抖音和 Tiktok 从 0-1 构建了视频AI能力。用王长虎本人的话说,为抖音所做的工作,让他的团队涉猎了几乎所有与视频智能相关的领域,包括且不限于数据处理、内容生成、安全问题处理、视频内容精准理解以及全方位广告场景。近期,王长虎接受了机器之心的独家专访。在采访中,王长虎详细介绍了抖音的视频智能

罕见!苹果开源图片编辑神器MGIE,要上iPhone?

拍张照片,输入文字指令,手机就开始自动修图?这一神奇功能,来自苹果刚刚开源的图片编辑神器「MGIE」。                               把背景中的人移除                              在桌子上添加披萨最近一段时间,AI 在图片编辑这一应用上取得了不小的进展。一方面,在 LLM 的基础上,多模态大模型(MLLM)可以自然地将图像视为输入,并提供视觉感知响应。另一方面,基于指令的编辑技术可以不依赖于详细描述或区域掩码,而是允许人类下达指令,直接表达如何编辑以及编辑

2亿参数时序模型替代LLM?谷歌突破性研究被批「犯新手错误」

照箭画靶,跑分自设标准?最近,谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。这篇论文的标题是「A decoder-only foundation model for time-series forecasting(用于时间序列预测的仅解码器基础模型)」。简而言之,时间序列预测就是通过分析历史数据的变化趋势和模式,来预测未来的数据变化。这类技术在气象预报、交通流量预测、商业销售等领域有着广泛的应用。例如,在零售业中,提高需求预测的准确性可以有效降低库存成本并增加收入。近年来,深度学习模型已成为预测丰富的多变量

CMU&ETH实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

足式机器人领域又一次迎来创新!CMU 与 ETH Zurich 团队联合研发了一个名为 「敏捷但安全」(ABS,Agile But Safe)的新框架,为四足机器人在复杂环境中实现高速运动提供了解决方案。ABS 不仅在避免碰撞方面展现出高效能力,还在极速上达到了前所未有的 3.1 米秒!在高速机器人运动领域,实现同时兼顾速度和安全一直是一大挑战。但现在,卡内基梅隆大学(CMU)和苏黎世联邦理工学院(ETH)的研究团队带来了突破性进展。他们开发的新型四足机器人算法,不仅能在复杂环境中高速行进,还能巧妙避开障碍,真正做

比OpenAI官方提示词指南更全,这26条黄金准则让LLM性能飙升50%以上

今天,穆罕默德・本・扎耶德人工智能大学 VILA Lab 带来了一项关于如何更好地为不同规模的大模型书写提示词(prompt)的研究,让大模型性能在不需要任何额外训练的前提下轻松提升 50% 以上。该工作在 X (Twitter)、Reddit 和 LinkedIn 等平台上都引起了广泛的讨论和关注。论文地址: : :Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4在以 ChatGPT 为首的大模型出来之后,为