应用

基于广义 Onsager 原理的 AI 平台,构建自定义热力学

编辑 | 绿萝基于先前积累的数据和已知物理原理的自动化科学发现,是人工智能最令人兴奋的应用之一,这种自动化的假设创建和验证可以帮助科学家研究复杂的现象,而传统的物理直觉可能会失败。近日,来自新加坡国立大学、新加坡科技研究局(A*STAR)、南洋理工大学和中国科学院的研究团队,开发了一个基于广义 Onsager 原理的人工智能平台:S-OnsagerNet,可以直接从对任意随机耗散系统的微观轨迹的观察中学习其宏观动力学描述。该方法同时构建了简化的热力学坐标,并解释这些坐标上的动力学。研究人员通过理论研究和实验验证长聚

ICLR 2024 | 首个零阶优化深度学习框架,MSU联合LLNL提出DeepZero

本文是一篇关于提高零阶优化的扩展性的研究,代码已开源,论文已被 ICLR 2024 接收。今天介绍一篇密歇根州立大学 (Michigan State University) 和劳伦斯・利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的一篇关于零阶优化深度学习框架的文章 “DeepZero: Scaling up Zeroth-Order Optimization for Deep Model Training”,本文被 ICLR 2024 接收,代码已开源。论文地址

制药新工具、有望规避免疫反应,多伦多大学团队用AI框架重新设计参与基因治疗的关键蛋白质

编辑 | 萝卜皮当下,蛋白质设计深度生成模型的快速进展主要集中在具有大量数据的小蛋白质上。这些模型在天然序列有限的大蛋白上表现不佳,例如腺病毒和腺相关病毒的衣壳蛋白,它们是基因治疗的常见递送载体。生成合成病毒载体血清型可以克服大多数基因治疗接受者表现出的强大的预先存在的免疫反应。多伦多大学的研究人员提出了一种变异自动编码器(ProteinVAE),它可以生成合成病毒载体血清型,而无需预先存在的中和抗体的表位。将预先训练的蛋白质语言模型纳入编码器中以提高数据效率,并使用基于反卷积的上采样进行解码以避免长蛋白质序列生成

MIT、IBM 团队巧妙的 AI 方法来解决「蛮力」数学问题

编辑 | X自牛顿时代以来,自然的基本定律——光学、声学、工程学、电子学,最终都归结为一组重要的、广泛的方程。现在,研究人员找到了一种新方法,可以使用受大脑启发的神经网络来比以前更有效地求解这些方程,在科学和工程领域有许多潜在的应用。相关研究以《Physics-enhanced deep surrogates for partial differential equations》为题,发布在《Nature Machine Intelligence》上。论文链接:,偏微分方程有助于对涉及多种变化率的复杂物理系统进行建

如何用AI工具快速制作红包封面?教程来了!

红包封面制作简易教程来啦! 更多教程:微信红包封面开发平台: WHEE-AI 绘画工具: RUNWAY-AI 视频工具: 美图抠图-抠图工具: 熊猫压缩-图片压缩工具:

13页PPT融到1亿后,1X的这批机器人可能要醒了......

机器之能报道编辑:吴昕如果这批 EVE(轮足)机器人大军即将醒来,你会作何感想?上个月刚官宣 B 轮 1 亿美元融资后,OpenAI 领投的挪威机器人公司 1X 又放出消息,明天要有令人兴奋的事情发生。公司 AI 部门负责人、机器人科学家 Eric Jang 今天公开表示,明天将发布有关 AI 和自主性方面的更新。至于具体内容,他卖了个关子,只给了一些提示——线索就在过去一年多他们分享的视频里,与数据引擎的规模化有关。看似神秘,答案并非无迹可寻。上个月 1 亿美元 B 轮融资完成后,1 月 19 日,1X 创始人&

斯坦福最强家务机器人ALOHA 2来了,成本不到20万,联手谷歌DeepMind,完全开源

可以想象,不断进化的双臂机器人未来将最大程度地「解放」人的双手。2023 年,斯坦福大学等机构推出了一个用于双机械手远程操作的低成本开源硬件系统 ALOHA,它可以远程操作并完成组装链条、托举乒乓球等复杂、丰富的任务。今年 1 月,谷歌 DeepMind 与斯坦福又联合推出了 Mobile ALOHA,同样可以进行远程操作并模仿双手操作,通过移动底座在大的空间范围内实现远程操作。这样一来,备菜、翻炒、出锅,洗衣、逗猫、浇花它是样样精通,名副其实的家务机器人火出了圈。今天,谷歌 DeepMind 联合斯坦福推出了 A

系统Prompt长达1700个token,ChatGPT变「懒」的原因找到了?

ChatGPT:我不是不会,就是不想干活。现阶段,ChatGPT 已经成为很多人的得力助手,写文档、编代码、生成图片…… 但看似无所不能的 ChatGPT,也有其懒惰的一面。不知大家是否还记得去年年底 GPT-4 开始变「懒」的事实,比如对于用户提出的要求,ChatGPT 的响应会变得非常缓慢且敷衍,甚至还会单方面中断对话;又比如用户要求 ChatGPT 编写一段代码,它会建议用户自己去写。当时,OpenAI 给出的解释是模型行为是不可预测的,他们也在研究如何修复。一种看似无解的问题,现在另一种解释似乎正在被广大网

开源大模型正在重塑企业AI应用,16个案例看看它们如何落地

企业运作新引擎:开源大模型。各种性能优异的大模型横空出世,开源大型语言模型在企业界的应用也逐渐引起广泛关注。不过,这也使新的问题浮出水面,企业应该怎样有效地部署和应用这些模型来发挥它们最大的价值呢?图灵奖得主 Yann LeCun 在 X 上向大家分享了一篇 VentureBeat 的文章。其探讨了开源 LLM 在商业环境中的潜力、挑战以及它们在不同行业中的实际应用案例。原文链接: 和其他专家认为,开源 LLM 可能会对企业中的生成式人工智能产生更强大的影响。这种影响力可能超过了像 OpenAI 的 ChatGPT

大语言模型的可信之路:TrustLLM全面揭秘

TrustLLM 是一个统一的框架,用于对 LLM 的可信度进行全面分析,包括现有工作的全面综述、可信 LLM 的不同维度的原则、一个新的测试基准,以及对主流 LLM 的全面可信度评估。大型语言模型(LLMs)在 NLP 方面的卓越能力已引起广泛关注,影响了我们生活各个方面的应用。LLMs 的出色能力归因于多个因素,例如使用来自 Web 的大规模原始文本作为训练数据,使用具有大量参数的 transformer 架构设计,以及先进的模型训练方案等。 然而,LLMs 的兴起也引入了关于它们可信度的担忧。与传统语言模型不

黄仁勋:从此之后,请叫我黄院士

I am AI.北京时间 2 月 7 日凌晨,美国国家工程院(National Academy of Engineering, NAE)公布了今年的新增院士名单。院长约翰・L・安德森(John L. Anderson) 表示,美国国家工程院本次已选出 114 名新院士和 21 名国际院士,这使得美国会员总数达到 2310 名,国际会员数量达到 332 名。值得关注的是,在新院士名单中,英伟达创始人、CEO 黄仁勋赫然在列。当前,全球科技公司和机构正在加速建立 AI 基础设施,不断推高对于英伟达芯片的需求。而黄仁勋的

吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速

MAGNeT 有望改变我们体验音乐的方式。在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,Meta FAIR 团队、Kyutai 和希伯来大学推出了 MAGNeT,一种在掩码生成序列建模方法,可以直接在多个音频 tokens 流上直接运行。与以往工作最大的不同是,MAGNeT 是由单阶段、非自回归 transform

传苹果VisionPro 4或5月登陆中国,大厂应用火速跟进

机器之能报道编辑:SiaApple Vision Pro 目前仅在美国推出,但从一开始就有报道称它将很快在国际上推广。《华尔街新闻》快讯报道,供应链预计该产品最早可能于 4 月份在中国发布。它明确表示“最早四月(但不晚于五月)”。目前还没有更多细节,但供应链还声称“工信部的注册程序已接近完成”。消息预计,首批 Apple Vision Pro 在中国供应“将会紧张”。据南华早报报道,国内已有数十家商家愿意以官方价格的两倍将该产品从美国运送到中国。目前社交媒体已经在流传国内海关扣留 4 台入境 Vision Pro

5000字干货!盘点2023年Stable Diffusion GUI工具及其创作生态

正文开始之前,这里先用一句话概括性的介绍一下 Stable Diffusion:它是一种基于深度学习的文本到图像的生成模型。能够根据文本描述创造出丰富多样且具有高质量和细节的图像。它的生成模型是通过大规模图像及其描述的数据集训练而成,所以生成的图像在保持高创造性的同时,还具有较高的高分辨率。另外因其开源性质和强大的功能在 AI 绘画领域具有重要的地位。具体的原理这里就不展开讲了,我们只需要知道它是一种能够通过文本描述生成图像的 AI 绘画工具就够了。2023 年是 AI 相关技术井喷式爆发的一年,在 AI 绘画领域

ML Blocks!全新的节点式 AI 图像处理神器

大家好,我是花生~ 之前为大家介绍过不少 AI 图像处理神器,比如 Clipdrop、Pixian、Upscayl 等,可以帮我们便捷地完成抠图、修图、高清放大等任务。最近又发现了一个新的 AI 图像处理工具 ML Blocks,非常有意思,今天推荐给大家~ 相关推荐:ML Blocks 官网直达: 官方教程: 与我们常用的图像处理工具不同,ML Blocks 的工作界面是一块白板,它的各种图像处理功能则被分为一个个独立的模块,当我们想实现某种图像处理效果时,可以自己将对应的模块连接到一起形成的工作流(work

俄罗斯小哥ChatGPT找女友:聊了5239个女生,现在订婚了

有事 AI 它是真上啊。「我向一位女生求婚,ChatGPT 已经和她交流了一年。为了走到这一步,AI 已经尝试了和 5239 名女生进行过沟通……」                              来源:,社交网络上人们正在轮番向一位俄罗斯小哥送去祝福。23 岁的 Aleksandr Zhadan 是一名 AI 开发者,也是社交平台 TenChat 的一名产品经理。故事是这样开始的:GPT 除了搜索之外,还可以在配对后写入。这样在 50 次自动执行中,他可以获得 18 次配对。GPT 在没有 Aleksa

徒手搬汽车配件,波士顿动力Atlas再进化:兄弟们,准备进厂了

在如今颇为火热的人形机器人赛道,波士顿动力是较早入局的一位选手。过去几年,Atlas 人形机器人的动态跑酷能力已经让全世界的关注,后来我们还看到 Atlas 在模拟建筑工地上搬搬扛扛。Atlas 目前仍然是一个开发平台,尚不能在现实世界中工作,一部分原因是它的液压驱动设计。不过,波士顿动力最新公布的一个演示视频表明了 Atlas 和其他人形机器人一样能够完成高难度的操纵任务,包括在装备适当的情况下操纵重物。在视频中,Atlas 稳稳抓起一个比自己手臂还粗的汽车配件,搬运到目标位置:实际上,Atlas 在很长一段时间

胡渊鸣创业公司Meshy产品升级:文本转3D,25秒就能出预览

Meshy-2 的文本转 3D、图像转 3D、文本到纹理效果均有所提升。刚刚,胡渊鸣创业公司 Meshy 官宣了他们的第二代产品 ——Meshy-2。Meshy 是一款 3D 内容生成工具,只需一分钟,即可使用 Al 生成 3D 内容(模型)。公司联合创始人兼 CEO 胡渊鸣是计算机图形学知名学者,毕业于清华大学姚班,是 MIT 博士,也是「太极」(TaiChi)编程语言作者。具体来说,Meshy 提供三种很容易上手的使用方式,包括文本转 3D(输入文字 —— 输出 3D 模型)、图像转 3D(提供图片 —— 生成