AI资讯列表 - AI在线

大语言模型的可信之路：TrustLLM全面揭秘

TrustLLM 是一个统一的框架，用于对 LLM 的可信度进行全面分析，包括现有工作的全面综述、可信 LLM 的不同维度的原则、一个新的测试基准，以及对主流 LLM 的全面可信度评估。大型语言模型（LLMs）在 NLP 方面的卓越能力已引起广泛关注，影响了我们生活各个方面的应用。LLMs 的出色能力归因于多个因素，例如使用来自 Web 的大规模原始文本作为训练数据，使用具有大量参数的 transformer 架构设计，以及先进的模型训练方案等。然而，LLMs 的兴起也引入了关于它们可信度的担忧。与传统语言模型不

黄仁勋：从此之后，请叫我黄院士

I am AI.北京时间 2 月 7 日凌晨，美国国家工程院（National Academy of Engineering, NAE）公布了今年的新增院士名单。院长约翰・L・安德森（John L. Anderson) 表示，美国国家工程院本次已选出 114 名新院士和 21 名国际院士，这使得美国会员总数达到 2310 名，国际会员数量达到 332 名。值得关注的是，在新院士名单中，英伟达创始人、CEO 黄仁勋赫然在列。当前，全球科技公司和机构正在加速建立 AI 基础设施，不断推高对于英伟达芯片的需求。而黄仁勋的

无需RLHF显著提升GPT-4/Llama2性能，北大团队提出Aligner对齐新范式

对齐新范式：修正未对齐的答案比生成对齐的回答更容易。背景大语言模型（LLMs）虽展现出了强大的能力，但也可能产生不可预测和有害的输出，例如冒犯性回应、虚假信息和泄露隐私数据，给用户和社会造成伤害。确保这些模型的行为与人类意图和价值观相对齐，是一个紧迫的挑战。尽管基于人类反馈的强化学习（RLHF）提供了一种解决方案，但它面临复杂的训练架构、对参数的高敏感性，以及奖励模型在不同数据集上的不稳定性等多重挑战。这些因素导致 RLHF 技术实现难、奏效难、复现难。为了克服这些挑战，北京大学团队提出了一种新的高效对齐范式 ——

斯坦福和OpenAI提出meta-prompting，最强零样本prompting技术诞生了

在我们的工作群里，经常会有一位管理者来协调每个人的工作并汇总工作成果。近日，斯坦福大学的 Mirac Suzgun 和 OpenAI 的 Adam Tauman Kalai 提出了一种新的 prompting 方法：meta-prompting。类似于工作群，这种方法也是使用一个居中协调的指挥员（元模型）来协调使用不同用途的 AI 和其它工具。最新一代语言模型（尤其是 GPT-4、PaLM 和 LLaMa）已经成功拓展了自然语言处理和生成的边界。这些大规模模型可以解决许多不同任务，从写莎士比亚风格的十四行诗到总结复

抛弃编码器-解码器架构，用扩散模型做边缘检测效果更好，国防科大提出DiffusionEdge

现有的深度边缘检测网络通常基于包含了上下采样模块的编码器 - 解码器架构，以更好的提取多层次的特征，但这也限制了网络输出既准又细的边缘检测结果。针对这一问题，一篇 AAAI 2024 上的论文给出了新的解决方案。论文题目：DiffusionEdge: Diffusion Probabilistic Model for Crisp Edge Detection作者：叶云帆（国防科技大学），徐凯（国防科技大学），黄雨行（国防科技大学），易任娇（国防科技大学），蔡志平（国防科技大学）论文链接: : iGRAPE Lab

吉他摇滚、电子音乐都能搞定，Meta开源音频生成新模型MAGNeT，非自回归7倍提速

MAGNeT 有望改变我们体验音乐的方式。在文本生成音频（或音乐）这个 AIGC 赛道，Meta 最近又有了新研究成果，而且开源了。前几日，在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中，Meta FAIR 团队、Kyutai 和希伯来大学推出了 MAGNeT，一种在掩码生成序列建模方法，可以直接在多个音频 tokens 流上直接运行。与以往工作最大的不同是，MAGNeT 是由单阶段、非自回归 transform

传苹果VisionPro 4或5月登陆中国，大厂应用火速跟进

机器之能报道编辑：SiaApple Vision Pro 目前仅在美国推出，但从一开始就有报道称它将很快在国际上推广。《华尔街新闻》快讯报道，供应链预计该产品最早可能于 4 月份在中国发布。它明确表示“最早四月（但不晚于五月）”。目前还没有更多细节，但供应链还声称“工信部的注册程序已接近完成”。消息预计，首批 Apple Vision Pro 在中国供应“将会紧张”。据南华早报报道，国内已有数十家商家愿意以官方价格的两倍将该产品从美国运送到中国。目前社交媒体已经在流传国内海关扣留 4 台入境 Vision Pro

5000字干货！盘点2023年Stable Diffusion GUI工具及其创作生态

正文开始之前，这里先用一句话概括性的介绍一下 Stable Diffusion：它是一种基于深度学习的文本到图像的生成模型。能够根据文本描述创造出丰富多样且具有高质量和细节的图像。它的生成模型是通过大规模图像及其描述的数据集训练而成，所以生成的图像在保持高创造性的同时，还具有较高的高分辨率。另外因其开源性质和强大的功能在 AI 绘画领域具有重要的地位。具体的原理这里就不展开讲了，我们只需要知道它是一种能够通过文本描述生成图像的 AI 绘画工具就够了。2023 年是 AI 相关技术井喷式爆发的一年，在 AI 绘画领域

ML Blocks！全新的节点式 AI 图像处理神器

大家好，我是花生~ 之前为大家介绍过不少 AI 图像处理神器，比如 Clipdrop、Pixian、Upscayl 等，可以帮我们便捷地完成抠图、修图、高清放大等任务。最近又发现了一个新的 AI 图像处理工具 ML Blocks，非常有意思，今天推荐给大家~ 相关推荐：ML Blocks 官网直达：官方教程：与我们常用的图像处理工具不同，ML Blocks 的工作界面是一块白板，它的各种图像处理功能则被分为一个个独立的模块，当我们想实现某种图像处理效果时，可以自己将对应的模块连接到一起形成的工作流（work

俄罗斯小哥ChatGPT找女友：聊了5239个女生，现在订婚了

有事 AI 它是真上啊。「我向一位女生求婚，ChatGPT 已经和她交流了一年。为了走到这一步，AI 已经尝试了和 5239 名女生进行过沟通……」来源：，社交网络上人们正在轮番向一位俄罗斯小哥送去祝福。23 岁的 Aleksandr Zhadan 是一名 AI 开发者，也是社交平台 TenChat 的一名产品经理。故事是这样开始的：GPT 除了搜索之外，还可以在配对后写入。这样在 50 次自动执行中，他可以获得 18 次配对。GPT 在没有 Aleksa

徒手搬汽车配件，波士顿动力Atlas再进化：兄弟们，准备进厂了

在如今颇为火热的人形机器人赛道，波士顿动力是较早入局的一位选手。过去几年，Atlas 人形机器人的动态跑酷能力已经让全世界的关注，后来我们还看到 Atlas 在模拟建筑工地上搬搬扛扛。Atlas 目前仍然是一个开发平台，尚不能在现实世界中工作，一部分原因是它的液压驱动设计。不过，波士顿动力最新公布的一个演示视频表明了 Atlas 和其他人形机器人一样能够完成高难度的操纵任务，包括在装备适当的情况下操纵重物。在视频中，Atlas 稳稳抓起一个比自己手臂还粗的汽车配件，搬运到目标位置：实际上，Atlas 在很长一段时间

胡渊鸣创业公司Meshy产品升级：文本转3D，25秒就能出预览

Meshy-2 的文本转 3D、图像转 3D、文本到纹理效果均有所提升。刚刚，胡渊鸣创业公司 Meshy 官宣了他们的第二代产品 ——Meshy-2。Meshy 是一款 3D 内容生成工具，只需一分钟，即可使用 Al 生成 3D 内容（模型）。公司联合创始人兼 CEO 胡渊鸣是计算机图形学知名学者，毕业于清华大学姚班，是 MIT 博士，也是「太极」（TaiChi）编程语言作者。具体来说，Meshy 提供三种很容易上手的使用方式，包括文本转 3D（输入文字 —— 输出 3D 模型）、图像转 3D（提供图片 —— 生成

通义千问再开源，Qwen1.5带来六种体量模型，性能超越GPT3.5

超越 Claude、GPT-3.5，提升了多语言支持能力。赶在春节前，通义千问大模型（Qwen）的 1.5 版上线了。今天上午，新版本的消息引发了 AI 社区关注。新版大模型包括六个型号尺寸：0.5B、1.8B、4B、7B、14B 和 72B，其中最强版本的性能超越了 GPT 3.5、Mistral-Medium，包括 Base 模型和 Chat 模型，且有多语言支持。阿里通义千问团队表示，相关技术也已经上线到了通义千问官网和通义千问 App。除此以外，今天 Qwen 1.5 的发布还有如下一些重点：支持 32K

向完全自主性更进一步，清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」

「以史为鉴，可以知兴替。」人类的进步史，可以看作是一个不断吸取过去经验、不断推进能力边界的自我演化过程。在这个过程中，我们吸取过去失败的教训以纠正错误，借鉴成功的经验以提升效率和效果。这种自我进化的过程在我们的生活中无所不在：从如何总结经验以更好地解决工作中的问题，到如何利用规律更精确地预测天气，我们都在不断地从过去的经验中学习和进化。成功从过去的经验中提取知识并将其应用于未来的挑战，这是人类进化之路上重要的里程碑。那么在人工智能时代，AI 智能体是否也可以做到同样的事情呢？近年来，GPT 和 LLaMA 等语言

摧毁房价的，可能是Apple Vision Pro

机器之能报道编辑：吴昕公共场合，“演技”趋于浮夸的人越来越多......辛普森一家早就预言了 Apple Vision Pro：）视频链接： Vision Pro 以来不到 48 小时，人们开始为之疯狂。一些大城市中心已经出现佩戴 Vision pro 逛街的人，甚至有人戴着它开车、上飞机旅行。有意思的是，在此之前，Meta Quest 已售出超 2000 万台（去年 11 月份的媒体数据，其中 1800 万台是 Quest 2 ），我们几乎看不到类似场景，没人戴着它出街。据媒体披露，早在苹果发布第一代苹果手机

大语言模型加速材料发现，普林斯顿大学团队利用 LLM 准确预测晶体特性

编辑 | X晶体特性的预测在晶体设计过程中起着至关重要的作用。当前预测晶体特性的方法主要集中于使用图神经网络（GNN）对晶体结构进行建模。尽管 GNN 很强大，但准确模拟晶体内原子和分子之间的复杂相互作用仍然是一个挑战。文本数据提供了丰富的信息和表现力，但从晶体文本描述预测晶体特性的研究还不够。主要原因之一是缺乏该任务的公开数据。普林斯顿大学的研究人员创建了一种 AI 工具来预测晶体材料的行为。新方法依赖于大型语言模型（LLM）。通过综合文本描述中的信息（包括原子之间键的长度和角度以及电子和光学特性的测量等细节），

夸克大模型应用为先加持夸克网盘深挖相册使用场景

2024年将是大模型应用落地的爆发年，这已经成为业界共识。夸克大模型自去年11月份发布以来，结合自身业务小步快跑，在夸克App上已经落地了多个应用。最近，夸克网盘结合春节场景和大模型技术，升级几项图片处理智能工具。夸克网盘即将上线的“春节图片故事”，是为用户春节期间拍摄上传的图片自动智能筛选生成合辑。该功能除了基于时间、地点两个维度筛选，还会基于人物智能筛选，并剔除掉过亮或过暗等不符合要求的图片。夸克网盘还会利用AI算法为图片合辑智能生成文案，比如鲜花影集的文案是“花与美妙人间”。此前，AI技术还被应用在夸克网盘相

上海街头偶遇未来科技！机器狗和外骨骼机器人都来为2024 GDC造势

2024全球开发者先锋大会（2024 GDC）将于3月23日-24日在上海举行。在这场科技嘉年华即将拉开帷幕之际，昨日上海西岸一场别开生面的活动吸引了众多市民的目光：穿戴外骨骼机器人，牵着机器狗漫步上海街头。这一幕犹如未来科技走进现实，点燃了上海这座城市的科技热情！是的，除了敲代码，我们还可以玩转科技新宠！01 外骨骼机器人外骨骼机器人作为科幻元素的“扛把子”，是一种可以增强人体肌肉力量和精确控制能力的装置，通过硬件传感器收集人体信号，实时监测人机交互力矩，识别用户意图，并作出步态响应，特别适合重复劳作、精细操作或