AI资讯列表 - AI在线

终于，NLP顶会ACL投稿不用匿名了

再也不怕大会投稿被占坑了？对于自然语言处理领域的研究人员，最近有一条好消息。近日，计算语言学协会年会（ACL）正式宣布，该系列会议论文投稿已取消匿名期，同时允许作者在投稿期间宣传自身工作。新规定直接适用于下一个审稿周期。今年的 ACL 是第 62 届，将于 2024 年 8 月 11 日至 16 日在泰国曼谷举行。自 2022 年起，ACL 启用了滚动审稿机制（ACL Rolling Review，ARR），每月设 deadline。需要注意的是，在上一个截止日期之前提交给评审流程的论文仍受旧匿名政策的约束。大会声

Stability AI发布Stable Code 3B模型，没有GPU也能本地运行

Stable Code 3B 的性能优于类似大小的代码模型，并且与 CodeLLaMA 7B 的性能相当，尽管其大小只有 CodeLLaMA 7B 的 40%。在文生图领域大火的 Stability AI，今天宣布了其 2024 年的第一个新 AI 模型：Stable Code 3B。顾名思义，Stable Code 3B 是一个拥有 30 亿参数的模型，专注于辅助代码任务。无需专用 GPU 即可在笔记本电脑上本地运行，同时仍可提供与 Meta 的 CodeLLaMA 7B 等大型模型具有竞争力的性能。2023

机器人领域首个开源视觉-语言操作大模型，RoboFlamingo框架激发开源VLMs更大潜能

还在苦苦寻找开源的机器人大模型？试试RoboFlamingo！近年来，大模型的研究正在加速推进，它逐渐在各类任务上展现出多模态的理解和时间空间上的推理能力。机器人的各类具身操作任务天然就对语言指令理解、场景感知和时空规划等能力有着很高的要求，这自然引申出一个问题：能不能充分利用大模型能力，将其迁移到机器人领域，直接规划底层动作序列呢？对此，ByteDance Research 基于开源的多模态语言视觉大模型 OpenFlamingo 开发了开源、易用的 RoboFlamingo 机器人操作模型，只用单机就可以训练。

Stable Diffusion ComfyUI 基础教程（七）如何使用三大微调模型：Embeddings、Lora、Hypernetwork

前言：在我们绘图过程中我们用到了 Checkpoint 模型和 VAE 模型，但是还有另外三种可以辅助我们出图的模型没有给大家介绍，他们分别是 Embeddings（嵌入）、Lora（低秩适应模型）、Hypernetwork（超网络）这三种模型；在开始讲解这三个模型之前我们一定要记住不止 Checkpoint（大模型）分 SD1.4、SD1.5、SDXL1.0 等基础算法型号，这三个模型同样也分，我们在使用时要选择对应基础算法型号才能正常使用。今天我们就讲讲这三种模型分别是什么原理、有什么作用和怎么使用。

上海人工智能实验室团队开发具有多核光纤单元旋转功能的AI驱动投影断层扫描

编辑 | 白菜叶光学断层扫描已成为一种非侵入性成像方法，可提供对亚细胞结构的三维洞察，从而能够更深入地了解细胞功能、相互作用和过程。传统的光学断层扫描方法受到有限的照明扫描范围的限制，导致分辨率各向异性和细胞结构的不完整成像。为了克服这个问题，上海人工智能实验室、德国德累斯顿工业大学（Technische Universität Dresden）以及马克斯·普朗克学会（Max Planck Society）的研究人员采用了紧凑的多核光纤细胞旋转器系统，该系统有助于对微流控芯片内的细胞进行精确的光学操纵，从而实现具有

在24项场景中优于人类医生，Google团队开发基于自博弈的诊断对话大模型

编辑 | 白菜叶医学的核心在于医患对话，熟练的病史采集为准确的诊断、有效的管理和持久的信任铺平了道路。能够进行诊断对话的人工智能（AI）系统可以提高护理的可及性、一致性和质量。然而，学习临床医生的专业知识是一个巨大的挑战。Google Research 和 Google DeepMind 的 AI 团队开发了 AMIE（Articulate Medical Intelligence Explorer），这是一种基于大型语言模型（LLM）的人工智能系统，针对诊断对话进行了优化。AMIE 使用一种新颖的基于自博弈（se

全球最长开源！元象开源大模型XVERSE-Long-256K，无条件免费商用！

元象发布全球首个上下文窗口长度256K的开源大模型XVERSE-Long-256K，支持输入25万汉字，让大模型应用进入“长文本时代”。该模型全开源，无条件免费商用，且附带手把手训练教程，让海量中小企业、研究者和开发者更早一步实现“大模型自由”。全球主流长文本大模型图谱参数量和高质量数据量决定了大模型的计算复杂度，而长文本技术（Long Context）是大模型应用发展“杀手锏”，因技术新、研发难度高，目前多为闭源付费提供。 XVERSE-Long-256K支持超长文本输入，可用于大规模数据分析、多文档阅读理解

为什么普通人「出圈」，都在小红书？

解码小红书推荐系统：为什么在这里普通人更容易被看见？出差期间，我在酒店百无聊赖地打开了小红书。一篇看似平淡无奇的笔记吸引了我的注意——一位 ID 叫「倚着彩虹看夕阳」的用户发帖，说自己在酒店的床上看西游记时，感觉到前所未有的放松。从标题到配图，这篇发布于去年 5 月的笔记没有任何明显的爆点，但显然在小红书上引发了广泛的共鸣，收到了大量的点赞、收藏和评论。我也被吸引，陷入了#走不出的评论区。现代人的信息获取方式很大程度上受推荐系统所影响，这篇笔记在发布 8 个月后依然能进入我的视野，小红书的推荐系统功不可没。相比之下

微软Copilot大会员来了：每月20刀，人人都能用

覆盖 Office 全家桶，免费的移动版 App 也同期上线。去年 9 月，微软宣布了大模型 Copilot 能力加入 Office 和 Windows 11 的新计划。今天，该能力终于覆盖到了全体用户。1 月 15 日，微软正式发布 Copilot Pro，其每月订阅费用为 20 美元，可解锁访问 Word、Excel 和 PowerPoint 等 Office 常用办公软件中的大模型能力，同时优先访问最新的 OpenAI 模型。在其之上，你也可以基于需求构建起属于自己的 Copilot GPT。Copilot

Yann LeCun发来肯定：腾讯人像照片生成可以随便玩了

AI 帮你成为百变星君。这一次，Yann LeCun 首次跻身「百变大咖」。身穿钢铁侠的衣服、戴着酷酷的墨镜面无表情地注视着你，一身古装在故宫门前打卡留念……就连本人也出来转发并喊话，「左下角这幅文艺复兴时期的画，是我的最爱。」性感女神寡姐身穿紫色巫师服注视着远方，还可以戴着圣诞帽和你对视：身穿太空服的奥特曼看起来萌萌的，把头发染成红色也毫无违和感上述研究便是来自南开大学、腾讯等机构提出 PhotoMaker，这是一种高效的个性化文本到图像生成方法。相关论文《PhotoMaker：Customizing Reali

开源模型新纪录：超越Mixtral 8x7B Instruct的模型来了

又有新的开源模型可以用了。从 Llama、Llama 2 到 Mixtral 8x7B，开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5，因此它也被认为是一种「非常接近 GPT-4」的开源选项。在前段时间的一篇论文中，该模型背后的公司 Mistral AI 公布了 Mixtral 8x7B 的一些技术细节，并推出了 Mixtral 8x7B – Instruct 聊天模型。该模型性能在人类评估基准上明显超过了 GPT-3.5 Tur

微软TaskWeaver开源框架：携手数据分析与行业定制，打造顶级Agent解决方案

数据分析一直是现代社会中的重要工具，它帮助我们洞察本质、发现规律并指导决策。然而，数据分析过程往往复杂且费时，因此我们期望存在一个智能助手助力用户直接 “与数据对话 “。得益于大语言模型（LLM）的发展，虚拟助手和 Copilot 等智能 Agent 纷纷涌现，它们在自然语言理解和生成方面的表现令人叹为观止。但遗憾的是，在处理复杂数据结构（如 DataFrame, ndarray 等）和引入领域知识方面，现有的 Agent 框架仍然举步维艰，而这恰恰是数据分析和专业领域中的核心需求。为了突破这一瓶颈，微软推出了 T

第三波！2024年1月精选实用设计工具合集

大家好，这是 2024 年 1 月的第三波干货合集！这一期干货合集打头的一个免费的在线 AI 壁纸生成工具，之后是字体海报灵感设计网站和类似 Pinterest 的在线灵感搜集网站，此外还有无代码网站设计和生成工具 ReadyMag 以及特别有自己一套风格的免费图库 KaboomPics ，最后是一组免费矢量涂鸦素材。当然，在此之前记得看看往期干货中有没有你感兴趣的素材：下面我们具体看看这一期的干货： 1、在线 AI 壁纸生成工具 AI 大模型到底是哪个，但是总体上来看有很大概率是一个基于 Stable Dif

龙年春节专题！7 款高质量 Stable Diffusion WebUI 模型推荐

大家好我是花生~ 上次推荐了 15 组春节主题的 Midjourney 提示词，不知道大家用起来了没有？今天继续推荐 7 款龙年春节主题的 Stable Diffusion 模型，在 WebUI 或 ComyfyUI 可以用它们免费出图，还可以结合控制插件 ControlNet 让生成的图像更符合设计需求。相关推荐：一、年货街 | 新年电商营销场景这是一个专门生成电商年货促销场景的 Lora，以中式建筑街道为画面主元素，整体的 3D 质感非常不错，很适合作为 Banner 或者长图的背景素材。 1. 模型网址

完蛋，CES 2024被机器人包围了

机器之能报道编辑：佳琪2024 年国际消费电子展（CES）这一科技界的风向标活动刚刚落幕。作为全球备受瞩目的科技盛会，CES 吸引了来自 150 多个国家和地区的 4000 多家尖端科技企业。各家品牌纷纷秀出了最先进的技术和产品。英伟达的 AI PC 布局、英特尔最新的第 14 代处理器、发布 3 天即售罄 3 万台的 Rabbit R1...... 今年的 CES 见证了亿点点新变革的发生。超过 13 万名参会者亲临现场，体验了一把「黑科技照进现实」的震撼。在 CES 的展厅里，机器人总是最引人注目的焦点，其中有

我们是怎么一步步被Hugging Face收购的：开源库Gradio构建者分享背后故事

Gradio CEO 兼联合创始人 Abubakar Abid 谈了谈 Gradio 被收购的内幕故事。不知大家是否还记得 2021 年年末，Hugging Face 宣布收购 Gradio 一事。两年过去了，Gradio 是如何成长起来的，又是如何被收购的，Gradio CEO 兼联合创始人 Abubakar Abid 说出了一些内幕故事。图源：是一个开源的 Python 库，可让你快速为机器学习模型、API 或任意 Python 函数构建演示或 Web 应用程序。只需几行代码，就可以让你的机器学习模型从抽象晦

深挖RLHF潜力，复旦语言和视觉团队创新奖励模型优化，让大模型更对齐

继第一份大模型对齐技术报告（Secrets of RLHF in Large Language Models Part I）获 NeurIPS 2023 workshop best paper 后，第二份报告强势归来，复旦语言和视觉团队联合推出的第二份报告将进入这一领域更深层的探索和优化之旅。在首份报告中，复旦团队揭示了 RLHF 在大语言模型中的基本框架，并深入分析了 PPO 算法的内部机制，特别是 PPO-max 的高级版本在策略模型训练稳定性中的关键作用。现在，复旦团队进一步挖掘 RLHF 的潜力，重点关注奖

央企第一家：中国电信开源星辰语义大模型，共享超1T 高质基础数据

2024 年伊始，中国电信开源星辰语义大模型- 7B，成为第一家开源大模型的央企。同时开源的还有超 1T 的高质量清洗基础数据。随着新一轮科技革命和产业变革加速演进，拥抱 AI 成为中国电信当下发展的核心战略之一。2019 年，中国电信在原数据中心基础上成立大数据和 AI 中心。2023 年11 月，中国电信注资 30 亿元成「中电信人工智能科技有限公司」（以下简称中电信 AI 、 AI 团队），牵头打造中国电信 AI 核心技术。同月，中国电信发布千亿级星辰语义大模型。开源项目链接地址