AI资讯列表 - AI在线

比OpenAI官方提示词指南更全，这26条黄金准则让LLM性能飙升50%以上

今天，穆罕默德・本・扎耶德人工智能大学 VILA Lab 带来了一项关于如何更好地为不同规模的大模型书写提示词（prompt）的研究，让大模型性能在不需要任何额外训练的前提下轻松提升 50% 以上。该工作在 X (Twitter)、Reddit 和 LinkedIn 等平台上都引起了广泛的讨论和关注。论文地址: : ：Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4在以 ChatGPT 为首的大模型出来之后，为

“女巴菲特”惊人预测人形机器人将于2030年进入家庭，通用AI出现，赞中国开源力量

机器之能报道编辑：sia年关将近，方舟投资（ARK Invest ）2024 年《 Big ideas 》报告如期而至，深入分析了 AI 、机器人等颠覆性技术融合及其巨大的行业和经济变革潜力。作为一家专注投资颠覆性创新（ Disruptive Innovation ）的公司，ARK 主要投资AI、区块链、储能、机器人等技术。他们认为，这些领域将改变世界的运作方式，同时也创造了长期的投资机会。这张图表被认为很有可能是对2024年AI发展做出了预测，并被视为2024最重要的AI图表之一，正是出自方舟投资。过去几年，方舟

专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮

2月1日，刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。 MiniCPM 2B 有着当之无愧的「小钢炮」称号，其炸裂的点在于，从规模大小和性能来看，仅用2B 规模和1T tokens精选数据，便已在多项主流评测榜单、中英文平均成绩中超越被称为“欧洲最佳大模型”的Mistral-7B。在与其他同等规模大模型的对比中，面壁MiniCPM表现依旧领先，大幅超越了 Llama2-7B, Mistral7B，Gemini Nano，Qwen-1.8B等一众模型，甚至还能越级比肩 Llama2-13B、Falcon 40B和Cohere 54B此类比自己庞大数十倍规模的模型。

AI拜年火了，通义千问上线一张照片生成拜年视频

2月5日，春节将至年味渐浓，阿里云通义千问APP上线多项免费新应用，涵盖全家福、拜新年、万物成龙等图像生成的新玩法，共提供超300套照片模板，用户上传照片即可生成全家福、团圆照、拜年照、千里江山主题照；此外，一个月前火爆全网的全民舞王应用也迎来上新，用户可通过一张照片生成拜年视频，用更轻松、接近真人出镜的方式向亲朋好友传递新年的美好祝福。足不出户即可免费「拍」全家福春节是中国人约定俗成的团圆时刻。AI大模型技术正在让人们突破时空阻碍，用最便捷的方式相聚、庆祝，春节团圆的仪式感拉满。在通义千问APP照相馆应用的全家福

浙大团队发布 75 页科学 LLM 调查，重点关注生物和化学领域，指出七个未来发展方向

编辑 | X大型语言模型 (LLM) 已成为增强自然语言理解的变革力量，代表着通用人工智能的重大进步。LLM 的应用超越了传统的语言界限，涵盖了科学领域各学科中开发的专业语言系统。这也导致了科学 LLM 的出现。作为科学人工智能（AI for Science）领域的一个新兴领域，科学 LLM 值得全面探索。然而，目前缺乏系统的、最新的调查来介绍它们。近日，来自浙江大学的研究团队，系统地描述了「科学语言」的概念，同时对科学 LLM 的最新进展进行了全面回顾。鉴于科学学科领域广阔，该分析重点关注生物和化学领域。这包括对

Midjourney 又变强了！一文详解新功能 Style Reference

大家好我是花生~ 没错今天依旧是 Midjourney 的相关内容，因为它又推出了一个非常重要的新功能—— Style Reference （风格参考），可以学习一张图像的风格并生成相似新图像。新功能的用法是怎样的？与 Image Prompt 垫图又有什么区别呢？一起来看看吧~ 上期回顾：一、 Style Reference 使用介绍如果说 Style Tuner 让我们能探索出更多独特的新风格，那么 Style Reference 就让复制某种特定风格变得更加容易，作用类似于 SD 里的 controln

重磅发布！大淘宝设计部 2023 年度AI设计实践报告出炉

22 年中，绘制头像还在用 3D 进行建模，到了年末，就已经用 AI 直接生成了。 22 年末，面对 AI 工具设想能不能在我们业务中进行尝试，到了 23 年中，AI 工具已经覆盖我们团队所承接的所有营销场景业务。 23 年初，团队同学讲到 AI 工具的应用时觉得这是一个专业亮点，到了 23 年末，AI 工具已成为我们团队设计师的基础能力。这一切，都变的太快。这一年，也积累了些心得。首先 AI 工具带来降本增效，让我们的创意效果快速产生，设计方案有效达成。其次增效不仅仅增的是效率，还有设计效果。设计自由度极

大的要来了：谷歌Bard被曝将更名为Gemini，Ultra 1.0更强但收费、安卓App也会来

也许，谷歌此举是为了提前应对 OpenAI 可能于今年推出的 GPT-4.5 或 GPT-5。终于，谷歌去年 12 月承诺的 Gemini Ultra 要与大家见面了吗？今天，推特网友爆出的谷歌 Bard「大料」引发了社媒广泛热议。这位爆料者提供了一张谷歌 Bard 的更新日志截图，显示接下来几天会迎来一次非常重大的调整。谷歌 Bard 预计将从以下两个方面进行调整：一是 Bard 将正式更名为 Gemini，并亮相 Gemini Ultra 1.0 模型；二是 Gemini 安卓应用程序也将到来。对于这份日志更新

不分割成token，直接从字节中高效学习，Mamba原来还能这样用

给出一句「Hello, world!」你要怎么把它喂给 AI 模型？目前常见的方法是利用某种算法将它分为若干 token，比如 ["Hello", ",", "world", "!"]。模型通过学习这些 token 的上下文关系以及如何组合它们来表示原始文本或预测下一个 token。但这种方法依赖于有效的 token 分割算法，而且可能无法很好地处理新词、专有名词或非标准用法。因此，不少研究者也在尝试另一种方法：直接让模型从字节中学习。在 Mamba 问世之后，这条路似乎有希望了。在定义语言模型时，通常会使用一种基

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

2023 年 12 月，首个开源 MoE 大模型 Mixtral 8×7B 发布，在多种基准测试中，其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B，而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能，稠密 LLM 常由于其参数规模急剧扩张而面临严峻的训练成本。MoE 的广泛应用，使得在计算成本相对不变的条件下，模型容量能够得到显著扩展。此特性无疑使得 MoE 成为推动 LLM 发展的关键技术。MoE 设计的初衷，是使模型的学习更加 “术业有专攻”，其有效性已得到业界肯定。然而现有 MoE

中文创意写作能力超GPT-4，「最会写」的中文大模型Weaver来了

ChatGPT 等通用大模型支持的功能成百上千，但是对于普通日常用户来说，智能写作一定是最常见的，也是大模型最能真正帮上忙的使用场景之一。尽管大模型经常能写出看起来像模像样的文字，但是大多数情况下内容的创意程度和文风都经不起深究。尤其是在创作领域，大模型常见的 “GPT 文风” 更是让利用大模型进行创意写作看起来简单，实际却困难重重。近日，波形智能的大模型团队发布了一款专精 AI 写作的专业大模型 Weaver。通过写作领域专业预训练和一套创新性的数据生成和 Alignment 算法，Weaver 在写作领域的各种

看房、打碟、开特斯拉车门、吸尘攒金币：刚刚，第一批把Vision Pro抱回家的人已经开玩了

在全新的 App Store 中，Vision Pro 已经有超过 600 种第三方应用程序体验可供用户探索，包括 OpenAI 的 ChatGPT。切洋葱不用怕辣眼睛、吃油条不用怕弄脏键盘、吸尘不用怕无聊…… 谁能想到，一下子解决这么多问题的居然是苹果 Vision Pro。在刚刚过去的一天，第一批用户已经从苹果零售店拿到了自己的 Vision Pro，第一个拿着它走出来的人甚至享受了明星般的待遇。这一天，苹果 CEO 库克也亲自到场，为取货的人打开大门。有人说，买家现在的心态就像这样：因为选错提货方式还没拿

击败OpenAI，权重、数据、代码全开源，能完美复现的嵌入模型Nomic Embed来了

模型参数量只有 137M，5 天就能训练好。一周前，OpenAI 给广大用户发放福利，在下场修复 GPT-4 变懒的问题后，还顺道上新了 5 个新模型，其中就包括更小且高效的 text-embedding-3-small 嵌入模型。我们知道，嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使得机器学习模型和其他算法更容易理解内容之间的关联，也更容易执行聚类或检索等任务。可见，嵌入在 NLP 领域是非常重要的。不过，OpenAI 的嵌入模型并不是免费给大家使用的，比如 text-embedding-3-small

一句指令自动玩手机，网上冲浪神器Mobile-Agent来了

一直以来，让 AI 成为手机操作助手都是一项颇具挑战性的任务。在该场景下，AI 需要根据用户的要求自动操作手机，逐步完成任务。随着多模态大语言模型（Multimodal Large Language Model，MLLM）的快速发展，以 MLLM 为基础的多模态 agent 逐渐应用于各种实际应用场景中，这使得借助多模态 agent 实现手机操作助手成为了可能。本文将介绍一篇最新的利用多模态 agent 实现 AI 操作手机的研究《Mobile-Agent: Autonomous Multi-Modal Mobil

像人类一样在批评中学习成长，1317条评语让LLaMA2胜率飙升30倍

除了分数，打出分数背后的理由对于大模型对齐更具价值。现有的大模型对齐方法包括基于示例的监督微调（SFT）和基于分数反馈的强化学习（RLHF）。然而，分数只能反应当前回复的好坏程度，并不能明确指出模型的不足之处。相较之下，我们人类通常是从语言反馈中学习并调整自己的行为模式。就像审稿意见不仅仅是一个分数，还包括许多接受或者拒绝的理由。那么，大语言模型能否也像人类一样利用语言反馈来改善自身呢？最近，香港中文大学和腾讯 AI Lab 的研究者们提出了一项名为对比式非似然训练（Contrastive Unlikelihood

独家 | 月之暗面正在进行两亿美元融资，投前估值高达 15 亿美元

作者丨郭思编辑丨陈彩娴AI 科技评论独家获悉，月之暗面近日正在进行 2 亿美元融资，本轮投资由蚂蚁和阿里集团共同投资，投前估值预计 15 亿美元。据了解，月之暗面团队成员人数在100人至200人之间。团队创始人杨植麟是一个90后，本科毕业于清华大学计算机科学与技术系，博士就读于全美自然语言处理排名第一的卡内基梅隆大学语言技术研究所（LTI)，师从苹果AI研究负责人Ruslan Salakhutdinov、谷歌首席科学家William Cohen。

如何借助AI让用户体验更智能？来看手机天猫的实战案例！

AI 当前如火如荼，正以惊人的速度改变着我们的生活和工作方式。我们淘宝设计团队也在探索如何借助 AI 的能力，打破谈及 AI 即聊天对话的思维惯性，构建更高效、实用、符合电商场景的体验范式，来帮助用户解决全链路购物场景问题，重塑用户的购物体验。更多天猫设计案例：手猫 AI 购物助手一、回归需求本身谈到 AI 智能工具，大家对 Chat GPT 这类沉浸式聊天对话式 AI 产品一定不陌生。但对电商平台来说，用户场景更为复杂，用户常常在搜索和查看商品间反复横跳，在商品详情页庞杂的信息中翻找，在多个商品间纠结不知

扎克伯格分红7亿刀，Meta股价大涨14%，开源大计成了？

Meta 正在走出阴霾。伴随着 Meta 的股价周四盘后上涨近 14%，升至历史新高，这家公司宣布了有史以来的首次股息派发。最近一次财报电话会议公布内容显示，Meta 公布的 2023 全年营收为 1349 亿美元，较 2022 年增长 16%；净利润为 391 亿美元，同比增长 69%。其中，第四季度营收为 401 亿美元，超出预期的 391.8 亿美元，同比增长 25%。从 3 月份开始，Meta 将按季度向 A 类和 B 类普通股派发现金股息 50 美分。根据彭博社汇编的数据，首席执行官扎克伯格持有约 3.5

资讯列表