AI资讯列表 - AI在线

向完全自主性更进一步，清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」

「以史为鉴，可以知兴替。」人类的进步史，可以看作是一个不断吸取过去经验、不断推进能力边界的自我演化过程。在这个过程中，我们吸取过去失败的教训以纠正错误，借鉴成功的经验以提升效率和效果。这种自我进化的过程在我们的生活中无所不在：从如何总结经验以更好地解决工作中的问题，到如何利用规律更精确地预测天气，我们都在不断地从过去的经验中学习和进化。成功从过去的经验中提取知识并将其应用于未来的挑战，这是人类进化之路上重要的里程碑。那么在人工智能时代，AI 智能体是否也可以做到同样的事情呢？近年来，GPT 和 LLaMA 等语言

摧毁房价的，可能是Apple Vision Pro

机器之能报道编辑：吴昕公共场合，“演技”趋于浮夸的人越来越多......辛普森一家早就预言了 Apple Vision Pro：）视频链接： Vision Pro 以来不到 48 小时，人们开始为之疯狂。一些大城市中心已经出现佩戴 Vision pro 逛街的人，甚至有人戴着它开车、上飞机旅行。有意思的是，在此之前，Meta Quest 已售出超 2000 万台（去年 11 月份的媒体数据，其中 1800 万台是 Quest 2 ），我们几乎看不到类似场景，没人戴着它出街。据媒体披露，早在苹果发布第一代苹果手机

大语言模型加速材料发现，普林斯顿大学团队利用 LLM 准确预测晶体特性

编辑 | X晶体特性的预测在晶体设计过程中起着至关重要的作用。当前预测晶体特性的方法主要集中于使用图神经网络（GNN）对晶体结构进行建模。尽管 GNN 很强大，但准确模拟晶体内原子和分子之间的复杂相互作用仍然是一个挑战。文本数据提供了丰富的信息和表现力，但从晶体文本描述预测晶体特性的研究还不够。主要原因之一是缺乏该任务的公开数据。普林斯顿大学的研究人员创建了一种 AI 工具来预测晶体材料的行为。新方法依赖于大型语言模型（LLM）。通过综合文本描述中的信息（包括原子之间键的长度和角度以及电子和光学特性的测量等细节），

夸克大模型应用为先加持夸克网盘深挖相册使用场景

2024年将是大模型应用落地的爆发年，这已经成为业界共识。夸克大模型自去年11月份发布以来，结合自身业务小步快跑，在夸克App上已经落地了多个应用。最近，夸克网盘结合春节场景和大模型技术，升级几项图片处理智能工具。夸克网盘即将上线的“春节图片故事”，是为用户春节期间拍摄上传的图片自动智能筛选生成合辑。该功能除了基于时间、地点两个维度筛选，还会基于人物智能筛选，并剔除掉过亮或过暗等不符合要求的图片。夸克网盘还会利用AI算法为图片合辑智能生成文案，比如鲜花影集的文案是“花与美妙人间”。此前，AI技术还被应用在夸克网盘相

上海街头偶遇未来科技！机器狗和外骨骼机器人都来为2024 GDC造势

2024全球开发者先锋大会（2024 GDC）将于3月23日-24日在上海举行。在这场科技嘉年华即将拉开帷幕之际，昨日上海西岸一场别开生面的活动吸引了众多市民的目光：穿戴外骨骼机器人，牵着机器狗漫步上海街头。这一幕犹如未来科技走进现实，点燃了上海这座城市的科技热情！是的，除了敲代码，我们还可以玩转科技新宠！01 外骨骼机器人外骨骼机器人作为科幻元素的“扛把子”，是一种可以增强人体肌肉力量和精确控制能力的装置，通过硬件传感器收集人体信号，实时监测人机交互力矩，识别用户意图，并作出步态响应，特别适合重复劳作、精细操作或

「天工2.0」MoE大模型发布——「天工AI」国内首个MoE架构免费向C端用户开放的大语言模型应用全新问世

北京时间2月6日，昆仑万维正式发布新版MoE大语言模型「天工2.0」与新版「天工AI智能助手」APP，这是国内首个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用。用户即日起可在各手机应用市场下载「天工AI智能助手」APP，体验昆仑万维「天工2.0」MoE大模型的卓越性能。「天工2.0」是昆仑万维自去年4月发布双千亿级大语言模型「天工」以来的最大规模版本升级，其采用业内顶尖的MoE专家混合模型架构，应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。此次更新全面升级了AI

第一波！2024年2月精选实用设计工具合集

大家好，这是 2024 年 2 月的第1波干货合集！这一期干货合集开头是 3 个素质过硬的灵感网站，一个是关于包装，另外两个分别偏向网页领域的视觉设计和动态设计，都是相当值得收藏的网站。之后还有两款 AI 相关的工具，以及一个 3D 插画素材。当然，在此之前记得看看往期干货中有没有你感兴趣的素材：下面我们具体看看这一期的干货： 1、包装设计领域顶级在线杂志，那么这个名为 Dieline 的网站一定要收藏一手，这个2007 年创建的网站如今已经是消费产品品牌和包装领域的权威媒体。网站最初是分享创新设计和优秀设计作

可多模态数据集成、插补和跨模态生成，中科院&树兰医院&北师大团队开发带有掩码模块的深度生成框架

编辑 | 红菜苔随着单细胞技术的发展，许多细胞特性可以被测量。此外，多组学分析技术可以同时联合测量单个细胞中的两个或多个特征。为了快速处理积累的各种数据，需要多模态数据集成的计算方法。树兰医院、中国科学院和北京师范大学的合作团队提出了 inClust ，一个用于多组学分析的深度生成框架。它建立在之前针对转录组数据所开发的 inClust 的基础上，并增加了两个专为多模式数据处理设计的掩码模块：编码器前面的输入掩码模块和解码器后面的输出掩码模块。InClust 可用于整合来自相似细胞群的 scRNA-seq 和 M

王长虎：PixVerse 实测效果已超过 Pika，抖音经验让我们有足够优势

今年 4 月宣布创办爱诗科技，加入视频生成赛道后，王长虎就消失在舆论场中了。他在抖音的职业经历，让爱诗科技在视频生成的牌桌上拥有一席重要位置。2017 年，王长虎加入字节跳动开始担任 AI Lab 总监，在这个岗位上，他为抖音和 Tiktok 从 0-1 构建了视频AI能力。用王长虎本人的话说，为抖音所做的工作，让他的团队涉猎了几乎所有与视频智能相关的领域，包括且不限于数据处理、内容生成、安全问题处理、视频内容精准理解以及全方位广告场景。近期，王长虎接受了机器之心的独家专访。在采访中，王长虎详细介绍了抖音的视频智能

罕见！苹果开源图片编辑神器MGIE，要上iPhone?

拍张照片，输入文字指令，手机就开始自动修图？这一神奇功能，来自苹果刚刚开源的图片编辑神器「MGIE」。把背景中的人移除在桌子上添加披萨最近一段时间，AI 在图片编辑这一应用上取得了不小的进展。一方面，在 LLM 的基础上，多模态大模型（MLLM）可以自然地将图像视为输入，并提供视觉感知响应。另一方面，基于指令的编辑技术可以不依赖于详细描述或区域掩码，而是允许人类下达指令，直接表达如何编辑以及编辑

2亿参数时序模型替代LLM？谷歌突破性研究被批「犯新手错误」

照箭画靶，跑分自设标准？最近，谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。这篇论文的标题是「A decoder-only foundation model for time-series forecasting（用于时间序列预测的仅解码器基础模型）」。简而言之，时间序列预测就是通过分析历史数据的变化趋势和模式，来预测未来的数据变化。这类技术在气象预报、交通流量预测、商业销售等领域有着广泛的应用。例如，在零售业中，提高需求预测的准确性可以有效降低库存成本并增加收入。近年来，深度学习模型已成为预测丰富的多变量

CMU&ETH实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！

足式机器人领域又一次迎来创新！CMU 与 ETH Zurich 团队联合研发了一个名为「敏捷但安全」（ABS，Agile But Safe）的新框架，为四足机器人在复杂环境中实现高速运动提供了解决方案。ABS 不仅在避免碰撞方面展现出高效能力，还在极速上达到了前所未有的 3.1 米秒！在高速机器人运动领域，实现同时兼顾速度和安全一直是一大挑战。但现在，卡内基梅隆大学（CMU）和苏黎世联邦理工学院（ETH）的研究团队带来了突破性进展。他们开发的新型四足机器人算法，不仅能在复杂环境中高速行进，还能巧妙避开障碍，真正做

比OpenAI官方提示词指南更全，这26条黄金准则让LLM性能飙升50%以上

今天，穆罕默德・本・扎耶德人工智能大学 VILA Lab 带来了一项关于如何更好地为不同规模的大模型书写提示词（prompt）的研究，让大模型性能在不需要任何额外训练的前提下轻松提升 50% 以上。该工作在 X (Twitter)、Reddit 和 LinkedIn 等平台上都引起了广泛的讨论和关注。论文地址: : ：Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4在以 ChatGPT 为首的大模型出来之后，为

“女巴菲特”惊人预测人形机器人将于2030年进入家庭，通用AI出现，赞中国开源力量

机器之能报道编辑：sia年关将近，方舟投资（ARK Invest ）2024 年《 Big ideas 》报告如期而至，深入分析了 AI 、机器人等颠覆性技术融合及其巨大的行业和经济变革潜力。作为一家专注投资颠覆性创新（ Disruptive Innovation ）的公司，ARK 主要投资AI、区块链、储能、机器人等技术。他们认为，这些领域将改变世界的运作方式，同时也创造了长期的投资机会。这张图表被认为很有可能是对2024年AI发展做出了预测，并被视为2024最重要的AI图表之一，正是出自方舟投资。过去几年，方舟

专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮

2月1日，刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。 MiniCPM 2B 有着当之无愧的「小钢炮」称号，其炸裂的点在于，从规模大小和性能来看，仅用2B 规模和1T tokens精选数据，便已在多项主流评测榜单、中英文平均成绩中超越被称为“欧洲最佳大模型”的Mistral-7B。在与其他同等规模大模型的对比中，面壁MiniCPM表现依旧领先，大幅超越了 Llama2-7B, Mistral7B，Gemini Nano，Qwen-1.8B等一众模型，甚至还能越级比肩 Llama2-13B、Falcon 40B和Cohere 54B此类比自己庞大数十倍规模的模型。

AI拜年火了，通义千问上线一张照片生成拜年视频

2月5日，春节将至年味渐浓，阿里云通义千问APP上线多项免费新应用，涵盖全家福、拜新年、万物成龙等图像生成的新玩法，共提供超300套照片模板，用户上传照片即可生成全家福、团圆照、拜年照、千里江山主题照；此外，一个月前火爆全网的全民舞王应用也迎来上新，用户可通过一张照片生成拜年视频，用更轻松、接近真人出镜的方式向亲朋好友传递新年的美好祝福。足不出户即可免费「拍」全家福春节是中国人约定俗成的团圆时刻。AI大模型技术正在让人们突破时空阻碍，用最便捷的方式相聚、庆祝，春节团圆的仪式感拉满。在通义千问APP照相馆应用的全家福

浙大团队发布 75 页科学 LLM 调查，重点关注生物和化学领域，指出七个未来发展方向

编辑 | X大型语言模型 (LLM) 已成为增强自然语言理解的变革力量，代表着通用人工智能的重大进步。LLM 的应用超越了传统的语言界限，涵盖了科学领域各学科中开发的专业语言系统。这也导致了科学 LLM 的出现。作为科学人工智能（AI for Science）领域的一个新兴领域，科学 LLM 值得全面探索。然而，目前缺乏系统的、最新的调查来介绍它们。近日，来自浙江大学的研究团队，系统地描述了「科学语言」的概念，同时对科学 LLM 的最新进展进行了全面回顾。鉴于科学学科领域广阔，该分析重点关注生物和化学领域。这包括对

Midjourney 又变强了！一文详解新功能 Style Reference

大家好我是花生~ 没错今天依旧是 Midjourney 的相关内容，因为它又推出了一个非常重要的新功能—— Style Reference （风格参考），可以学习一张图像的风格并生成相似新图像。新功能的用法是怎样的？与 Image Prompt 垫图又有什么区别呢？一起来看看吧~ 上期回顾：一、 Style Reference 使用介绍如果说 Style Tuner 让我们能探索出更多独特的新风格，那么 Style Reference 就让复制某种特定风格变得更加容易，作用类似于 SD 里的 controln

资讯列表