AI资讯列表 - AI在线

6499元起，小米14 Ultra发布：业内首次引入大模型影像技术

卫星通信能力也来了！

登Nature，提前300毫秒预测聚变中等离子体「撕裂」，普林斯顿团队开发AI控制器

JET 托卡马克装置的内部。（英国原子能管理局）编辑 | 紫罗核聚变被称为人造太阳，其原理和为太阳以及其他恒星提供动力的过程相同，被广泛视为清洁能源的圣杯。但科学家们只实现并维持了几秒钟的核聚变能，还有许多障碍，包括高度复杂过程中的不稳定性。实现聚变能的方法有多种，但最常见的是使用氢变体作为输入燃料，并在称为托卡马克的「甜甜圈形」形状的机器中将温度提高到极高水平，以产生等离子体，一种类似汤的物质状态。但等离子体需要受到控制，而且极易「撕裂」，并逃离机器设计用来控制等离子体的强大磁场。近日，普林斯顿大学和普林斯顿等离

2770亿美元，英伟达创史上最大单日涨幅，黄仁勋：生成式AI已到临界点

老黄即将跻身全球前 20 富豪行列。英伟达，现在已是「地球上最重要的一支股票」了。本周四，英伟达市值单日暴涨 2770 亿美元。这是华尔街历史上最大的股票单日涨幅，这家重量级芯片公司的最新季度报告超出了预期，点燃了人们对于人工智能的乐观情绪。单日成交金额 659 亿美元，约合 4700 亿人民币。该公司股价飙升了 16.4% 收于 785.38 美元，创历史新高。其总市值升至 1.96 万亿美元，再次超越谷歌（Alphabet）成为全球第三大市值公司

Stable Diffusion 3震撼发布，采用Sora同源技术，文字终于不乱码了

Stable Diffusion 3 和 Sora 一样采用了 diffusion transformer 架构。继 OpenAI 的 Sora 连续一周霸屏后，昨晚，生成式 AI 顶级技术公司 Stability AI 也放了一个大招 ——Stable Diffusion 3。该公司表示，这是他们最强大的文生图模型。与之前的版本相比，Stable Diffusion 3 生成的图在质量上实现了很大改进，支持多主题提示，文字书写效果也更好了。以下是一些官方示例：提示：史诗般的动漫作品，一位巫师在夜晚的山顶上向漆黑的

目标检测新SOTA：YOLOv9问世，新架构让传统卷积重焕生机

在目标检测领域，YOLOv9 实现了一代更比一代强，利用新架构和方法让传统卷积在参数利用率方面胜过了深度卷积。继 2023 年 1 月 YOLOv8 正式发布一年多以后，YOLOv9 终于来了！我们知道，YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来，领域内的研究者们已经对 YOLO 进行了多次更新迭代，模型性能越来越强大。此次，YOLOv9 由中国台湾 Academia Sinica、台北科技大学等机构联合开发，相

OpenAI工程师必备经典《苦涩的教训》，原来20多年前就有了原型

大量数据学习涌现出来的能力，终于超越了人们的想象。OpenAI 推出视频生成模型 Sora 已经一周的时间了，热度不减，作者团队还在持续放出让人眼前一亮的视频。比如「一群爱冒险的小狗探索天空废墟的电影预告片」，Sora 一次生成并自己完成剪辑。当然，一个个生动、逼真的 AI 视频让人们好奇为什么是 OpenAI 率先打造出了 Sora 并能够跑通所有 AGI 技术栈呢？这一问题在社交媒体上引发了热烈的讨论。其中，在一篇知乎文章中，加州大学伯克利分校计算机科学博士、作者 @SIY.Z 分析了 OpenAI 成功的一些

清华叉院、理想提出DriveVLM，视觉大语言模型提升自动驾驶能力

在自动驾驶领域，研究人员也在朝着 GPT/Sora 等大模型方向进行探索。与生成式 AI 相比，自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统，人们面临的主要挑战是 AI 的场景理解，这会涉及到复杂、不可预测的场景，例如恶劣天气、复杂的道路布局和不可预见的人类行为。现有的自动驾驶系统通常包括 3D 感知、运动预测和规划组成部分。具体来说，3D 感知仅限于检测和跟踪熟悉的物体，忽略了罕见物体及其属性，运动预测和规划则关注物体的轨迹动作，通常会忽略物体和车辆之间的决策级交互。自动驾驶需

Adobe & Figma ：分手2个月后的境况

实际上早在去年年底12月的时候，Adobe 对 Figma 的 200 亿收购案就以失败收场，监管机构下场干预，Adobe 和 Figma 各有想法，最终以 Adobe 支付 Figma 10 亿美元和解，一场长达 15 个月的设计史上最大收购案落下帷幕，双方各自远扬。欧盟和英国竞争委员会基于当地的反垄断法，针对这一收购案提出了反垄断指控。这类操作在科技领域内屡见不鲜，但是在 Adobe 和 Figma 两家之间，欧盟的操作倒是成了一次借坡下驴的绝佳机会。在不同场合、不同媒体的采访之下，这场原本看起来是「天作之合

Sora全球爆火，对设计师来说是机会还是挑战？

想必最近大家在网上都看到了有关 Sora 的信息，这是 OpenAI 在春节期间发布的一项令人难以置信的新技术，在人工智能领域，这可以说是颠覆性的突破和创新。简单来说，它是一个视频生成器，你给它一段文字，它就能帮你创造出你想要的视频作品！我们先来看一个 Sora 生成的视频。这个视频的咒语（Prompt）：一位时尚的女士穿着黑色皮夹克、长红裙和黑色靴子，手拿黑色手袋，在东京一条灯光温暖、霓虹灯闪烁、带有动感城市标志的街道上自信而随意地行走。她戴着太阳镜，涂着红色口红。街道潮湿而有反光效果，色彩缤纷的灯光仿佛在地面

新视频、造话题遇冷，火爆一时的苹果“杀手”Ai Pin会be吗？

·机器之能报道编辑：吴昕这个“杀手”不太冷。下月出货，吉凶难料。三大 iPhone “刺客” —— 苹果 Vsion Pro 、 Rabbit r1 和 Humane Ai Pin，前两者已相继出货并造成轰动。唯独 Humane Ai Pin 自发布以来，一直非常安静，安静得让人有点担忧。这款被 Humane 定位为智能手机继任者的小型无屏幕设备将于下月上市（已经没几天时间了），公司也一直试图通过在其社交媒体账户以及老板、员工账户上发布短视频来制造话题，然而，这些视频并没给人留下深刻印象，收获理想的关注度。这也是

受 ChatGPT 启发，结合 Transformer 和 RL-MCTS 进行从头药物设计

编辑 | 萝卜皮通过从头药物设计发现新型治疗化合物是药物研究领域的一项关键挑战。传统的药物发现方法通常资源密集且耗时，这促使科学家探索利用深度学习和强化学习技术力量的创新方法。在这里，美国查普曼大学（Chapman University）的研究人员开发了一种称为 drugAI 的新型药物设计方法，该方法利用编码器-解码器 Transformer 架构与通过蒙特卡罗树搜索（RL-MCTS）进行的强化学习来加快药物发现过程，同时确保生产具有药物样特性和对其靶标具有强结合亲和力的有效小分子。与两种现有的基准方法相比，dr

开源大模型王座易主！谷歌Gemma杀入场，笔记本可跑，可商用

刚刚，谷歌杀入开源大模型。开源领域大模型，迎来了重磅新玩家。谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini，Gemma 更加轻量，同时保持免费可用，模型权重也一并开源了，且允许商用。Gemma 官方页面：：Gemma 2B 和 Gemma 7B。每种规模都有预训练和指令微调版本。想使用的人可以通过 Kaggle、谷歌的 Colab Notebook 或通过 Google Cloud 访问。当然，Gemma 也第一时间上线了 HuggingFace 和 HuggingChat，每个人都能试一下它的生成

爆火Sora背后的技术，一文综述扩散模型的最新发展方向

为了使机器具有人类的想象力，深度生成模型取得了重大进展。这些模型能创造逼真的样本，尤其是扩散模型，在多个领域表现出色。扩散模型解决了其他模型的限制，如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因此，扩散模型在计算机视觉、自然语言处理等方面备受关注。扩散模型由两个过程组成：前向过程和反向过程。前向过程把数据转化为简单的先验分布，而反向过程则逆转这一变化，用训练好的神经网络模拟微分方程来生成数据。与其他模型相比，扩散模型提供了更稳定的训练目标和更好的生成效果。

模型融合、混合专家、更小的LLM，几篇论文看懂2024年LLM发展方向

还有 10 个月，2024 年还有很多期待空间。在过去的 2023 年中，大型语言模型（LLM）在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展，似乎我们即将进入一个可喜的新阶段：在不增大模型规模的前提下让模型变得更好，甚至让模型变得更小。现在，2024 年的第一个月已经过去，也许是时候盘点一番新年首月进展了。近日，AI 研究者 Sebastian Raschka 发布了一份报告，介绍了四篇与上述新阶段有关的重要论文。它们的研究主题简单总结起来是这样：1. 权重平均和模型融合可将多个 LLM

AI 视频新王者诞生！一文盘点 Sora 模型 14 项功能特点！

大家好，我是花生~ 2 月 16 日 OpenAI 发布了一个新的 AI 视频生成模型 Sora，它可以根据文本生成 60s 的高质量视频，完全突破了之前 AI 文生视频存在的各种局限，所以一出现就引起广泛关注和热烈讨论，大家应该对它都有所了解。今天就根据网上已公布的视频，对 Sora 的功能特性进行一个盘点总结，其中包含与 Runway、Pika 等 AI 视频工具的生成效果对比，让大家对 Sora 的能力有一个更直观全面的了解。相关推荐：一、60s 超长视频之前优设已经推荐过 AI 视频工具，比如 Runw

超多实战案例！大厂出品的AIGC设计实践手册

一、前言随着技术的不断迭代，AIGC 能力的可控性得到了进一步提升，可应用的场景也越来越多，在文本、图像、视频等多个领域都有了广泛应用。用户已经可以用自然语言来与 AI 工具进行交互，革新传统办公方式，工作任务可以更具创造性，并且提高了生产效率。本文将从 AIGC 体系化应用角度聊一聊，设计团队如何利用 AIGC 来优化工作流，提升效率的同时，更多推动 AIGC 能力应用与落地。二、AIGC 对设计的影响如何更好的利用 AI 工具帮助我们提升设计效率与价值，我们尝试了从产品设计类需求、运营设计类需求、视频/动

阿联酋技术创新研究院启动“Falcon Foundation”，引领生成式人工智能模型开源运动

基金会将推动知识共享，加速人工智能的民主化，TII承诺3亿美元未来项目资金

旨在构建首个通用生物学AI模型，前Google DeepMind科学家联手创建Biooptimus

编辑 | X随着法国初创企业生态系统的持续繁荣，比如 Mistral、Poolside 和 Adaptive。2 月 20 日，总部位于巴黎的 Biooptimus 在获得 3500 万美元的种子轮融资后，从隐身中脱颖而出，其使命是建立第一个用于生物学的通用人工智能基础模型。新的开放科学模型将把不同规模的生物学与生成人工智能连接起来——从分子到细胞、组织和整个生物体。Bioptimus 联合了一个由 Google DeepMind alumni 和 Owkin 科学家组成的团队，其中 AI 生物技术初创公司 Owk