AI资讯列表 - AI在线

入门 Transformer：概念、代码与流程详解

引言论文《Attention is All You Need》（Vaswani等，2017）提出了Transformer架构，这一模型通过完全摒弃标准的循环神经网络（RNN）组件，彻底改变了自然语言处理（NLP）领域。相反，它利用了一种称为“注意力”的机制，让模型在生成输出时决定如何关注输入的特定部分（如句子中的单词）。在Transformer之前，基于RNN的模型（如LSTM）主导了NLP领域。

Ebay 等警告：利用个人信息展开的诈骗邮件正在激增，AI 或为“帮凶”

这些工具还能抓取受害者的社交媒体和在线活动数据，锁定他们最容易回应的话题，帮助黑客批量生成量身定制的网络钓鱼骗局。

Meta AI 推出 LIGER 混合检索 AI 模型，计算效率与推荐精度兼得

Meta AI 的研究人员提出了一种名为 LIGER 的新型 AI 模型，巧妙地结合密集检索和生成检索的优势，显著提升了生成式推荐系统的性能。

“人工智能教父”辛顿公开支持马斯克起诉 OpenAI

本周一，由年轻人领导的全球倡导组织 Encode 向法院提交了一份支持埃隆・马斯克（Elon Musk）诉讼的法律意见书，试图阻止 OpenAI 的企业化转型。这一举措得到了人工智能领域重量级人物、诺贝尔奖和图灵奖得主杰弗里・辛顿（Geoffrey Hinton）的公开支持。

消息称英伟达已在储备 ASIC 设计人才，力图打造 AI 芯片新战线

英伟达若提供 AI ASIC 设计服务，既可在通用 GPU 外提供更具性价比的按需定制解决方案，同时英伟达在 AI 软件堆栈方面的底力也有助于业务开展。

全新模型RoboVLMs解锁VLA无限可能，真实机器人实验交出满分答卷

本文作者来自清华大学、字节跳动、中科院自动化所、上海交通大学和新加坡国立大学。作者列表：李兴航、李沛言、刘明桓、王栋、刘济榕、康炳易、马骁、孔涛、张翰博和刘华平。第一作者李兴航是清华大学计算机系博士生。

联手OpenAI，吴恩达推出一门o1推理新课程，还免费

在刚刚过去的 2024 年，OpenAI 推出了 o 系列模型。相比于以往大型语言模型，o 系列模型使用更多的计算进行更深入的「思考」，能够回答更复杂、更细致的问题。通过在推理时执行思维链推理，o 系列模型在新兴用例中表现出色，包括多步骤规划、图像推理和长期编码。

多模态模型已落地多领域，OpenBayes贝式计算获评「大模型最具潜力创业企业 TOP 10」

缩放定律的放缓带来的技术路径演变在 2024 年的 NeurIPS 会议上，Ilya Sutskever 提出了一系列关于人工智能发展的挑战性观点，尤其集中于 Scaling Law 的观点：「现有的预训练方法将会结束」，这不仅是一次技术的自然演进，也可能标志着对当前「大力出奇迹」方法的根本性质疑。 Ilya 讨论了预训练模型的局限性，预见 AI 系统需要发展出更加接近人类思考方式的推理能力。他强调，为了突破当前的局限并继续提升 AI 的能力，必须寻找新的训练方法。

字节整活！1.58比特FLUX：手机也能流畅运行的顶尖AI画图神器来了

自字节跳动和POSTECH的研究团队发布了一项名为“1.58-bit FLUX”的突破性研究成果，该成果成功将最先进的文本到图像（T2I）生成模型FLUX.1-dev的权重参数量化至1.58比特，同时保持了生成1024x1024图像的质量，为在资源受限的移动设备上部署大型T2I模型开辟了新的道路，这项研究成果已发布在arXiv上，并配有开源代码库（代码目前还没有上传）AI画图模型也能“减肥”？简单来说，就是把 FLUX(由Stable Diffusion作者团队成立的黑森林实验室Black Forest Lab推出) 的超强AI画图模型进行了“压缩”。大家都知道，现在的AI画图模型，像DALLE 3、Stable Diffusion 3、Midjourney等，展现出强大的图像生成能力，在现实应用中潜力巨大。

比人类神经元快10亿倍！港中文、中科院「超级大脑」：1秒识图3479万张

人工神经元，比人类大脑快10亿倍，将会是怎样的景象？如今，这一科幻般的场景，早已成为了现实。来自香港中文大学、中国科学院物理研究所等机构科学家，成功开发出了一种基于「激光」的人工神经元。

全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘

刚刚过去的 2024 年是生成式 AI 大发展的一年，我们见证了 OpenAI Sora 的崛起，大模型服务价格的飞速下降，以及国内开源大模型的奋起直追。这全方位的快速发展让我们对下一波 AI 的新技术大规模应用充满了信心。对于身在 AI 领域的工程师和学者们来说，他们看待这一年的观点会有不同吗？

2024年AI安全五大热点回顾

在ChatGPT推出两年后，生成式AI已成为网络安全领域的重要力量。 2024年生成式AI技术的影响无处不在，从深伪欺诈到“影子AI”的风险，再到AI安全法规的出现和AI驱动的漏洞研究潜力。以下，我们将盘点过去一年AI与网络安全的五大热点话题。

微软论文意外「走光」，OpenAI参数全泄密！GPT-4o仅200B，o1 300B

谁能想到，微软在一篇医学领域的论文里，竟然把OpenAI模型的参数全「曝光」了！ GPT-4参数约1.76万亿GPT-4o参数约2000亿GPT-4o mini参数约80亿o1-preview参数约3000亿o1-mini参数约1000亿Claude 3.5 Sonnet参数约1750亿研究人员：参数均为估算值让所有人难以置信的是，GPT-4o系列的参数如此少，mini版甚至只有8B。有网友猜测，4o mini是一个大约有40B参数的MoE模型，其中激活参数为8B。

大规模3D场景2分钟生成，效率提升30倍！中科院发布空间智能新框架

「空间智能」和「世界模型」是最近学术界和产业界非常火热的研究方向，走向虚实结合、模拟世界机理的关键一步，就是创造出一个生动的虚拟世界。然而，想要打造丰富多样、充满细节，同时具备高度可编辑性和物理真实性的3D虚拟世界，仍然困难重重。为了解决这些难题，来自中国科学院自动化研究所和北京科技大学的联合团队，首次提出了一种全新的3D场景生成框架SceneX，只需简单的文字描述，就能快速生成高质量的3D虚拟场景。

2024 Github 十大最佳 RAG 框架

检索增强生成（RAG）已成为增强大型语言模型能力的一项强大技术。 RAG 框架结合了基于检索的系统和生成模型的优势，可以做出更准确、更能感知上下文和更及时的响应。随着对复杂人工智能解决方案需求的增长，GitHub 上出现了许多开源 RAG 框架，每个框架都具有独特的特性和功能。

我国首台空间站智能助手“小航”进驻空间站：哈工大研制，可协助拍照、情感互动

其目前可以完成拍照、运动等操作，航天员王浩泽通过语音指令让“小航”完成了在空间站内飞行，根据口令上升下降等操作。后续通过升级，“小航”还能实现舱内巡检、物资管理、产品状态检查、答疑解惑等功能。

2024年人工智能的发展趋势

回顾2024年的人工智能领域，我们可以观察到一系列显著的趋势，特别是人工智能助手的广泛应用、人工智能代理的兴起，以及企业在选择人工智能解决方案时所面临的挑战与考量。以下是对行业专家Derek Topp关于这些趋势的深入解读。一、人工智能助手的快速发展在2024年，我们见证了无数供应商竞相发布新产品，旨在创建、部署和维护基于通用人工智能（GenAI）的代理。

10秒极速出片！还有超多特效模版，国产视频模型又整新活了

2025刚开年，没想到国产AI视频模型PixVerse又给咱们整了一波新活！继上次席卷全网的万物皆可毒液之后，它们又火速更新了3.5版本。新模型不仅能10秒光速生成高清视频，而且复杂运动、各种二次元风格也都轻松拿捏——提示：尼克和朱迪（《疯狂动物城》）在森林里一起骑车这次他们还内置了更多有趣的模版：成为肌肉猛男、圣诞礼物盲盒等等，非常适合快速生成短视频。