AI模型

胜过Transformer？谷歌推出新型AI模型架构Titans

自2017年推出以来，Transformer模型架构一直是人工智能的基础要素，推动了自然语言处理、机器翻译等领域的进步。不过，该模型在可扩展性、计算效率以及应对日益复杂任务等方面，仍面临着诸多挑战。而Titans模型架构的诞生，旨在通过整合受人类认知过程启发的机制来克服这些障碍，如记忆优先级和适应性注意力。

OpenAI 新福利：ChatGPT 用户可免费体验o3-mini

近日，OpenAI 的首席执行官阿尔特曼宣布，新的推理 AI 模型 o3-mini 将于近期正式向 ChatGPT 用户推出，涵盖免费和付费用户。这一新模型是 o1推理模型的继任者，经过自去年12月内测以来的持续优化，旨在为用户提供更加高效、易用且经济的高级推理 AI 服务。 o3-mini 模型在特定任务的微调上取得了显著进展，使得其在处理各种复杂问题时，能够更快速、更准确地响应用户需求。

发烧友！一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek

最近，一位软件工程师安纳奈・阿罗拉（Ananay Arora）以 “不到一顿 Chipotle 餐” 的价格购买了域名 OGOpenAI.com，并将其重定向至中国的 AI 实验室 DeepSeek。这个决定引发了许多人的关注，因为 DeepSeek 近期在开源 AI 领域中取得了显著进展，成为了热议的话题。 DeepSeek 发布的 AI 模型在技术上与早期的 OpenAI 模型相似，能够离线使用，并且任何具备相应硬件的开发者都可以免费使用。

Hugging Face 推出小巧AI模型，助力设备性能提升

近期，人工智能开发平台 Hugging Face 团队发布了两款新型 AI 模型，SmolVLM-256M 和 SmolVLM-500M。他们自信地声称，这两款模型是目前为止体积最小的 AI 模型，能够同时处理图像、短视频和文本数据，尤其适合内存少于1GB 的设备如笔记本电脑。这一创新让开发者在处理大量数据时，能够以更低的成本实现更高的效率。

人工智能席卷华尔街，高盛为其员工推出了AI助手

华尔街在人工智能技术的应用上走在了前沿，尤其是生成式人工智能的迅猛发展。高盛近日宣布推出一款名为 “GS AI 助手” 的生成式 AI 工具，旨在帮助其银行家、交易员和资产经理更高效地完成工作。这一工具目前已向约1万名员工推出，预计在今年内将覆盖所有知识工作者。

DeepSeek新AI模型有多震撼？外媒：相当于30美元iPhone降临

DeepSeek（深度求索）再次推出新版开源AI模型，它的性能与美国最先进的AI模型虽然还有一些差距，但差距极小，成本低很多很多。西方许多人认为，美国限制中国AI发展的企图遇挫，中国正在加速前进，以更高效率打造高端AI模型。去年12月，杭州幻方量化推出DeepSeekV3开源大语言模型，它的性能与OpenAI 40和Anthropic Claude 3.5 .

Sam Altman称OpenAI将在几周内发布推理AI模型o3-mini

为了在人工智能技术竞赛中保持领先地位，OpenAI现在已经准备好了最新的人工智能模型，名为“o3-mini”该公司已经完成了其最新推理AI模型的第一个版本，OpenAI首席执行官Sam Altman在他的X帖子中证实了这一点。经过外部安全研究人员的测试，新模型将在几周内推出。值得注意的是，在2024年12月，ChatGPT制造商正式宣布开发和测试其先进的推理模型——o3和o3-mini。

英伟达发布 6.3 万亿 Token 大型 AI 训练数据库 Nemotron-CC

据英伟达官方博客，英伟达宣布推出一款名为 Nemotron-CC 的大型英文 AI 训练数据库，总计包含 6.3 万亿个 Token，其中 1.9 万亿为合成数据。英伟达声称该训练数据库可以帮助为学术界和企业界进一步推动大语言模型的训练过程。

如何使用基于AI的 Suno创作自己的音乐？

译者 | 布加迪审校 | 重楼Suno将使用其AI技能根据你对音乐的特定流派和主题的描述来创作歌曲。你可能已经使用生成式AI来创建文本、图像甚至视频，但有没有用它来创作自己的音乐呢？几种不同的文本转音乐工具可以充当虚拟作曲家，不过值得一试的此类工具是Suno。

一文看懂推理并行的定义及其工作原理

译者 | 布加迪审校 | 重楼近年来，我们见证了两个反复出现的趋势：发布的GPU功能越来越强大，以及拥有数十亿、乃至数万亿个参数和加长型上下文窗口的大语言模型（LLM）层出不穷。许多企业正在利用这些LLM，或进行微调，或使用RAG构建具有特定领域知识的应用程序，并将其部署在专用GPU服务器上。现在说到在GPU上部署这些模型，需要注意的一点是模型大小，即相比GPU上的可用内存，将模型加载到GPU内存中所需的空间（用于存储参数和上下文token）实在太大了。

微软发布2025年六大AI预测：AI模型将变得更加强大和有用

微软在2025年对人工智能(AI)的未来做出了六项重要预测，包括AI模型将变得更加强大和有用、AI . Agents将彻底改变工作方式、AI伴侣将支持日常生活、AI资源的利用将更高效、测试与定制是开发AI的关键、AI将加速科学研究突破。以下是微软的预测及其潜在影响的详细解读：一、AI模型将变得更加强大和有用推理效率和功能提升：过去一年中，AI模型在推理效率和功能方面取得了显著进步。

如何在安卓手机上本地安装和运行LLM?

译者 | 布加迪审校 | 重楼了解如何将AI的力量径直带入到你的安卓手机上：没有云，没有互联网，只有纯粹的设备端智能！在安卓手机上本地运行大语言模型（LLM）意味着你可以在不依赖云服务器或互联网连接的情况下访问人工智能（AI）模型。这种本地环境通过确保数据安全、并在设备端来确保隐私。

你永远不应该外包给AI模型的一件事

在这个效率至上、颠覆性创新能一夜之间创造出亿万美元市场的世界里，企业不可避免地将GenAI视为强大的盟友。从OpenAI的ChatGPT生成类似人类的文本，到DALL-E根据提示创作艺术，我们已经窥见了一个未来：机器将与人类并肩创造，甚至引领潮流。为何不将这种趋势延伸到研发(R&D)领域呢?毕竟，AI可以加速创意生成，迭代速度超过人类研究人员，并且可能以惊人的轻松发现“下一个大事件”，对吗?且慢，理论上这一切听起来都很美好，但让我们面对现实：押注GenAI接管你的研发工作，很可能会以重大、甚至灾难性的方式适得其反。