Sakana AI发布“AI CUDA工程师”：自动化优化CUDA内核，速度提升高达100倍

2025-02-21 05:26

日本人工智能初创公司Sakana AI宣布推出“AI CUDA工程师”（AI CUDA Engineer），这一创新性的AI智能体系统旨在自动化生产高度优化的CUDA内核，显著提升机器学习操作的运行效率。根据X平台上的最新消息，该系统通过进化的大型语言模型(LLM)驱动代码优化技术，将常见PyTorch操作的运行速度提高了10至100倍，标志着AI技术在GPU性能优化领域的重大突破。 Sakana AI表示，CUDA内核作为GPU计算的核心，直接编写和优化通常需要深厚的专业知识和高技术门槛，而现有框架如PyTorch虽然使用便捷，但在性能上往往无法与手动优化的内核媲美。

Sakana AI表示，CUDA内核作为GPU计算的核心，直接编写和优化通常需要深厚的专业知识和高技术门槛，而现有框架如PyTorch虽然使用便捷，但在性能上往往无法与手动优化的内核媲美。“AI CUDA工程师”通过智能化的工作流程解决了这一难题:它不仅能将PyTorch代码自动转化为高效的CUDA内核，还通过进化算法进行性能调优，甚至能融合多个内核以进一步提升运行时效率。

X用户@shao__meng将这一技术比喻为“给AI开发装上了自动变速箱”，让普通代码能够“自动升级为赛车级性能”。另一位用户@FinanceYF5也在帖子中指出，该系统的推出展示了AI自优化的潜力，可能为未来的计算资源使用效率带来革命性提升。

Sakana AI此前已因“AI Scientist”等项目在业界崭露头角，此次“AI CUDA工程师”的发布进一步凸显了其在AI自动化领域的雄心。公司声称，该系统已成功生成并验证了超过17，000个CUDA内核，覆盖多种PyTorch操作，且公开的数据集将为研究人员和开发者提供宝贵资源。业内人士认为，这一技术不仅降低了高性能GPU编程的门槛，还可能推动人工智能模型的训练和部署效率迈上新台阶。

信息参考：https://x.com/FinanceYF5/status/1892856847780237318

Sakana AI 的 Transformer² 模型突破 LLM 限制，实现动态推理

Sakana AI 是一家专注于自然启发算法的人工智能研究实验室，近日推出了一种名为 Transformer² （Transformer-squared）的创新自适应语言模型。该模型无需昂贵的微调，即可在推理过程中动态学习并适应新任务，这标志着大型语言模型 (LLM) 技术发展的重要一步。 Transformer² 的核心创新在于其独特的两步动态权重调整机制。

1/24/2025 10:48:00 AM

AI在线

惊人突破！AI撰写的论文成功骗过人类专家评审

Sakana AI最新研发的AI Scientist-v2模型完成了一项令人瞠目结舌的壮举——它独立创作了一篇完整的科学论文，从构思到完稿全程无人类参与，更令人惊讶的是，这篇论文竟然顺利通过了ICLR2025研讨会的双盲同行评审，成功骗过了人类专家的火眼金睛。这篇AI生成的论文完全实现了端到端的自主创作，Sakana AI确认整个过程未经任何人类修改。 AI Scientist-v2展现了令人难以置信的全面能力——它独立提出科学假设，设计实验方案，编写并优化实验代码，执行实验，分析数据，制作可视化图表，并撰写了从标题到参考文献的每一个字符，甚至包括排版和格式处理。

3/17/2025 10:28:00 AM

AI在线

黑客利用 “损坏” pickle 文件在 HuggingFace 上传恶意 AI 模型

近日，网络安全研究人员发现，在知名机器学习平台 HuggingFace 上，有两个恶意的机器学习模型悄然上传。这些模型使用了一种新奇的技术，通过 “损坏” 的 pickle 文件成功规避了安全检测，令人担忧。 ReversingLabs 的研究员卡洛・赞基（Karlo Zanki）指出，从这些 PyTorch 格式的存档中提取的 pickle 文件开头，暗示了其中包含恶意的 Python 代码。

2/10/2025 11:11:00 AM

AI在线

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

Sakana AI发布“AI CUDA工程师”：自动化优化CUDA内核，速度提升高达100倍

相关资讯

Sakana AI 的 Transformer² 模型突破 LLM 限制，实现动态推理

惊人突破！AI撰写的论文成功骗过人类专家评审

黑客利用 “损坏” pickle 文件在 HuggingFace 上传恶意 AI 模型