ThunderKittens - AI在线

只需百行代码，让H100提速30%，斯坦福开源全新AI加速框架

提高 GPU 利用率，就是这么简单。AI 的快速发展，伴随而来的是大计算量。这就自然而然的引出了一个问题：如何减少 AI 对计算的需求，并提高现有 AI 计算效率。为了回答这一问题，来自斯坦福的研究者在博客《GPUs Go Brrr》中给出了答案。博客地址：：一是硬件真正需要什么？二是如何满足硬件需求？文章用大量篇幅讨论了如何让 GPU 更快的运行，并发布了一个库 ThunderKittens，用户可以很容易地在 CUDA 上编写快速的深度学习内核。其具有以下特点：简单，ThunderKittens 写起来非常简单