树莓派 Zero“硬核改造”：8 年老设备实现本地运行大语言模型

2025-02-18 07:48

越南开发者 Binh Pham 最近尝试使用树莓派 Zero（Raspberry Pi Zero）进行了一项创新实验。他成功地将这款设备改造为一个小型 USB 驱动器，使其能够在本地运行 LLM，无需任何额外设备。

近年来，本地运行大语言模型（LLM）的趋势愈发明显，越来越多的人开始在个人电脑或系统上部署这些模型。

AI在线注意到，越南开发者 Binh Pham 最近尝试使用树莓派 Zero（Raspberry Pi Zero）进行了一项创新实验。他成功地将这款设备改造为一个小型 USB 驱动器，使其能够在本地运行 LLM，无需任何额外设备。这一项目主要得益于 llama.cpp 和 llamafile 的支持，这两者结合了指令集和一系列轻量级软件包，旨在提供一种离线的轻量级聊天机器人体验。

然而，由于树莓派 Zero 已经问世八年，其硬件性能有限，因此将 llama.cpp 移植到该设备并非易事。首先，Pham 将设备连接到 USB 接口，并为其 3D 打印了一个外壳。

在解决了硬件问题后，项目又因树莓派 Zero W 的 512MB 内存限制而变得更加复杂。在尝试将 llama.cpp 编译到该设备时，Pham 遇到了失败，此前也无人尝试在树莓派 Zero 或 One 上编译该软件。

问题的根源在于树莓派 Zero 的 CPU 采用的是 ARMv6 架构。为了克服这一障碍，Pham 不得不对 llama.cpp 的 ARMv8 指令集进行转换，并移除所有基于现代硬件的优化或注释。

在成功修改 llama.cpp 源代码后，Pham 将注意力转向软件的运行和用户体验的优化。他构建了一个基于文本文件输入的 LLM 实现，这些文本文件作为主要的提示，而 LLM 则会根据这些提示生成故事，并以完整的输出文件形式返回。

为了测试性能，Pham 设置了 64 个 token 的限制，并对 15M 到 136M 不等的多个模型进行了基准测试。其中，Tiny15M 模型的每个 token 处理速度为 223 毫秒，而较大的 Lamini-T5-Flan-77M 模型的每个 token 处理速度为 2.5 秒，SmolLM2-136M 模型的每个 token 处理速度为 2.2 秒。

这些 token 处理速度表明，该设备在许多实际应用场景中可能会显得过慢。尽管这一项目具有创新性，但在实际应用中，使用老旧的轻量级硬件运行本地 LLM 并不具备太多实用价值。相比之下，使用更复杂的模型，例如在树莓派 5 上运行 Deepseek，可能会是更好的选择。

乐天发布首款日本大语言模型Rakuten AI 2.0

乐天集团宣布推出其首个日本大语言模型（LLM）和小语言模型(SLM)，命名为Rakuten AI2.0和Rakuten AI2.0mini。这两款模型的发布旨在推动日本的人工智能（AI）发展。 Rakuten AI2.0基于混合专家(MoE)架构，是一款8x7B 的模型，由八个各自拥有70亿参数的模型组成，每个模型充当一个专家。

2/13/2025 2:38:00 PM

AI在线

衡水家长怒批双休是胡搞时，美国正用AI挽救崩溃少年

AI好好用报道编辑：Sia这些少年们或许正在经历数字时代最温柔的守夜。要不说，还得是衡水的中学。每上一次热搜，都有点「语不惊人死不休」的气势。

3/3/2025 9:49:00 PM

AI好好用

智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型

智谱技术团队宣布开源32B 和9B 系列的 GLM（General Language Model）模型，并正式上线了全新的交互体验平台 Z.ai。这一系列模型包括基座模型、推理模型和沉思模型，均遵循宽松的 MIT 许可协议，为开发者提供了极大的使用和开发自由度，可免费用于商业用途和自由分发。此次开源的32B 基座模型 GLM-4-32B-0414拥有320亿参数，利用15T 高质量数据进行预训练，特别纳入了丰富的推理类合成数据。

4/15/2025 10:01:27 AM

AI在线

资讯热榜

Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Ollama 支持全线的 Qwen 3 模型 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度纳米AI发布MCP万能工具箱，简化AI工具集成与调用 AI视频资讯早读！7个产品更新+8个案例精选小米开源“Xiaomi MiMo”大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini 小米首个推理大模型Xiaomi MiMo开源

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能用户开源学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景人形机器人预测百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索驾驶具身智能神器推荐文本 Copilot LLaMA 算力安全视觉视频生成训练干货合集应用大型语言模型科技亚马逊智能体 DeepMind 特斯拉

顶部

树莓派 Zero“硬核改造”：8 年老设备实现本地运行大语言模型

相关资讯

乐天发布首款日本大语言模型Rakuten AI 2.0

衡水家长怒批双休是胡搞时，美国正用AI挽救崩溃少年

智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型