AMDAI大模型

联想问天WA7785a G3服务器创纪录!单机运行671B DeepSeek大模型吞吐量高达6708token/s!

联想今日宣布，旗下首款 AMD AI 大模型训练服务器——联想问天 WA7785a G3在单机部署671B（满血版） DeepSeek 大模型时，实现了高达6708token/s 的极限吞吐量，再次刷新了单台服务器运行超大规模模型性能的纪录。据介绍，此次性能突破得益于联想万全异构智算平台的强大支持。联想通过访存优化、显存优化、创新的 PCIe5.0全互联架构以及精选 SGLang 框架中的最优算子等一系列创新技术手段，对大模型从预训练、后训练到推理的全流程进行了持续优化。

3/17/2025 2:51:00 PM

AI在线

资讯热榜

Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Ollama 支持全线的 Qwen 3 模型纳米AI发布MCP万能工具箱，简化AI工具集成与调用 AI视频资讯早读！7个产品更新+8个案例精选 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集训练应用大型语言模型科技亚马逊 DeepMind 特斯拉智能体