8张80G显存的8卡A100能部署不？

by Yuxin362 - opened Apr 29

Apr 29

如题

Apr 29

这个显存容量绰绰有余了

Apr 30

可以 sglang跑起来大概80tps输出

Apr 30

用vllm 部署的OOM了，八张80G A100

aaronW

Apr 30

用vllm 部署的OOM了，八张80G A100

同样

bingw5

May 1

用vllm 部署的OOM了，八张80G A100

大概率是你的启动参数设置问题，或者是vllm的bug。640GB应该能轻松运行这个模型。

aaronW

May 6

用vllm 部署的OOM了，八张80G A100

大概率是你的启动参数设置问题，或者是vllm的bug。640GB应该能轻松运行这个模型。

python3 -m sglang.launch_server --model-path Qwen/Qwen3-235B-A22B --reasoning-parser qwen3 --tp 8 --dtype bfloat16
换sglang可以

May 6

vllm 0.8.5 部署 Qwen/Qwen3-235B-A22B 没有oom问题，长度为32k

May 7

我也用的0.8.5.dev476+gd419aa5d似乎不行

May 7

加这个 --gpu-memory-utilization 0.9 参数似乎就好了

24 days ago

我--gpu-memory-utilization 0.85可以

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment