有人跑成功了吗, 用的什么配置跑的
#58
by
xl343
- opened
有人跑成功了吗, 用的什么配置跑的
同问,8bit量化后,需要多少显存?
可以的两台H20
可以的两台H20
多少token/s?速度可以?和官方评测有差距没有?谢谢
是不是超过16个GPU就没法跑了,我看他 convert.py 脚本的参数 --model-parallel 设置超过16就报错
有人跑成功了吗, 用的什么配置跑的
同问,8bit量化后,需要多少显存?
可以的两台H20
可以的两台H20
多少token/s?速度可以?和官方评测有差距没有?谢谢
是不是超过16个GPU就没法跑了,我看他 convert.py 脚本的参数 --model-parallel 设置超过16就报错