量化类型是W8A8还是W8A16? 从权重格式上看像A16,因为只看到了weight_scale,如果是A8,麻烦提供/解释 推理时的类型变换
· Sign up or log in to comment