CommVQ - a senfu Collection

Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

senfu 's Collections

ToP

Budget Guidance

CommVQ

CommVQ

updated Jun 9

CommVQ: Commutative Vector Quantization for KV Cache Compression

senfu/Llama-3.1-8B-Instruct-CommVQ-2bit

9B • Updated Jun 5 • 7
senfu/Llama-3.1-8B-Instruct-CommVQ-1bit

8B • Updated Jun 9 • 7
senfu/Llama-3.1-8B-Instruct-CommVQ-1bit-codebook

Updated Jun 9
senfu/Llama-3.1-8B-Instruct-CommVQ-2bit-codebook

Updated Jun 9

Collection guide
Browse collections

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs