
Qwen/Qwen3-4B-Instruct-2507
Text Generation
•
4B
•
Updated
•
126k
•
•
209
Note ./build/bin/llama-server -hf Qwen/Qwen3-Embedding-4B-GGUF:Q6_K --port 8080 --pooling last --verbose-prompt --parallel 4 --batch-size 8 --embedding --ctx-size 8000 --cache-type-k q4_0 --gpu-layers 36