Update README.md (#11)

Files changed (1) hide show

README.md CHANGED Viewed

@@ -290,7 +290,7 @@ YaRN is currently supported by several inference frameworks, e.g., `transformers
   For `vllm`, you can use
     ```shell
-    vllm serve ... --rope-scaling '{"type":"rope_type","factor":4.0,"original_max_position_embeddings":32768}' --max-model-len 131072
     ```
   For `sglang`, you can use

   For `vllm`, you can use
     ```shell
+    vllm serve ... --rope-scaling '{"rope_type":"yarn","factor":4.0,"original_max_position_embeddings":32768}' --max-model-len 131072
     ```
   For `sglang`, you can use