Upload folder using huggingface_hub (#5)

- 76b6c647c4c2fff8e93f4490283f0d13ffc8dd9a067f661e01ebb44c50f4acc3 (4c7c49b8f8e0064b5662cd9ec6c29e965c0e8ace)

Files changed (2) hide show

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "/tmp/models/tmpadsvgufkzpb0zlb1",
   "architectures": [
     "LlamaForCausalLM"
   ],
@@ -43,9 +43,14 @@
   "tie_word_embeddings": true,
   "torch_dtype": "bfloat16",
   "transformers.js_config": {
     "kv_cache_dtype": {
       "fp16": "float16",
       "q4f16": "float16"
     }
   },
   "transformers_version": "4.48.2",

 {
+  "_name_or_path": "/tmp/models/tmpu0f8olx6jfurqg9s",
   "architectures": [
     "LlamaForCausalLM"
   ],
   "tie_word_embeddings": true,
   "torch_dtype": "bfloat16",
   "transformers.js_config": {
+    "dtype": "q4",
     "kv_cache_dtype": {
       "fp16": "float16",
       "q4f16": "float16"
+    },
+    "use_external_data_format": {
+      "model.onnx": true,
+      "model_fp16.onnx": true
     }
   },
   "transformers_version": "4.48.2",

smash_config.json CHANGED Viewed

@@ -15,7 +15,7 @@
     "quant_llm-int8_weight_bits": 4,
     "max_batch_size": 1,
     "device": "cuda",
-    "cache_dir": "/tmp/models/tmpadsvgufk",
     "task": "",
     "save_load_fn": "llm-int8",
     "save_load_fn_args": {},

     "quant_llm-int8_weight_bits": 4,
     "max_batch_size": 1,
     "device": "cuda",
+    "cache_dir": "/tmp/models/tmpu0f8olx6",
     "task": "",
     "save_load_fn": "llm-int8",
     "save_load_fn_args": {},