Spaces:

ClinicianFOCUS
/

Clinician-Note

Sleeping

Donald Winkelman commited on 28 days ago

Commit

3264d58

1 Parent(s): 0f1df4e

Updating Side-By-Side Space

Files changed (1) hide show

app.py CHANGED Viewed

@@ -142,8 +142,11 @@ def load_models(progress=None):
         print(f"Loading base model from {BASE_MODEL_PATH}")
         base_model = Llama(
             model_path=BASE_MODEL_PATH,
-            n_ctx=2048,  # Context window size
-            n_threads=4  # Number of CPU threads to use
         )
         # Load novel model
@@ -153,8 +156,11 @@ def load_models(progress=None):
         print(f"Loading novel model from {NOVEL_MODEL_PATH}")
         novel_model = Llama(
             model_path=NOVEL_MODEL_PATH,
-            n_ctx=2048,  # Context window size
-            n_threads=4  # Number of CPU threads to use
         )
         if progress is not None:

         print(f"Loading base model from {BASE_MODEL_PATH}")
         base_model = Llama(
             model_path=BASE_MODEL_PATH,
+            n_ctx=8092,  # Context window size
+            n_threads=4,  # Number of CPU threads to use
+            temperature=0.3,  # Temperature for sampling
+            top_p=0.9,  # Top-p sampling
+            top_k=20,  # Top-k sampling
         )
         # Load novel model
         print(f"Loading novel model from {NOVEL_MODEL_PATH}")
         novel_model = Llama(
             model_path=NOVEL_MODEL_PATH,
+            n_ctx=8092,  # Context window size
+            n_threads=4,  # Number of CPU threads to use
+            temperature=0.3,  # Temperature for sampling
+            top_p=0.9,  # Top-p sampling
+            top_k=20,  # Top-k sampling
         )
         if progress is not None: