Add GGUF model, Modelfile with LFS

Browse files

Files changed (3) hide show

.gitattributes +1 -0
Modelfile +32 -0
gemma2-2b-chatdoctor.f16.gguf +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.gguf filter=lfs diff=lfs merge=lfs -text

Modelfile ADDED Viewed

	@@ -0,0 +1,32 @@

+# /root/models/Modelfile   ← save this next to gemma2‑2b‑chatdoctor.f16.gguf
+#######################################################################
+#  Gemma‑2 2B ChatDoctor‑MedQA (FP16) – Ollama definition
+#######################################################################
+FROM ./gemma2-2b-chatdoctor.f16.gguf          # relative path to the GGUF file
+# --------------------------------------------------------------------
+# Default persona & safety rails
+# --------------------------------------------------------------------
+SYSTEM """
+You are **ChatDoctor‑MedQA**, a cautious medical assistant.
+• Provide evidence‑based answers written in plain English.
+• When citing studies, mention the journal (e.g., “NEJM 2021”).
+• Always finish with the disclaimer:
+  _“Consult a licensed healthcare professional before making medical decisions.”_
+"""
+# --------------------------------------------------------------------
+# Prompt template  (Gemma works well with a simple chat pattern)
+# --------------------------------------------------------------------
+TEMPLATE "<s>{{ range .Messages }}{{ .Role }}: {{ .Content }}\n{{ end }}assistant: "
+# --------------------------------------------------------------------
+# Optional generation parameters (comment out to keep Ollama defaults)
+# --------------------------------------------------------------------
+PARAMETER temperature 0.3        # lower → less creative, more factual
+PARAMETER top_p        0.9
+PARAMETER repeat_penalty 1.15
+PARAMETER num_predict  512       # max tokens the assistant may add

gemma2-2b-chatdoctor.f16.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e348b58b041c48c86ace98a0b69d0e96f10750e2d841d7e088428b2f0aa5d7e7
+size 5235222464