alvarobartt
/

lince-zero-7b-GGUF

Text Generation

GGUF

Spanish

falcon-fine-tune

llama.cpp

lince-zero-quantized

Model card Files Files and versions Community

alvarobartt HF Staff commited on Nov 1, 2023

Commit

9fefb4e

1 Parent(s): 5aca23c

Update README.md

Browse files

Files changed (1) hide show

README.md +4 -3

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ quantized_by: alvarobartt
 # Model Card for LINCE-ZERO-7B-GGUF
-[LINCE-ZERO]https://huggingface.co/clibrain/lince-zero) is a fine-tuned LLM for instruction following of [Falcon 7B](https://huggingface.co/tiiuae/falcon-7b). The team/org leading the fine-tune is [Clibrain](https://huggingface.co/clibrain), and the datasets used are both [Alpaca](https://huggingface.co/datasets/tatsu-lab/alpaca) and [Dolly](https://huggingface.co/datasets/databricks/databricks-dolly-15k) datasets, both translated into Spanish and augmented to 80k examples (as Clibrain claims in its [model card](https://huggingface.co/clibrain/lince-zero#model-card-for-lince-zero)).
 This model contains the quantized variants using the GGUF format, introduced by the [llama.cpp](https://github.com/ggerganov/llama.cpp) team.
@@ -33,7 +33,7 @@ Some curious may ask, why don't you just use [TheBloke/lince-zero-GGUF](https://
 ### Model Description
 - **Model type:** Falcon
-- **Finetuned from model:** [Falcon 7B](https://huggingface.co/tiiuae/falcon-7b)
 - **Created by**: [TIIUAE](https://huggingface.co/tiiuae)
 - **Fine-tuned by:** [Clibrain](https://huggingface.co/clibrain)
 - **Quantized by:** [alvarobartt](https://huggingface.co/alvarobartt)
@@ -52,7 +52,8 @@ Some curious may ask, why don't you just use [TheBloke/lince-zero-GGUF](https://
 | [lince-zero-7b-q4_k_m.gguf](https://huggingface.co/alvarobartt/lince-zero-7b-GGUF/blob/main/lince-zero-7b-q4_k_m.gguf) | Q4_K_M | 4 | 7.87 GB| 10.37 GB | medium, balanced quality - recommended |
 | [lince-zero-7b-q5_k_s.gguf](https://huggingface.co/alvarobartt/lince-zero-7b-GGUF/blob/main/lince-zero-7b-q5_k_s.gguf) | Q5_K_S | 5 | 8.97 GB| 11.47 GB | large, low quality loss - recommended |
 | [lince-zero-7b-q5_k_m.gguf](https://huggingface.co/alvarobartt/lince-zero-7b-GGUF/blob/main/lince-zero-7b-q5_k_m.gguf) | Q5_K_M | 5 | 9.23 GB| 11.73 GB | large, very low quality loss - recommended |
-**Note*
 ## Uses

 # Model Card for LINCE-ZERO-7B-GGUF
+[LINCE-ZERO](https://huggingface.co/clibrain/lince-zero) is a fine-tuned LLM for instruction following of [Falcon 7B](https://huggingface.co/tiiuae/falcon-7b). The team/org leading the fine-tune is [Clibrain](https://huggingface.co/clibrain), and the datasets used are both [Alpaca](https://huggingface.co/datasets/tatsu-lab/alpaca) and [Dolly](https://huggingface.co/datasets/databricks/databricks-dolly-15k) datasets, both translated into Spanish and augmented to 80k examples (as Clibrain claims in its [model card](https://huggingface.co/clibrain/lince-zero#model-card-for-lince-zero)).
 This model contains the quantized variants using the GGUF format, introduced by the [llama.cpp](https://github.com/ggerganov/llama.cpp) team.
 ### Model Description
 - **Model type:** Falcon
+- **Fine-tuned from model:** [Falcon 7B](https://huggingface.co/tiiuae/falcon-7b)
 - **Created by**: [TIIUAE](https://huggingface.co/tiiuae)
 - **Fine-tuned by:** [Clibrain](https://huggingface.co/clibrain)
 - **Quantized by:** [alvarobartt](https://huggingface.co/alvarobartt)
 | [lince-zero-7b-q4_k_m.gguf](https://huggingface.co/alvarobartt/lince-zero-7b-GGUF/blob/main/lince-zero-7b-q4_k_m.gguf) | Q4_K_M | 4 | 7.87 GB| 10.37 GB | medium, balanced quality - recommended |
 | [lince-zero-7b-q5_k_s.gguf](https://huggingface.co/alvarobartt/lince-zero-7b-GGUF/blob/main/lince-zero-7b-q5_k_s.gguf) | Q5_K_S | 5 | 8.97 GB| 11.47 GB | large, low quality loss - recommended |
 | [lince-zero-7b-q5_k_m.gguf](https://huggingface.co/alvarobartt/lince-zero-7b-GGUF/blob/main/lince-zero-7b-q5_k_m.gguf) | Q5_K_M | 5 | 9.23 GB| 11.73 GB | large, very low quality loss - recommended |
+**Note**: the above RAM figures assume no GPU offloading. If layers are offloaded to the GPU, this will reduce RAM usage and use VRAM instead.
 ## Uses