TheBug95
/

llama-3.2-1B-MS-MARCO-qlora

TheBug95 commited on 12 days ago

Commit

253c702

•

1 Parent(s): a1283e7

Upload README.md with huggingface_hub

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,8 +1,5 @@
----
-{}
----
-# llama-3.2-1B-MS-MARCO-qlora
 Este modelo es una versión afinada del modelo [meta-llama/Llama-3.2-1B](https://huggingface.co/meta-llama/Llama-3.2-1B) utilizando el conjunto de datos MS MARCO para tareas de generación de respuestas.
@@ -41,7 +38,7 @@ Este modelo es una versión afinada del modelo [meta-llama/Llama-3.2-1B](https:/
   - lora_dropout: 0.05
 - **Recursos Computacionales:**
   - Dispositivo: cuda
-  - Memoria GPU utilizada: A100
 ## Resultados
@@ -61,5 +58,5 @@ Para utilizar este modelo, puedes cargarlo de la siguiente manera:
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
-model = AutoModelForCausalLM.from_pretrained('TheBug95/llama-3.2-1B-MS-MARCO-qlora')
-tokenizer = AutoTokenizer.from_pretrained('TheBug95/llama-3.2-1B-MS-MARCO-qlora')

+# llama-3.2-1B-MS-MARCO-QLoRA
 Este modelo es una versión afinada del modelo [meta-llama/Llama-3.2-1B](https://huggingface.co/meta-llama/Llama-3.2-1B) utilizando el conjunto de datos MS MARCO para tareas de generación de respuestas.
   - lora_dropout: 0.05
 - **Recursos Computacionales:**
   - Dispositivo: cuda
+  - Memoria GPU utilizada: A100(40gb)
 ## Resultados
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
+model = AutoModelForCausalLM.from_pretrained('TheBug95/llama-3.2-1B-MS-MARCO-QLoRA')
+tokenizer = AutoTokenizer.from_pretrained('TheBug95/llama-3.2-1B-MS-MARCO-QLoRA')