justinj92
/

Delphermes-8B-cpt-epoch2

Text Generation

text-generation-inference

Model card Files Files and versions

justinj92 commited on Jul 22

Commit

bb92f5b

·

verified ·

1 Parent(s): d8620be

Update README.md

Files changed (1) hide show

README.md +8 -6

README.md CHANGED Viewed

@@ -1,6 +1,5 @@
 ---
 language:
-- ml
 - en
 base_model: Qwen/Qwen3-8B
 library_name: transformers
@@ -11,18 +10,21 @@ tags:
 - lora
 - merged
 license: apache-2.0
 ---
 # Delphermes-8B-cpt-epoch2
-This is a merged LoRA model based on Qwen/Qwen3-8B, fine-tuned for Malayalam language tasks.
 ## Model Details
 - **Base Model**: Qwen/Qwen3-8B
-- **Language**: Malayalam (ml), English (en)
 - **Type**: Merged LoRA model
-- **Library**: transformers
 ## Usage
@@ -39,7 +41,7 @@ model = AutoModelForCausalLM.from_pretrained(
 )
 # Example usage
-text = "നമസ്കാരം"
 inputs = tokenizer(text, return_tensors="pt")
 outputs = model.generate(**inputs, max_length=100)
 response = tokenizer.decode(outputs[0], skip_special_tokens=True)
@@ -48,4 +50,4 @@ print(response)
 ## Training Details
-This model was created by merging a LoRA adapter trained for Malayalam language understanding and generation.

 ---
 language:
 - en
 base_model: Qwen/Qwen3-8B
 library_name: transformers
 - lora
 - merged
 license: apache-2.0
+datasets:
+- NousResearch/Hermes-3-Dataset
+- QuixiAI/dolphin
 ---
 # Delphermes-8B-cpt-epoch2
+This is a merged LoRA model based on Qwen/Qwen3-8B, fine-tuned using Hermes3 & Dolphin synth data.
 ## Model Details
 - **Base Model**: Qwen/Qwen3-8B
+- **Language**: English (en)
 - **Type**: Merged LoRA model
+- **Library**: transformers, axolotl
 ## Usage
 )
 # Example usage
+text = "Who are you?"
 inputs = tokenizer(text, return_tensors="pt")
 outputs = model.generate(**inputs, max_length=100)
 response = tokenizer.decode(outputs[0], skip_special_tokens=True)
 ## Training Details
+This model was created by merging a LoRA adapter trained for understanding and generation.