xyzmean
/

llama-8B-ru

Text Generation

Model card Files Files and versions Community

xyzmean commited on Feb 15

Commit

a3e9c7f

·

verified ·

1 Parent(s): f1c4bfe

Update README.md

Files changed (1) hide show

README.md +45 -14

README.md CHANGED Viewed

@@ -1,22 +1,53 @@
 ---
-base_model: stepenZEN/DeepSeek-R1-Distill-Llama-8B-Abliterated
-tags:
-- text-generation-inference
-- transformers
-- unsloth
-- llama
-- gguf
-license: apache-2.0
 language:
 - en
 ---
-# Uploaded  model
-- **Developed by:** xyzmean
-- **License:** apache-2.0
-- **Finetuned from model :** stepenZEN/DeepSeek-R1-Distill-Llama-8B-Abliterated
-This llama model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library.
-[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)

 ---
 language:
+- ru
 - en
+license: mit
+tags:
+- chat
+- instruct
+- distilled
+- QA
+pipeline_tag: text-generation
+datasets:
+- d0rj/ru-instruct
+base_model:
+- stepenZEN/DeepSeek-R1-Distill-Llama-8B-Abliterated
 ---
+# DeepSeek-R1-Distill-Llama-8B-Abliterated-RU
+[![Hugging Face Spaces](https://img.shields.io/badge/%F0%9F%A4%97%20Hugging%20Face-Model-blue)](https://huggingface.co/stepenZEN/DeepSeek-R1-Distill-Llama-8B-Abliterated)
+Модель представляет собой дообученную версию DeepSeek-R1-Distill-Llama-8B-Abliterated:cite[10] на русскоязычном синтетическом датасете инструкций.
+## Особенности
+1. **Базовая архитектура**: Основана на Llama-8B с дистилляцией знаний от DeepSeek-R1:cite[3]:cite[6]
+2. **Дообучение**: Адаптация под русский язык через датасет ru-instruct (800k+ примеров)
+3. **Оптимизация**:
+   - Удаление артефактов перевода через модель Den4ikAI/nonsense_gibberish_detector:cite[8]
+   - Дедупликация методом SimHash
+4. **Мультидоменность**: Поддержка математических расчётов, программирования и QA:cite[8]
+## Датасет обучения
+Комбинация 7 переведённых датасетов:
+| Источник | Описание |
+|----------|----------|
+| OpenOrca-ru | 1.2M диалогов с детализированными ответами |
+| OpenHermes-2.5-ru | Инструкции для сложных задач |
+| Dolphin-ru | Мультизадачные инструкции |
+| GSM8k-ru | Математические задачи |
+| Boolq-ru | Вопросы с ответами Да/Нет |
+| Conala-mined-ru | Python-сниппеты |
+| Alpaca-cleaned-ru | Общие инструкции |
+**Формат данных**:
+```python
+{
+    "conversations": [
+        {"role": "system", "content": "..."},
+        {"role": "user", "content": "..."},
+        {"role": "assistant", "content": "..."}
+    ],
+    "source": "название_датасета"
+}