star-kira-instruct-250426
sarashina2.2-3b-insturuct-v0.1に、まんがタイムきらら作品についての合成対話データセットを追加学習させたモデルです。 きらら作品についての知識量が増加しています。 GGUF版はこちら
Datasets
まんがタイムきらら作品の解説記事を用いて、Deepseek-V3-0324を用いて2万件の対話データを合成しました。 wikipedia記事によって合成したデータセットの一部はこちらで公開しています。
その他、こちらのデータセットを利用させていただきました。
- Kendamarron/jimba-wiki-instruction-calm3
- kanhatakeyama/ramdom-to-fixed-multiturn-Calm3
- Aratako/Synthetic-JP-EN-Coding-Dataset-801k
- SousiOmine/TagInstruct-JP
How to Use
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline, set_seed
# モデルのロード
model_name = "SousiOmine/star-kira-instruct-250426"
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.bfloat16, device_map="auto")
tokenizer = AutoTokenizer.from_pretrained(model_name)
chat_pipeline = pipeline("text-generation", model=model, tokenizer=tokenizer)
set_seed(123)
# ユーザーの入力
user_input = [{"role": "user", "content": "藤川紡がタイムスリップした要因を説明してください"}]
# モデルによる応答生成
responses = chat_pipeline(
user_input,
max_length=500,
do_sample=True,
num_return_sequences=3,
)
# 応答を表示
for i, response in enumerate(responses, 1):
print(f"Response {i}: {response['generated_text']}")
- Downloads last month
- 7
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support
Model tree for SousiOmine/star-kira-instruct-250426
Base model
sbintuitions/sarashina2.2-3b