mnoukhov
/

SmolLM2-360M-tldr-sft

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

SmolLM2-360M-tldr-sft

1.45 GB

1 contributor

History: 3 commits

mnoukhov's picture

Training in progress, step 912

0529dca verified 10 months ago

.gitattributes

1.52 kB

initial commit 10 months ago
config.json

776 Bytes

Training in progress, step 500 10 months ago
merges.txt

466 kB

Training in progress, step 500 10 months ago
model.safetensors

1.45 GB
xet

Training in progress, step 912 10 months ago
special_tokens_map.json

863 Bytes

Training in progress, step 500 10 months ago
tokenizer.json

3.52 MB

Training in progress, step 500 10 months ago
tokenizer_config.json

3.89 kB

Training in progress, step 500 10 months ago
training_args.bin
Detected Pickle imports (10)
- "torch.device",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.HubStrategy",
- "trl.trainer.sft_config.SFTConfig",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "accelerate.state.PartialState",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.training_args.OptimizerNames",
- "torch.bfloat16",
- "transformers.trainer_utils.SchedulerType"
How to fix it?
5.82 kB
xet

Training in progress, step 500 10 months ago
vocab.json

801 kB

Training in progress, step 500 10 months ago