hazyresearch
/

qwen-ot3-8k-qwq-1-5b

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

qwen-ot3-8k-qwq-1-5b / checkpoint-1563 /global_step1562

18.5 GB

1 contributor

History: 1 commit

RZ412's picture

Add files using upload-large-folder tool

9935681 verified 15 days ago

bf16_zero_pp_rank_0_mp_rank_00_optim_states.pt
Detected Pickle imports (7)
- "deepspeed.runtime.zero.config.ZeroStageEnum",
- "torch.FloatStorage",
- "torch._tensor._rebuild_from_type_v2",
- "deepspeed.runtime.fp16.loss_scaler.LossScaler",
- "torch.Tensor",
- "collections.OrderedDict",
- "torch._utils._rebuild_tensor_v2"
How to fix it?
9.26 GB
xet

Add files using upload-large-folder tool 15 days ago
bf16_zero_pp_rank_1_mp_rank_00_optim_states.pt
Detected Pickle imports (7)
- "deepspeed.runtime.zero.config.ZeroStageEnum",
- "torch.FloatStorage",
- "torch._tensor._rebuild_from_type_v2",
- "deepspeed.runtime.fp16.loss_scaler.LossScaler",
- "torch.Tensor",
- "collections.OrderedDict",
- "torch._utils._rebuild_tensor_v2"
How to fix it?
9.26 GB
xet

Add files using upload-large-folder tool 15 days ago
zero_pp_rank_0_mp_rank_00_model_states.pt
Detected Pickle imports (5)
- "torch._utils._rebuild_tensor_v2",
- "collections.OrderedDict",
- "__builtin__.set",
- "torch.Size",
- "torch.BFloat16Storage"
How to fix it?
165 kB
xet

Add files using upload-large-folder tool 15 days ago
zero_pp_rank_1_mp_rank_00_model_states.pt
Detected Pickle imports (5)
- "torch._utils._rebuild_tensor_v2",
- "collections.OrderedDict",
- "__builtin__.set",
- "torch.Size",
- "torch.BFloat16Storage"
How to fix it?
165 kB
xet

Add files using upload-large-folder tool 15 days ago