JetBrains
/

Mellum-4b-base

Text Generation

text-generation-inference

Model card Files Files and versions Community

topshik commited on 6 days ago

Commit

4179e39

·

verified ·

1 Parent(s): bf021d8

Update README.md

Files changed (1) hide show

README.md +2 -3

README.md CHANGED Viewed

@@ -227,7 +227,7 @@ Keep in mind that base model is not fine-tuned for downstream tasks out-of-the-b
 # Training Data
 - Total Training Tokens: ~4.2 trillion tokens
-- Corpus: StackV1, Starcoderdata, StackV2, CommitPack, English wiki
 # Training Details
 - Context Window: 8,192 tokens
@@ -346,8 +346,7 @@ if __name__ == "__main__":
     print(fibonacci(10))
 """
-encoded_input = tokenizer(f"<fim_suffix>suffix<fim_prefix>{prefix}<fim_middle>", return_tensors='pt', return_token_type_ids=False)
-input_len = len(encoded_input["input_ids"][0])
 out = model.generate(
     **encoded_input,
     max_new_tokens=100,

 # Training Data
 - Total Training Tokens: ~4.2 trillion tokens
+- Corpus: The Stack, StarCoder Training Dataset, The Stack v2, CommitPack, English Wikipedia
 # Training Details
 - Context Window: 8,192 tokens
     print(fibonacci(10))
 """
+encoded_input = tokenizer(f"<fim_suffix>{suffix}<fim_prefix>{prefix}<fim_middle>", return_tensors='pt', return_token_type_ids=False)
 out = model.generate(
     **encoded_input,
     max_new_tokens=100,