alirezamsh
/

small100

text2text-generation

gsarti/flores_101

Model card Files Files and versions

alirezamsh commited on Nov 30, 2022

Commit

b5bfb10

·

1 Parent(s): 57098db

Update README.md

Files changed (1) hide show

README.md +4 -2

README.md CHANGED Viewed

@@ -147,6 +147,8 @@ Training data can be provided upon request.
 - **Generation**
 ```
 from transformers import M2M100ForConditionalGeneration
 from tokenization_small100 import SMALL100Tokenizer
@@ -160,14 +162,14 @@ tokenizer = SMALL100Tokenizer.from_pretrained("alirezamsh/small100")
 # translate Hindi to French
 tokenizer.tgt_lang = "fr"
 encoded_hi = tokenizer(hi_text, return_tensors="pt")
-generated_tokens = model.generate(**encoded_hi)
 tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 # => "La vie est comme une boîte de chocolat."
 # translate Chinese to English
 tokenizer.tgt_lang = "en"
 encoded_zh = tokenizer(chinese_text, return_tensors="pt")
-generated_tokens = model.generate(**encoded_zh)
 tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 # => "Life is like a box of chocolate."
 ```

 - **Generation**
+Beam size of 5, and maximum target length of 256 is used for the generation.
 ```
 from transformers import M2M100ForConditionalGeneration
 from tokenization_small100 import SMALL100Tokenizer
 # translate Hindi to French
 tokenizer.tgt_lang = "fr"
 encoded_hi = tokenizer(hi_text, return_tensors="pt")
+generated_tokens = model.generate(**encoded_hi, max_length=256, num_beams=5)
 tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 # => "La vie est comme une boîte de chocolat."
 # translate Chinese to English
 tokenizer.tgt_lang = "en"
 encoded_zh = tokenizer(chinese_text, return_tensors="pt")
+generated_tokens = model.generate(**encoded_zh, max_length=256, num_beams=5)
 tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 # => "Life is like a box of chocolate."
 ```