nicolauduran45
/

affilgood-ner-multilingual-v2

Token Classification

Model card Files Files and versions

nicolauduran45 commited on Apr 16

Commit

7c12d9c

·

verified ·

1 Parent(s): bc3f6ef

Upload tokenizer

Files changed (1) hide show

tokenizer_config.json +1 -2

tokenizer_config.json CHANGED Viewed

@@ -1,5 +1,4 @@
 {
-  "add_prefix_space": true,
   "added_tokens_decoder": {
     "0": {
       "content": "<s>",
@@ -46,11 +45,11 @@
   "clean_up_tokenization_spaces": true,
   "cls_token": "<s>",
   "eos_token": "</s>",
   "mask_token": "<mask>",
   "model_max_length": 512,
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "tokenizer_class": "XLMRobertaTokenizer",
-  "trim_offsets": true,
   "unk_token": "<unk>"
 }

 {
   "added_tokens_decoder": {
     "0": {
       "content": "<s>",
   "clean_up_tokenization_spaces": true,
   "cls_token": "<s>",
   "eos_token": "</s>",
+  "extra_special_tokens": {},
   "mask_token": "<mask>",
   "model_max_length": 512,
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "tokenizer_class": "XLMRobertaTokenizer",
   "unk_token": "<unk>"
 }