ai4bharat
/

indictrans2-indic-en-dist-200M

text2text-generation

Model card Files Files and versions Community

pranjalchitale commited on May 17, 2024

Commit

67ac308

·

verified ·

1 Parent(s): 79e484a

Update modeling_indictrans.py

Files changed (1) hide show

modeling_indictrans.py +7 -5

modeling_indictrans.py CHANGED Viewed

@@ -54,11 +54,13 @@ logger = logging.get_logger(__name__)
 INDICTRANS_PRETRAINED_MODEL_ARCHIVE_LIST = [""]
-if is_flash_attn_2_available():
-    from flash_attn import flash_attn_func, flash_attn_varlen_func
-    from flash_attn.bert_padding import index_first_axis, pad_input, unpad_input  # noqa
 # Copied from transformers.models.llama.modeling_llama._get_unpad_data
 def _get_unpad_data(attention_mask):
     seqlens_in_batch = attention_mask.sum(dim=-1, dtype=torch.int32)

 INDICTRANS_PRETRAINED_MODEL_ARCHIVE_LIST = [""]
+try:
+    if is_flash_attn_2_available():
+        from flash_attn import flash_attn_func, flash_attn_varlen_func
+        from flash_attn.bert_padding import index_first_axis, pad_input, unpad_input  # noqa
+except:
+    pass
 # Copied from transformers.models.llama.modeling_llama._get_unpad_data
 def _get_unpad_data(attention_mask):
     seqlens_in_batch = attention_mask.sum(dim=-1, dtype=torch.int32)