Skywork
/

SkyworkVL-38B

Image-Text-to-Text

Model card Files Files and versions

jiangbop commited on Mar 17

Commit

48da830

·

verified ·

1 Parent(s): a6a9fd8

Update modeling_skywork_lm2.py

Files changed (1) hide show

modeling_skywork_lm2.py +2 -2

modeling_skywork_lm2.py CHANGED Viewed

@@ -600,7 +600,7 @@ class SkyworkLM2FlashAttention2(SkyworkLM2Attention):
         )
-INTERNLM2_ATTENTION_CLASSES = {
     'eager': SkyworkLM2Attention,
     'flash_attention_2': SkyworkLM2FlashAttention2,
 }
@@ -612,7 +612,7 @@ class SkyworkLM2DecoderLayer(nn.Module):
         super().__init__()
         self.hidden_size = config.hidden_size
-        self.attention = INTERNLM2_ATTENTION_CLASSES[config.attn_implementation](config=config)
         self.feed_forward = SkyworkLM2MLP(config)
         self.attention_norm = SkyworkLM2RMSNorm(config.hidden_size, eps=config.rms_norm_eps)

         )
+LM2_ATTENTION_CLASSES = {
     'eager': SkyworkLM2Attention,
     'flash_attention_2': SkyworkLM2FlashAttention2,
 }
         super().__init__()
         self.hidden_size = config.hidden_size
+        self.attention = LM2_ATTENTION_CLASSES[config.attn_implementation](config=config)
         self.feed_forward = SkyworkLM2MLP(config)
         self.attention_norm = SkyworkLM2RMSNorm(config.hidden_size, eps=config.rms_norm_eps)