velocity-ai
/

phi-3.5-address-validation-pretrained

Text Classification

classification-inference

text-generation-inference

Model card Files Files and versions

velocity-ai commited on May 25

Commit

80392a5

·

verified ·

1 Parent(s): febdd76

Update code/inference.py

Files changed (1) hide show

code/inference.py +4 -6

code/inference.py CHANGED Viewed

@@ -2,7 +2,7 @@ import os
 import json
 import torch
 import torch.nn as nn
-from transformers import AutoModelForSequenceClassification, AutoTokenizer, AutoConfig
 import logging
 logger = logging.getLogger(__name__)
@@ -42,15 +42,13 @@ def model_fn(model_dir, context=None):
         # Load tokenizer
         tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
-        # Configure model as RoBERTa
         config = AutoConfig.from_pretrained(model_id,
                                           num_labels=2,
-                                          architectures=["RobertaForSequenceClassification"],
-                                          model_type="roberta",
                                           trust_remote_code=True)
-        # Load base model with RoBERTa config
-        base_model = AutoModelForSequenceClassification.from_pretrained(
             model_id,
             config=config,
             torch_dtype=torch.bfloat16 if device.type == 'cuda' else torch.float32,

 import json
 import torch
 import torch.nn as nn
+from transformers import AutoModel, AutoTokenizer, AutoConfig
 import logging
 logger = logging.getLogger(__name__)
         # Load tokenizer
         tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
+        # Load config and specify it's a Phi3Config
         config = AutoConfig.from_pretrained(model_id,
                                           num_labels=2,
                                           trust_remote_code=True)
+        # Load base model
+        base_model = AutoModel.from_pretrained(
             model_id,
             config=config,
             torch_dtype=torch.bfloat16 if device.type == 'cuda' else torch.float32,