Can't load model with specified revision

by Samoed - opened Feb 15

Feb 15

•

I'm trying to download model with revision, but it produces error

from sentence_transformers import SentenceTransformer
SentenceTransformer("jxm/cde-small-v2", revision="287bf0ea6ebfecf2339762d0ef28fb846959a8f2", trust_remote_code=True)

ValueError: Unrecognized model in jxm/cde-small-v2. Should have a `model_type` key in its config.json, or contain one of the following strings in its name: albert, ...

I think this is because revision passed to AutoTokenizer somehow, and revisions in repository with tokenizer is different. Same error with v1 version. I think simplest fix would be to upload tokenizer directly to repo, instead of loading from another repo.

jxm

Owner May 10

I think it works now. Let me know.

jxm changed discussion status to closed May 10

Samoed

May 11

When running this code I recive error

from sentence_transformers import SentenceTransformer
SentenceTransformer("jxm/cde-small-v2", revision="540440034cb82f576344ee108fb5a2860f5b48af", trust_remote_code=True)

  File "/home/samoed/.cache/huggingface/modules/transformers_modules/jxm/cde-small-v2/540440034cb82f576344ee108fb5a2860f5b48af/sentence_transformers_impl.py", line 65, in __init__
    self.tokenizer = AutoTokenizer.from_pretrained(
  File "/home/samoed/Desktop/mteb/orig_mteb/.venv/lib/python3.10/site-packages/transformers/models/auto/tokenization_auto.py", line 966, in from_pretrained
    config = AutoConfig.from_pretrained(
  File "/home/samoed/Desktop/mteb/orig_mteb/.venv/lib/python3.10/site-packages/transformers/models/auto/configuration_auto.py", line 1151, in from_pretrained
    raise ValueError(
ValueError: Unrecognized model in answerdotai/ModernBERT-base. Should have a `model_type` key in its config.json, or contain one of the following strings in its name: albert, align, altclip, aria, aria_text, audio-spectrogram-transformer, autoformer, aya_vision, bamba, bark, bart, beit, bert, bert-generation, big_bird, bigbird_pegasus, biogpt, bit, blenderbot, blenderbot-small, blip, blip-2, bloom, bridgetower, bros, camembert, canine, chameleon, chinese_clip, chinese_clip_vision_model, clap, clip, clip_text_model, clip_vision_model, clipseg, clvp, code_llama, codegen, cohere, cohere2, colpali, conditional_detr, convbert, convnext, convnextv2, cpmant, ctrl, cvt, dab-detr, dac, data2vec-audio, data2vec-text, data2vec-vision, dbrx, deberta, deberta-v2, decision_transformer, deepseek_v3, deformable_detr, deit, depth_anything, depth_pro, deta, detr, diffllama, dinat, dinov2, dinov2_with_registers, distilbert, donut-swin, dpr, dpt, efficientformer, efficientnet, electra, emu3, encodec, encoder-decoder, ernie, ernie_m,

This happens because in https://huggingface.co/jxm/cde-small-v2/blob/main/sentence_transformers_impl.py#L65 Tokenizer is taken from answerdotai/ModernBERT-base

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment