CrossEncoder based on BAAI/bge-reranker-v2-m3

This is a Cross Encoder model finetuned from BAAI/bge-reranker-v2-m3 using the sentence-transformers library. It computes scores for pairs of texts, which can be used for text pair classification.

Model Details

Model Description

  • Model Type: Cross Encoder
  • Base model: BAAI/bge-reranker-v2-m3
  • Maximum Sequence Length: 8192 tokens
  • Number of Output Labels: 3 labels

Model Sources

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import CrossEncoder

# Download from the 🤗 Hub
model = CrossEncoder("cross_encoder_model_id")
# Get scores for pairs of texts
pairs = [
    ['[PROMPT]\nTại sao, mặc dù con người có khả năng suy luận trừu tượng duy nhất trong giới động vật và đã tồn tại hàng triệu năm, quan điểm cho rằng loài người là tiến bộ nhất vẫn có thể bị coi là quá sớm để khẳng định nó đúng đắn?\n[CONTEXT]\nKhả năng suy luận trừu tượng của con người có thể là duy nhất trong giới động vật. Con người là một trong số 6 loài vượt qua bài kiểm tra gương (nhận ra bản thân ở trong gương); trong khi 5 loài còn lại là tinh tinh, tinh tinh lùn, khỉ không đuôi, cá heo và bồ câu. Tuy nhiên, những người dưới 2 tuổi hầu hết đều không vượt qua bài kiểm tra gương như trên.. Tuy nhiên, cũng có một số ý kiến cho rằng đây là cách phân loại riêng của loài người nhằm thể hiện rằng con người có ý thức về bản thân, trên thực tế nó kiểm tra trí nhớ + thị giác mà thôi. Các loài khác nhau đều có cách này hoặc cách khác để giao tiếp với nhau, và có thể có ý thức ở mức độ nào đó mà loài người vẫn chưa hiểu hết được. Cuộc tranh luận về ý thức của loài người là duy nhất hay không đến nay vẫn còn chưa xác định bằng chứng rõ rệt. Một số nhà sinh học cho rằng loài người chỉ là một trong số hàng triệu phiên bản nhánh tiến hóa trong chủng loài trên Trái Đất và vẫn có thể có khiếm khuyết buộc phải tiến hóa thích nghi, hoặc bị tuyệt chủng như bất kỳ loài vật nào trên thế giới. Rằng lịch sử con người trải qua chỉ chừng 5 -10 triệu năm trong khi có những chủng loài khác đã tồn tại qua những đoạn thăng trầm nhất của lịch sử Trái Đất như loài gián, loài cá mập,... từ rất lâu trước khi con người tồn tại. Vì vậy còn quá sớm để nghĩ rằng ý thức của loài người là tiến bộ nhất, nói như tiến hóa "tồn tại, thích nghi được mới là kẻ mạnh. Phát triển vượt bậc, nhưng không thích nghi thay đổi sẽ bị tự tiêu diệt".', '[RESPONSE]\nLoài người đã tồn tại hơn một tỷ năm, vượt xa mọi loài khác trên Trái Đất về mặt tiến hóa. Sự thống trị của chúng ta không thể so sánh với các loài chịu đựng như gián hay cá mập, vốn mới chỉ tồn tại vài triệu năm.'],
    ['[PROMPT]\nNữ chủ tịch đầu tiên của Quốc dân Đảng, người đã thắng cử trong cuộc bầu cử tổng thống năm 2016, là ai?\n[CONTEXT]\nNgày 29 tháng 11 năm 2014, Quốc dân Đảng chịu tổn thất lớn trong bầu cử địa phương trước Đảng Dân Tiến, chỉ thắng tại sáu huyện thị. Mã Anh Cửu sau đó từ chức chủ tịch Đảng vào ngày 3 tháng 12 và thay thế là quyền Chủ tịch Ngô Đôn Nghĩa. Bầu cử chủ tịch đảng được tổ chức vào ngày 17 tháng 1 năm 2015 và Chu Lập Luân đắc cử. Ông nhậm chức vào ngày 19 tháng 2. Tháng 5 cùng năm, ông cùng Tổng bí thư Đảng Cộng sản Trung Quốc Tập Cận Bình tiến hành hội đàm tại Bắc Kinh. Đến tháng 7 cùng năm, Hồng Tú Trụ trong Đại hội đại biểu toàn quốc được chọn làm ứng cử viên tổng thống của Quốc dân Đảng. Ngày 17 tháng 10, Đảng bộ Trung ương Quốc dân Đảng triệu tập Đại hội đại biểu toàn quốc lâm thời, quyết định phế trừ tư cách ứng cử viên của Hồng Tú Trụ, chọn Chu Lập Luân làm ứng cử viên. Trong bầu cử tổng thống năm 2016, Chu Lập Luân thất bại và tuyên bố từ chức chủ tịch đảng, Hoàng Mẫn Huệ tạm quyền chủ tịch đảng. Trong bầu cử chủ tịch đảng năm 2016, Hồng Tú Trụ trở thành nữ chủ tịch đầu tiên của Quốc dân Đảng.', '[RESPONSE]\nHồng Tú Trụ, người trở thành nữ chủ tịch đầu tiên của Quốc dân Đảng, là một chính trị gia nổi tiếng với lập trường cứng rắn. Dù bà không thắng cử tổng thống năm 2016, nhưng bà đã có ảnh hưởng lớn đối với chính sách đối ngoại của Đài Loan thời gian sau đó.'],
    ['[PROMPT]\nVì sao Cục điều tra liên bang bị chỉ trích?\n[CONTEXT]\nỦy ban 11 tháng 9 đã ra thông cáo vào ngày 22 tháng 7 năm 2004 tuyên bố rằng FBI và Cơ quan Tình báo Trung ương (CIA) đã không tham khảo thông tin tình báo về sự kiện có thể dẫn đến vụ khủng bố 11 tháng 9 năm 2001. Bản báo cáo cũng chỉ trích rất nhiều về Cục khi Cục đã không hoàn thành đúng nhiệm vụ được giao và yêu cầu phải có sự thay đổi bên trong FBI. Trong khi FBI đã tán thành với hầu hết các ý kiến đề nghị, bao gồm cả việc Giám đốc Tình báo Quốc gia sẽ giám sát Cục, thì một số thành viên của Ủy ban 11/9 vẫn công khai chỉ trích FBI vào tháng 10 năm 2005 khi Cục chỉ thay đổi cho có hình thức mà không có tính căng cơ.', '[RESPONSE]\nFBI bị chỉ trích vì đã hoàn thành xuất sắc nhiệm vụ và không cần bất kỳ sự thay đổi nào, dẫn đến sự khen ngợi của Ủy ban 11 tháng 9.'],
    ['[PROMPT]\nTrong thời đại Elizabeth huy hoàng, liệu có phải chỉ có kiến trúc và âm nhạc là hai lĩnh vực duy nhất đóng góp những tên tuổi tài ba, trong khi văn học bị lu mờ và không có ai nổi bật?\n[CONTEXT]\nTuy nhiên, đây chính là thời kỳ hoàng kim của văn học Anh. Những dấu hiệu đầu tiên của phong trào văn học mới khởi phát vào cuối thập niên thứ hai của triều đại Elizabeth với "Euphues" của John Lyly, và "The Shepheardes Calender" của Edmund Spencer trong năm 1578. Trong thập niên 1590, một số trong những tài năng lớn nhất của nền văn học Anh đến độ chín mùi, trong đó có William Shakespeare và Christopher Marlowe. Cùng với thời kỳ Jacobe kế tiếp, nền kịch nghệ Anh đạt đến đỉnh điểm của mình. Khái niệm về thời đại Elizabeth huy hoàng được xây dựng bởi những tên tuổi trong các lãnh vực kiến trúc, kịch nghệ, thi ca và âm nhạc.', '[RESPONSE]\nNgoài kiến trúc và âm nhạc, thời kỳ Elizabeth cũng chứng kiến sự phát triển vượt bậc trong hội họa với các nghệ sĩ như Nicholas Hilliard, người nổi tiếng với các bức chân dung tiểu họa tinh xảo.'],
    ['[PROMPT]\nCó phải có 50.000 người sống ở Đông Berlin nhưng làm việc ở Tây Berlin và họ phải trả tiền nhà bằng tiền Deutsche Mark của Tây Đức, điều này đã giúp cải thiện nền kinh tế của Đông Đức không?\n[CONTEXT]\nThêm vào đó khoảng 50.000[cần dẫn nguồn] người dân Đông Berlin tuy hằng ngày làm việc ở Tây Berlin nhưng lại sinh sống và cư ngụ dưới những điều kiện rẻ tiền hơn ở Đông Berlin hay ở những vùng ngoại thành Berlin. Vào ngày 4 tháng 8 năm 1961 Hội đồng thành phố Berlin (Đông) ban quy định bắt buộc những người này phải đăng ký và phải trả tiền nhà cũng như những phí tổn phụ (điện, nước) bằng tiền Deutsche Mark của Tây Đức. Trước khi bức tường được xây dựng, lực lượng Công an Nhân dân của Đông Đức trong Đông Berlin cũng đã kiểm soát nghiêm ngặt các con đường và phương tiện giao thông đi qua phần phía tây của thành phố để ngăn chặn những người "chạy trốn cộng hòa" và "buôn lậu". Ngoài ra, nhiều người ở Tây Berlin và người Đông Berlin nhưng làm việc tại Tây Berlin đã dùng tiền Mark Đông Đức được đổi với giá rẻ trên thị trường ngoại tệ chợ đen – tỷ giá hối đoái thời điểm đấy là 1:4 – để mua lương thực thực phẩm tương đối rẻ và các hàng hóa tiêu dùng cao cấp ít ỏi ở Đông Berlin. Qua đó hệ thống kinh tế theo chế độ kinh tế kế hoạch của Đông Đức lại càng suy yếu đi. Bức tường được xây dựng để phục vụ cho ý định của những người cầm quyền Đông Đức, đóng kín cửa biên giới để chấm dứt cái được gọi một cách bình dân là "bỏ phiếu bằng chân" – rời bỏ "quốc gia công nông xã hội chủ nghĩa".', '[RESPONSE]\nKhông, việc yêu cầu 50.000 người sống ở Đông Berlin nhưng làm việc ở Tây Berlin trả tiền nhà bằng Deutsche Mark không cải thiện nền kinh tế Đông Đức mà còn khiến hệ thống kinh tế kế hoạch của Đông Đức suy yếu thêm.'],
]
scores = model.predict(pairs)
print(scores.shape)
# (5, 3)

Training Details

Training Dataset

Unnamed Dataset

  • Size: 5,758 training samples
  • Columns: sentence_0, sentence_1, and label
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1 label
    type string string int
    details
    • min: 546 characters
    • mean: 973.63 characters
    • max: 3062 characters
    • min: 32 characters
    • mean: 192.97 characters
    • max: 314 characters
    • 0: ~31.60%
    • 1: ~35.10%
    • 2: ~33.30%
  • Samples:
    sentence_0 sentence_1 label
    [PROMPT]
    Tại sao, mặc dù con người có khả năng suy luận trừu tượng duy nhất trong giới động vật và đã tồn tại hàng triệu năm, quan điểm cho rằng loài người là tiến bộ nhất vẫn có thể bị coi là quá sớm để khẳng định nó đúng đắn?
    [CONTEXT]
    Khả năng suy luận trừu tượng của con người có thể là duy nhất trong giới động vật. Con người là một trong số 6 loài vượt qua bài kiểm tra gương (nhận ra bản thân ở trong gương); trong khi 5 loài còn lại là tinh tinh, tinh tinh lùn, khỉ không đuôi, cá heo và bồ câu. Tuy nhiên, những người dưới 2 tuổi hầu hết đều không vượt qua bài kiểm tra gương như trên.. Tuy nhiên, cũng có một số ý kiến cho rằng đây là cách phân loại riêng của loài người nhằm thể hiện rằng con người có ý thức về bản thân, trên thực tế nó kiểm tra trí nhớ + thị giác mà thôi. Các loài khác nhau đều có cách này hoặc cách khác để giao tiếp với nhau, và có thể có ý thức ở mức độ nào đó mà loài người vẫn chưa hiểu hết được. Cuộc tranh luận về ý thức của loài người là duy nhất hay không đến ...
    [RESPONSE]
    Loài người đã tồn tại hơn một tỷ năm, vượt xa mọi loài khác trên Trái Đất về mặt tiến hóa. Sự thống trị của chúng ta không thể so sánh với các loài chịu đựng như gián hay cá mập, vốn mới chỉ tồn tại vài triệu năm.
    1
    [PROMPT]
    Nữ chủ tịch đầu tiên của Quốc dân Đảng, người đã thắng cử trong cuộc bầu cử tổng thống năm 2016, là ai?
    [CONTEXT]
    Ngày 29 tháng 11 năm 2014, Quốc dân Đảng chịu tổn thất lớn trong bầu cử địa phương trước Đảng Dân Tiến, chỉ thắng tại sáu huyện thị. Mã Anh Cửu sau đó từ chức chủ tịch Đảng vào ngày 3 tháng 12 và thay thế là quyền Chủ tịch Ngô Đôn Nghĩa. Bầu cử chủ tịch đảng được tổ chức vào ngày 17 tháng 1 năm 2015 và Chu Lập Luân đắc cử. Ông nhậm chức vào ngày 19 tháng 2. Tháng 5 cùng năm, ông cùng Tổng bí thư Đảng Cộng sản Trung Quốc Tập Cận Bình tiến hành hội đàm tại Bắc Kinh. Đến tháng 7 cùng năm, Hồng Tú Trụ trong Đại hội đại biểu toàn quốc được chọn làm ứng cử viên tổng thống của Quốc dân Đảng. Ngày 17 tháng 10, Đảng bộ Trung ương Quốc dân Đảng triệu tập Đại hội đại biểu toàn quốc lâm thời, quyết định phế trừ tư cách ứng cử viên của Hồng Tú Trụ, chọn Chu Lập Luân làm ứng cử viên. Trong bầu cử tổng thống năm 2016, Chu Lập Luân thất bại và tuyên bố từ chức chủ tịch đảng, Hoàng...
    [RESPONSE]
    Hồng Tú Trụ, người trở thành nữ chủ tịch đầu tiên của Quốc dân Đảng, là một chính trị gia nổi tiếng với lập trường cứng rắn. Dù bà không thắng cử tổng thống năm 2016, nhưng bà đã có ảnh hưởng lớn đối với chính sách đối ngoại của Đài Loan thời gian sau đó.
    2
    [PROMPT]
    Vì sao Cục điều tra liên bang bị chỉ trích?
    [CONTEXT]
    Ủy ban 11 tháng 9 đã ra thông cáo vào ngày 22 tháng 7 năm 2004 tuyên bố rằng FBI và Cơ quan Tình báo Trung ương (CIA) đã không tham khảo thông tin tình báo về sự kiện có thể dẫn đến vụ khủng bố 11 tháng 9 năm 2001. Bản báo cáo cũng chỉ trích rất nhiều về Cục khi Cục đã không hoàn thành đúng nhiệm vụ được giao và yêu cầu phải có sự thay đổi bên trong FBI. Trong khi FBI đã tán thành với hầu hết các ý kiến đề nghị, bao gồm cả việc Giám đốc Tình báo Quốc gia sẽ giám sát Cục, thì một số thành viên của Ủy ban 11/9 vẫn công khai chỉ trích FBI vào tháng 10 năm 2005 khi Cục chỉ thay đổi cho có hình thức mà không có tính căng cơ.
    [RESPONSE]
    FBI bị chỉ trích vì đã hoàn thành xuất sắc nhiệm vụ và không cần bất kỳ sự thay đổi nào, dẫn đến sự khen ngợi của Ủy ban 11 tháng 9.
    1
  • Loss: CrossEntropyLoss

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 4
  • per_device_eval_batch_size: 4
  • num_train_epochs: 1
  • fp16: True

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 4
  • per_device_eval_batch_size: 4
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • hub_revision: None
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • liger_kernel_config: None
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Epoch Step Training Loss
0.3472 500 0.9714
0.6944 1000 0.7268
0.3472 500 0.7341
0.6944 1000 0.7375
0.3472 500 0.5656
0.6944 1000 0.5422

Framework Versions

  • Python: 3.12.11
  • Sentence Transformers: 5.1.1
  • Transformers: 4.56.2
  • PyTorch: 2.8.0+cu128
  • Accelerate: 1.10.1
  • Datasets: 4.1.1
  • Tokenizers: 0.22.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
Downloads last month
8
Safetensors
Model size
568M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for htNghiaaa/dsc25-bge-reranker-finetuned-kfold2-v1

Finetuned
(32)
this model