CrossEncoder based on BAAI/bge-reranker-v2-m3

This is a Cross Encoder model finetuned from BAAI/bge-reranker-v2-m3 using the sentence-transformers library. It computes scores for pairs of texts, which can be used for text pair classification.

Model Details

Model Description

  • Model Type: Cross Encoder
  • Base model: BAAI/bge-reranker-v2-m3
  • Maximum Sequence Length: 8192 tokens
  • Number of Output Labels: 3 labels

Model Sources

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import CrossEncoder

# Download from the 🤗 Hub
model = CrossEncoder("cross_encoder_model_id")
# Get scores for pairs of texts
pairs = [
    ['[PROMPT]\nMục tiêu cao cả của cách mạng, vốn là để củng cố quyền lực của nền quân chủ chuyên chế, đã khiến cho nó bị phản đối như thế nào?\n[CONTEXT]\nNguyên tắc của cuộc cách mạng là cắt đứt hoàn toàn với nền quân chủ chuyên chế vốn là trọng tâm của chính quyền truyền thống của nước Pháp. Do đó, cuộc cách mạng bị đề kháng tại các vùng nông thôn nước Pháp, và bị tất cả các nước lân bang chống đối. Khi cuộc cách mạng trở nên cực đoan và không ai có thể kiểm soát các đám đông cuồng nhiệt, một vài nhân vật chủ chốt trong giai đoạn hình thành cuộc cách mạng bắt đầu nghi ngờ lợi ích của nó. Honoré Mirabeau bí mật dàn xếp để phục hồi vương quyền theo thể chế lập hiến.', '[RESPONSE]\ncuộc cách mạng, nhằm củng cố quyền lực của nền quân chủ chuyên chế, đã nhận được sự ủng hộ nhiệt tình từ các vùng nông thôn nước Pháp và được các nước lân bang cổ vũ mạnh mẽ.'],
    ['[PROMPT]\nIraq nhận định rằng Amiriyah là công trình được sử dụng để làm gì?\n[CONTEXT]\nTrong đa số các trường hợp, liên quân tránh gây thiệt hại tới những cơ sở dân sự thuần tuý. Tuy nhiên, ngày 13 tháng 2 năm 1991, hai quả bom thông minh điều khiển bằng tia laser đã phá hủy lô cốt Amiriyah mà người Iraq cho là nơi tránh bom của thường dân. Các quan chức Mỹ cho rằng lô cốt đó là một trung tâm thông tin quân đội, nhưng các nhà báo phương tây đã không tìm được bằng chứng về việc đó. Trong một báo cáo với nhan đề "Bộ máy nói dối: Thảm kịch của sự lừa đảo", Nhà Trắng đã tuyên bố rằng các nguồn tin tình báo của họ cho thấy lô cốt này đang được sử dụng cho mục đích chỉ huy quân sự. Trong cuốn sách của mình, Kẻ chế tạo bom của Saddam, cựu giám đốc chương trình vũ khí hạt nhân của Iraq, người đã đào thoát sang phương tây, ủng hộ giả thuyết rằng lô cốt này được sử dụng cho cả hai mục đích.', '[RESPONSE]\nIraq nhận định rằng Amiriyah là nơi tránh bom của thường dân.'],
    ['[PROMPT]\nCoo khoang bao nhieu cuon sach duoc dua vao thu vien trong giai doan quy che luu chieu bi xoa bo?\n[CONTEXT]\nCách mạng Pháp đã mở ra một trang mới trong lịch sử của thư viện. Không như nhiều tài sản hoàng gia khác, thư viện chính thức trở thành Thư viện Quốc gia và không bị tổn hại trong những năm đầy biến động này. Mặc dù quy chế lưu chiểu bị xóa bỏ trong vòng ba năm, số lượng sách của thư viện lại tăng lên đáng kể nhờ những bộ sưu tập được đưa tới từ thư viện của giới tăng lữ và những người đào vong. Ước tính, khoảng 250 nghìn cuốn sách, 14 nghìn bản viết tay và 25 nghìn bản in đã được đưa về Thư viện Quốc gia trong giai đoạn này. Thời kỳ Đốc chính, chế độ Tổng tài, rồi Đệ nhất đế chế lần lượt tiếp nối. Mặc cho những sóng gió của lịch sử, trữ lượng tài liệu của thư viện không ngừng tăng lên. Không chỉ từ Paris hay các tỉnh của Pháp, những cuốn sách của Bỉ, Hà Lan, Đức cũng được chuyển về Thư viện Quốc gia sau những cuộc chinh phạt của Napoléon.', '[RESPONSE]\nKhoảng 250 nghìn cuốn sách, 14 nghìn bản viết tay và 25 nghìn bản in được thêm vào thư viện. Không chỉ vậy, trong thời kỳ này, thư viện còn bắt đầu triển khai hệ thống phân loại sách dựa trên một mô hình do các nhà triết học nổi tiếng của Pháp phát triển.'],
    ['[PROMPT]\nDựa trên lý thuyết của Marx, những quốc gia nào có thể trải qua một giai đoạn chuyển tiếp hòa bình sang chủ nghĩa xã hội do có truyền thống nhà nước tập trung mạnh?\n[CONTEXT]\nMarx tin rằng sự gia tăng mức độ nghiêm trọng của các cuộc khủng hoảng sẽ xé rách chu kỳ tăng trưởng, sụp đổ, và tăng trưởng tiếp này. Hơn nữa, ông tin rằng về dài hạn quá trình này sẽ tăng cao và làm tăng cường sức mạnh cho tầng lớp tư bản và làm khốn khó tầng lớp vô sản. Ông tin rằng nếu tầng lớp vô sản nắm được phương tiện sản xuất, họ sẽ khuyến khích các quan hệ xã hội để mọi người đều được có lợi ích một cách công bằng, và một hệ thống sản xuất ít bị ảnh hưởng hơn bởi các cuộc khủng hoảng định kỳ. Ông đặt ra lý thuyết rằng giữa chủ nghĩa tư bản và việc thành lập một hệ thống xã hội chủ nghĩa, có một sự chuyên chính của tầng lớp tư sản - một giai đoạn khi tầng lớp lao động giữ quyền lực chính trị và bắt buộc xã hội hoá các phương tiện sản xuất - tồn tại. Và ông đã viết trong cuốn "Phê phán cương lĩnh Gotha" của mình, "giữa xã hội tư bản và cộng sản có một giai đoạn chuyển tiếp cách mạng từ xã hội này tới xã hội kia. Tương ứng với nó cũng là một giai đoạn chuyển tiếp chính trị trong đó nhà nước có thể không là gì mà chỉ là sự chuyên chính cách mạng của tầng lớp vô sản." Tuy ông cho phép khả năng chuyển tiếp hoà bình ở một số quốc gia có các thể chế dân chủ mạnh (như Anh Quốc, Hoa Kỳ và Hà Lan), ông cho rằng ở các quốc gia khác với các truyền thống nhà nước tập trung mạnh, như Pháp, Đức, "đòn bẩy cuộc cách mạng của chúng ta phải là bạo lực."', '[RESPONSE]\nTheo lý thuyết của Marx, mặc dù Pháp và Đức có truyền thống nhà nước tập trung mạnh và có thể cần đến bạo lực trong quá trình chuyển tiếp, một số học giả cho rằng Thụy Điển cũng có khả năng chuyển tiếp hòa bình do có hệ thống phúc lợi xã hội phát triển và ổn định chính trị.'],
    ['[PROMPT]\nCopernicus đang cố gắng giới thiệu hệ thống địa tâm nào trong tác phẩm của mình?\n[CONTEXT]\nNói về ảnh hưởng của Mysterium, nó có thể được xem như là bước quan trọng đầu tiên trong việc hiện đại hóa lý thuyết đề xuất bởi Nicolaus Copernicus trong tác phẩm "De Revolutionibus". Trong khi Copernicus tìm cách giới thiệu một hệ thống nhật tâm, ông tinh chỉnh các công cụ toán học của Ptolemaeus (tức ngoại luân và các đường tròn lệch tâm) để giải thích sự thay đổi tốc độ chuyển động quay của hành tinh, và đồng thời tiếp túc sử dụng tâm quỹ đạo Trái Đất như một điểm quy chiếu thay vì Mặt Trời "như một sự hỗ trợ cho tính toán và để tránh làm độc giả nhầm lẫn khi chệch quá xa khỏi đường hướng của Ptolemaeus." Thiên văn học hiện đại nợ "Mysterium Cosmographicum" rất nhiều, bất chấp những sai lầm trong luận đề chính của nó, "bởi vì nó đại diện cho bước đầu tiên tẩy trừ những tàn dư của lý thuyết Ptolemaeus vẫn còn bám lấy hệ thống Copernicus."', '[RESPONSE]\nCopernicus đã giới thiệu hệ thống nhật tâm trong "De Revolutionibus", loại bỏ dần tàn dư của lý thuyết địa tâm của Ptolemaeus. Ông đã chịu ảnh hưởng từ các học giả Hồi giáo Trung Cổ như Al-Tusi và Al-Biruni, người đã đề xuất các khái niệm thiên văn học'],
]
scores = model.predict(pairs)
print(scores.shape)
# (5, 3)

Training Details

Training Dataset

Unnamed Dataset

  • Size: 5,758 training samples
  • Columns: sentence_0, sentence_1, and label
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1 label
    type string string int
    details
    • min: 548 characters
    • mean: 971.15 characters
    • max: 2955 characters
    • min: 49 characters
    • mean: 193.59 characters
    • max: 306 characters
    • 0: ~31.20%
    • 1: ~34.80%
    • 2: ~34.00%
  • Samples:
    sentence_0 sentence_1 label
    [PROMPT]
    Mục tiêu cao cả của cách mạng, vốn là để củng cố quyền lực của nền quân chủ chuyên chế, đã khiến cho nó bị phản đối như thế nào?
    [CONTEXT]
    Nguyên tắc của cuộc cách mạng là cắt đứt hoàn toàn với nền quân chủ chuyên chế vốn là trọng tâm của chính quyền truyền thống của nước Pháp. Do đó, cuộc cách mạng bị đề kháng tại các vùng nông thôn nước Pháp, và bị tất cả các nước lân bang chống đối. Khi cuộc cách mạng trở nên cực đoan và không ai có thể kiểm soát các đám đông cuồng nhiệt, một vài nhân vật chủ chốt trong giai đoạn hình thành cuộc cách mạng bắt đầu nghi ngờ lợi ích của nó. Honoré Mirabeau bí mật dàn xếp để phục hồi vương quyền theo thể chế lập hiến.
    [RESPONSE]
    cuộc cách mạng, nhằm củng cố quyền lực của nền quân chủ chuyên chế, đã nhận được sự ủng hộ nhiệt tình từ các vùng nông thôn nước Pháp và được các nước lân bang cổ vũ mạnh mẽ.
    1
    [PROMPT]
    Iraq nhận định rằng Amiriyah là công trình được sử dụng để làm gì?
    [CONTEXT]
    Trong đa số các trường hợp, liên quân tránh gây thiệt hại tới những cơ sở dân sự thuần tuý. Tuy nhiên, ngày 13 tháng 2 năm 1991, hai quả bom thông minh điều khiển bằng tia laser đã phá hủy lô cốt Amiriyah mà người Iraq cho là nơi tránh bom của thường dân. Các quan chức Mỹ cho rằng lô cốt đó là một trung tâm thông tin quân đội, nhưng các nhà báo phương tây đã không tìm được bằng chứng về việc đó. Trong một báo cáo với nhan đề "Bộ máy nói dối: Thảm kịch của sự lừa đảo", Nhà Trắng đã tuyên bố rằng các nguồn tin tình báo của họ cho thấy lô cốt này đang được sử dụng cho mục đích chỉ huy quân sự. Trong cuốn sách của mình, Kẻ chế tạo bom của Saddam, cựu giám đốc chương trình vũ khí hạt nhân của Iraq, người đã đào thoát sang phương tây, ủng hộ giả thuyết rằng lô cốt này được sử dụng cho cả hai mục đích.
    [RESPONSE]
    Iraq nhận định rằng Amiriyah là nơi tránh bom của thường dân.
    2
    [PROMPT]
    Coo khoang bao nhieu cuon sach duoc dua vao thu vien trong giai doan quy che luu chieu bi xoa bo?
    [CONTEXT]
    Cách mạng Pháp đã mở ra một trang mới trong lịch sử của thư viện. Không như nhiều tài sản hoàng gia khác, thư viện chính thức trở thành Thư viện Quốc gia và không bị tổn hại trong những năm đầy biến động này. Mặc dù quy chế lưu chiểu bị xóa bỏ trong vòng ba năm, số lượng sách của thư viện lại tăng lên đáng kể nhờ những bộ sưu tập được đưa tới từ thư viện của giới tăng lữ và những người đào vong. Ước tính, khoảng 250 nghìn cuốn sách, 14 nghìn bản viết tay và 25 nghìn bản in đã được đưa về Thư viện Quốc gia trong giai đoạn này. Thời kỳ Đốc chính, chế độ Tổng tài, rồi Đệ nhất đế chế lần lượt tiếp nối. Mặc cho những sóng gió của lịch sử, trữ lượng tài liệu của thư viện không ngừng tăng lên. Không chỉ từ Paris hay các tỉnh của Pháp, những cuốn sách của Bỉ, Hà Lan, Đức cũng được chuyển về Thư viện Quốc gia sau những cuộc chinh phạt của Napoléon.
    [RESPONSE]
    Khoảng 250 nghìn cuốn sách, 14 nghìn bản viết tay và 25 nghìn bản in được thêm vào thư viện. Không chỉ vậy, trong thời kỳ này, thư viện còn bắt đầu triển khai hệ thống phân loại sách dựa trên một mô hình do các nhà triết học nổi tiếng của Pháp phát triển.
    2
  • Loss: CrossEntropyLoss

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 4
  • per_device_eval_batch_size: 4
  • num_train_epochs: 1
  • fp16: True

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 4
  • per_device_eval_batch_size: 4
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • hub_revision: None
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • liger_kernel_config: None
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Epoch Step Training Loss
0.3472 500 1.0637
0.6944 1000 0.8941
0.3472 500 0.727
0.6944 1000 0.7534

Framework Versions

  • Python: 3.12.11
  • Sentence Transformers: 5.1.1
  • Transformers: 4.56.2
  • PyTorch: 2.8.0+cu128
  • Accelerate: 1.10.1
  • Datasets: 4.1.1
  • Tokenizers: 0.22.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
Downloads last month
9
Safetensors
Model size
568M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for htNghiaaa/dsc25-bge-reranker-finetuned-kfold3-v1

Finetuned
(32)
this model