thang1943's picture
phobert-base-v2-otc-loss
c96ae43 verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:43803
  - loss:GISTEmbedLoss
base_model: vinai/phobert-base-v2
widget:
  - source_sentence: >-
      Tìm hiểu chung phát ban Phát ban là những thay đổi bất thường về màu da
      hoặc kết cấu của da. Phát ban có thể là biểu hiện của các bệnh bao gồm
      bệnh chàm (eczema) , u hạt, liken phẳng và bệnh vảy phấn hồng.
    sentences:
      - >-
        Cốm Pentasa Sachet 2g Ferring điều trị viêm loét đại tràng, bệnh Crohn
        (60 gói)
      - "BS ơi,\r\n\r\n3 ngày nay em cảm thấy đau ở cổ họng, lưỡi em bị trắng, hơi rát em thấy hơi mệt bụng cảm thấy khó chịu, ấn vào thấy đau nhưng em ăn uống được ạ. \r\n\r\nNgoài ra em còn bị rát ở da vùng cổ lưng nữa, không nổi đỏ. Bác sĩ ơi, liệu em bị bệnh gì?   \r\n \r\n(Trần Thành Trí - 25 tuổi - Gia Lai)"
      - Tìm hiểu chung phát ban
  - source_sentence: >-
      Nguy cơ viêm màng não do virus Những ai có nguy cơ mắc phải viêm màng não
      do virus? Đối tượng có nguy cơ mắc phải màng não do virus: Người tiếp xúc
      với máu, phân của người bệnh viêm màng não do virus. Người bị côn trùng
      mang mầm bệnh cắn. Người có quan hệ tình dục với bệnh nhân mắc HSV, HIV.
      Người không tiêm vaccine ngừa viêm màng não. Người có sức đề kháng kém
      hoặc bị suy giảm miễn dịch. Yếu tố làm tăng nguy cơ mắc Viêm màng não do
      virus Một số yếu tố làm tăng nguy cơ mắc Viêm màng não do virus: Không
      tiêm vaccine. Hầu hết những trường hợp mắc viêm màng não do virus gặp ở
      trẻ em dưới 5 tuổi. Phụ nữ có thai. Suy giảm hệ thống miễn dịch ( HIV/AIDS
      , nghiện rượu, đái tháo đường…) Cắt bỏ lá lách. Môi trường sống ẩm thấp,
      nơi có nhiều côn trùng (muỗi có thể lây truyền virus West Nile, virus St.
      Louis, virus Zika, virus Chikungunya) hoặc tiếp xúc với nước tiểu, phân
      của động vật mang mầm bệnh. Sử dụng chung kim tiêm với người khác, đặc
      biệt là với bệnh nhân nhiễm HIV.
    sentences:
      - Nguy  viêm màng não do virus
      - Nguy  viêm đại tràng
      - "AloBacsi ơi, cho em hỏi bệnh lác thì chữa như thế nào ạ? Em xin cảm ơn!\r\n\r\n(Bạn đọc Duy Lionel)"
  - source_sentence: >-
      Chào bạn, Qua thư cho thấy bạn chăm sóc con rất tốt, bé trai 8 tháng cân
      nặng 9 kg là vượt chuẩn so với cân nặng chuẩn theo tuổi (8,6kg), răng mọc
      4 cái. Chế độ ăn của bé mỗi ngày: -Lượng sữa mỗi ngày của bé là 540ml sữa
      công thức + sữa mẹ + sữa chua, phô mai -3 chén cháo xay -Trái cây Với chế
      độ ăn như vậy là đủ dinh dưỡng, bé phát triển thể chất rất tốt nhưng bạn
      nhớ mỗi chén cháo xay phải đủ 4 nhóm thức ăn, nhất là chất béo. Bình
      thường thời gian ngủ của bé lứa tuổi này thường khoảng 14-15 giờ trong
      ngày. Giấc ngủ ngày tuỳ thuộc từng bé thường có 2-3 giấc, mỗi giấc khoảng
      2 giờ. Tuy số giờ ngủ của bé có ít hơn trẻ bình thường nhưng bé ăn ngủ,
      phát triển thể chất bình thường, không quấy khóc, không có biểu hiện của
      thiếu canxi, vitamin D thì bạn không nên lo lắng. Giấc ngủ đêm của bé
      ngắn, bạn xem lại phòng ngủ có quá sáng không vì lứa tuổi này bé chưa phân
      biệt được ngày và đêm, kết hợp cho bé phơi nắng mỗi ngày 15-20 phút. Bé ăn
      uống, dinh dưỡng tốt nên chưa cần thiết bổ sung thêm thuốc.
    sentences:
      - >-
        Tôi năm nay 34 tuổi. Trước đó tôi bị tai nạn gãy chân và phẫu
        thuật đặt inox từ đầu gối tới mắt cá chân, đến giờ cũng
        khoảng 7 năm. Giờ tôi làm nặng hoặc di chuyển nhiều có cảm
        giác ê ẩm, khó chịu. Vậy tôi có cần lấy ra không? Chi phí là
        bao nhiêu vậy?
      - "Chào AloBacsi,\r\n\r\nMình được biết hành tây rất tốt cho sức khỏe, đặc biệt là trẻ em trong các bệnh về sổ mũi, ngạt mũi và kháng bệnh tốt. Tuy nhiên, nhiều người khuyên không nên cho bé trai ăn hành tây vì sẽ kích thích hoocmon nam phát triển sớm. Mình phân vân không biết làm thế nào. Mong AloBacsi tư vấn giúp. Xin trân trọng cảm ơn! \r\n\r\n(Kinh Ken - Quảng Ngãi)"
      - "Bác sĩ ơi, \r\n\r\nCon em gần 8 tháng tuổi. Lúc mới sinh cháu nặng 4.1kg. Hiện nay 9kg, em chưa đo được chiều cao, nhưng cũng tương đối. Cháu mọc 4 răng, 2 trên 2 dưới. Cháu biết bò và có thể vịn đứng dậy. \r\n\r\nLúc mới sinh 4 tháng đầu vì mùa lạnh nên không thể tắm nắng. Mấy tháng sau tắm nắng 10 phút/ngày cho đến giờ. Một ngày cháu bú mẹ 2- 3 lần (vì cháu không thích bú mẹ), bú bình 6 lần, mỗi lần 90ml. Ngày ăn ba chén cháo xay. Sữa chua, phomai, trái cây thay đổi hằng ngày. \r\n\r\nBan ngày cháu ngủ khoảng 6 tiếng. Ban đêm cháu ngủ lúc 21h đến khoảng 2-3h sáng là cháu bắt đầu dậy và lăn qua lăn lại cho đến sáng, nhưng không khóc. Đêm nào cũng thế. \r\n\r\nBác sĩ vui lòng cho biết con em bị gì và cần bổ sung gì? Cảm ơn bác sĩ nhiều."
  - source_sentence: >-
      Chào bạn, Độ phân bố tiểu cầu (platelet disrabution width: PDW): bình
      thường từ 10-16.5%. Giá trị này càng cao, nghĩa là độ phân bố của tiểu cầu
      thay đổi càng nhiều, tức là tiểu cầu to nhỏ không đều. trong ung thư phổi,
      bệnh hồng cầu liềm, nhiễm khuẩn huyết… Hiện tại bên cạnh PDW, một số chỉ
      số khác trong công thức máu của cũng có bất thường như số lượng bạch cầu
      tăng, ưu thế neutrophil, kích thước hồng cầu to. Em nên tái khám tại một
      bệnh viện có chuyên khoa Huyết học để kiểm tra làm rõ chẩn đoán em nhé!
      Thân mến.
    sentences:
      - >-
        Chào BS trong đính kèm là kết quả xét nghiệm máu. Em có 1 câu hỏi muốn
        nhờ BS tư vấn là ở chỗ chỉ số PDW tăng như vậy có ảnh hưởng như thế nào
        ạ? Cám ơn BS.
      - >-
        BS cho cháu hỏi, con cháu bị các mảng và đốm trắng ở niêm mạc, lưỡi,
        cuống lưỡi và ở cả bên trong má đều có thì liệu cháu có bị nấm miệng hay
        không? Mấy lần cháu rơ thì không thấy bị đỏ nhưng hôm nay thì rơ bắt đầu
        thấy đỏ.
      - "Chào BS, em năm nay 22 tuổi. Em thường bị đau ở đốt sống thắt lưng, ngồi lâu thường có cảm giác mỏi, cứng lưng. Nếu ngày nào đứng nhiều, tối về khi nằm phải kê gối ở dưới lưng 1 lúc mới có thể nằm bình thường đươc.\r\n\r\nCách đây 1 năm có một thời gian lưng em không thể cúi xuống được. Bị như vây có sao không BS, có phải em đang bị thoái hóa đốt sống lưng không?\r\n\r\n(Bạn đọc Hà Linh)"
  - source_sentence: "Viêm mũi dị ứng không chỉ ảnh hưởng trực tiếp tới sức khỏe mà còn gây ra không ít phiền toái trong cuộc sống hằng ngày Xin chào bạn, Bệnh lý Viêm mũi dị ứng cơ chế do phản ứng dị ứng quá mẫn của cơ thể với các tác động của môi trường (không khí lạnh, phấn hoa, bụi bẩn …). Thuốc điều trị chủ yếu là nhóm kháng Histamin (Cetirizine và các loại thuốc tương tự khác), thật ra sử dụng kháng histamin kéo dài là đặc thù của bệnh nhân có bệnh lý dị ứng. Cũng chưa thấy đề cập đến những vấn đề nguy hiểm khi sử dụng thuốc kháng Histamin lâu dài – có vài loại thuốc gây khô họng miệng nhưng không đáng kể và các thế hệ thuốc sau thì tác dụng phụ này ngày càng giảm. Bạn đừng quá lo lắng nữa nhé.\_Bên cạnh việc sử dụng thuốc, nhớ làm sạch môi trường sinh hoạt xung quanh để giảm thiểu nguy cơ làm bệnh lý viêm mũi dị ứng nặng hơn. Thân ái chào bạn."
    sentences:
      - Chế độ sinh hoạt & phòng ngừa bệnh thần kinh đái tháo đường
      - >-
        Em có vấn đề thắc mắc xin được Bác sĩ giải đáp giúp ạ.Em đi khám và Bác
        sĩ kết luận em bị viêm mũi dị ứng. Cho thuốc cetirizin 10 mg ngày uống 1
        viên. Prednisolon 5 mg ngày uống 1 viên (Bác sĩ khám có dặn là
        prednisolon không được uống kéo dài).Khi còn uống thuốc thì em không bị
        hắt hơi, sổ mũi mà hết uống lại bị. Do bác sĩ dặn kg uống pred kéo dài,
        nên em chỉ uống cetirizin 10 mg ngày uống 1 viên nhưng ngày nào cũng
        uống (vì không uống là không cắt được cơn hắt hơi, sổ mũi).Liệu uống
        cetirizin liên tục trong 1 thời gian dài có bị ảnh hưởng gì không bác
        sĩ? Nhưng không uống thì em hắt hơi miết không làm được việc gì hết ạ.
        Em rất bế tắc, mong nhận được hồi âm từ BS!
      - >-
        Chào bác sĩ. Em năm nay 18 tuổi, năm 8 tuổi em bị tai nạn khiến 1 mắt bị
        lác, vậy giờ em có thể phẫu thuật kéo mắt lại không ạ?
datasets:
  - meandyou200175/dataset_full_fixed
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy@1
  - cosine_accuracy@3
  - cosine_accuracy@5
  - cosine_accuracy@10
  - cosine_precision@1
  - cosine_precision@3
  - cosine_precision@5
  - cosine_precision@10
  - cosine_recall@1
  - cosine_recall@3
  - cosine_recall@5
  - cosine_recall@10
  - cosine_ndcg@10
  - cosine_mrr@10
  - cosine_map@100
model-index:
  - name: SentenceTransformer based on vinai/phobert-base-v2
    results:
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 768
          type: dim_768
        metrics:
          - type: cosine_accuracy@1
            value: 0.6597881665449233
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.787436084733382
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.8307158509861212
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.8847699050401753
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.6597881665449233
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.26247869491112735
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.16614317019722424
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.08847699050401753
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.6597881665449233
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.787436084733382
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.8307158509861212
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.8847699050401753
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.7706457773471865
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.7343541659420051
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.738977271432429
            name: Cosine Map@100

SentenceTransformer based on vinai/phobert-base-v2

This is a sentence-transformers model finetuned from vinai/phobert-base-v2 on the dataset_full_fixed dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: vinai/phobert-base-v2
  • Maximum Sequence Length: 256 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity
  • Training Dataset:

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("phobert-base-v2-otc-loss")
# Run inference
sentences = [
    'Viêm mũi dị ứng không chỉ ảnh hưởng trực tiếp tới sức khỏe mà còn gây ra không ít phiền toái trong cuộc sống hằng ngày Xin chào bạn, Bệnh lý Viêm mũi dị ứng cơ chế do phản ứng dị ứng quá mẫn của cơ thể với các tác động của môi trường (không khí lạnh, phấn hoa, bụi bẩn …). Thuốc điều trị chủ yếu là nhóm kháng Histamin (Cetirizine và các loại thuốc tương tự khác), thật ra sử dụng kháng histamin kéo dài là đặc thù của bệnh nhân có bệnh lý dị ứng. Cũng chưa thấy đề cập đến những vấn đề nguy hiểm khi sử dụng thuốc kháng Histamin lâu dài – có vài loại thuốc gây khô họng miệng nhưng không đáng kể và các thế hệ thuốc sau thì tác dụng phụ này ngày càng giảm. Bạn đừng quá lo lắng nữa nhé.\xa0Bên cạnh việc sử dụng thuốc, nhớ làm sạch môi trường sinh hoạt xung quanh để giảm thiểu nguy cơ làm bệnh lý viêm mũi dị ứng nặng hơn. Thân ái chào bạn.',
    'Em có vấn đề thắc mắc xin được Bác sĩ giải đáp giúp ạ.Em đi khám và Bác sĩ kết luận em bị viêm mũi dị ứng. Cho thuốc cetirizin 10 mg ngày uống 1 viên. Prednisolon 5 mg ngày uống 1 viên (Bác sĩ khám có dặn là prednisolon không được uống kéo dài).Khi còn uống thuốc thì em không bị hắt hơi, sổ mũi mà hết uống lại bị. Do bác sĩ dặn kg uống pred kéo dài, nên em chỉ uống cetirizin 10 mg ngày uống 1 viên nhưng ngày nào cũng uống (vì không uống là không cắt được cơn hắt hơi, sổ mũi).Liệu uống cetirizin liên tục trong 1 thời gian dài có bị ảnh hưởng gì không bác sĩ? Nhưng không uống thì em hắt hơi miết không làm được việc gì hết ạ. Em rất bế tắc, mong nhận được hồi âm từ BS!',
    'Chào bác sĩ. Em năm nay 18 tuổi, năm 8 tuổi em bị tai nạn khiến 1 mắt bị lác, vậy giờ em có thể phẫu thuật kéo mắt lại không ạ?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Information Retrieval

Metric Value
cosine_accuracy@1 0.6598
cosine_accuracy@3 0.7874
cosine_accuracy@5 0.8307
cosine_accuracy@10 0.8848
cosine_precision@1 0.6598
cosine_precision@3 0.2625
cosine_precision@5 0.1661
cosine_precision@10 0.0885
cosine_recall@1 0.6598
cosine_recall@3 0.7874
cosine_recall@5 0.8307
cosine_recall@10 0.8848
cosine_ndcg@10 0.7706
cosine_mrr@10 0.7344
cosine_map@100 0.739

Training Details

Training Dataset

dataset_full_fixed

  • Dataset: dataset_full_fixed at ef2e7fd
  • Size: 43,803 training samples
  • Columns: positive and query
  • Approximate statistics based on the first 1000 samples:
    positive query
    type string string
    details
    • min: 37 tokens
    • mean: 187.21 tokens
    • max: 256 tokens
    • min: 6 tokens
    • mean: 77.0 tokens
    • max: 256 tokens
  • Samples:
    positive query
    Chào bạn, /mẻ gây nhạy cảm thì chỉ cần trám lại là sẽ bớt ngay. Tuy nhiên độ bền thì còn tùy thuộc vào vị trí gãy/vỡ/mẻ cũng như độ lớn của vùng đó. Nếu bạn bị vỡ hết cả nửa răng thì trám lại chắc chỉ được vài tháng là sẽ bị bong miếng trám ra mất do miếng trám quá lớn còn răng thì quá yếu. Vì vậy bạn nên đi khám bác sĩ xem thử có trám lại bền được không, nếu không thì bạn phải bọc răng sứ thì mới bền được. Thân mến, Chào bác sĩ,


    Răng của em bị vỡ nửa cái do em bị tai nạn, giờ cảm thấy đau buốt khi nuốt nước bọt và khi uống nước lạnh. Có thể khắc phục được không, thưa BS?
    Chào em, Khi một số trường hợp có thể gây sang chấn, dẫn đến hiện tượng chảy máu, chảy dịch hồng như em mô tả. Tuy nhiên hiện tượng này có thể tự giới hạn. Trường hợp của em, nếu vẫn tiếp tục chảy dịch hồng hoặc chảy máu tươi, em nên tái khám để tìm nguyên nhân và điều trị em nhé. Chào bác sĩ,


    2 ngày trước em đi khám, được chuẩn đoán là viêm mũi - viêm xoang, ghi trong toa là “Proezt”. Sau khi hút xoang xong cỡ 30 phút trong mũi trái của em có máu chảy ra. Đến giờ dịch nhầy ở mũi trái của em có màu đỏ. Em có sử dụng thuốc xịt mũi nhưng tình hình không khả quan hơn. Mong BS tư vấn ạ.
    Chào em, Khi bị viêm, mắt có triệu chứng sưng, đau, gỉ mắt làm cho 2 mí dính lại và khó mở ra vào buổi sáng. Em nên đến khám BS Mắt để xem lại chẩn đoán, tìm nguyên nhân và kê toa thuốc nhỏ mắt thích hợp nhé. Thân mến! BS ơi,


    Sáng sớm ngủ dậy tự nhiên mắt em mở không lên. Một hồi sau mới mở mắt được ạ. Sau đó thì nó sưng lên và đau thì làm sao ạ? BS tư vấn giúp em với. Em không có bị ngứa mắt ạ.
  • Loss: GISTEmbedLoss with these parameters:
    {'guide': SentenceTransformer(
      (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
      (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
      (2): Normalize()
    ), 'temperature': 0.01, 'margin_strategy': 'absolute', 'margin': 0.0}
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: epoch
  • per_device_train_batch_size: 40
  • per_device_eval_batch_size: 40
  • learning_rate: 1e-06
  • num_train_epochs: 5
  • lr_scheduler_type: constant_with_warmup
  • warmup_ratio: 0.1
  • bf16: True
  • tf32: False
  • load_best_model_at_end: True
  • optim: adamw_torch_fused
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: epoch
  • prediction_loss_only: True
  • per_device_train_batch_size: 40
  • per_device_eval_batch_size: 40
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 1e-06
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 5
  • max_steps: -1
  • lr_scheduler_type: constant_with_warmup
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: False
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • eval_use_gather_object: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss dim_768_cosine_ndcg@10
0.0912 100 9.312 -
0.1825 200 7.4093 -
0.2737 300 3.8224 -
0.3650 400 1.6865 -
0.4562 500 1.1151 -
0.5474 600 0.8235 -
0.6387 700 0.6362 -
0.7299 800 0.6181 -
0.8212 900 0.5331 -
0.9124 1000 0.4978 -
1.0 1096 - 0.6982
1.0036 1100 0.4167 -
1.0949 1200 0.4154 -
1.1861 1300 0.3793 -
1.2774 1400 0.3905 -
1.3686 1500 0.3534 -
1.4599 1600 0.3538 -
1.5511 1700 0.3357 -
1.6423 1800 0.2892 -
1.7336 1900 0.2882 -
1.8248 2000 0.2902 -
1.9161 2100 0.3083 -
2.0 2192 - 0.7386
2.0073 2200 0.2854 -
2.0985 2300 0.2546 -
2.1898 2400 0.2759 -
2.2810 2500 0.2525 -
2.3723 2600 0.2735 -
2.4635 2700 0.2576 -
2.5547 2800 0.2525 -
2.6460 2900 0.2545 -
2.7372 3000 0.2627 -
2.8285 3100 0.2494 -
2.9197 3200 0.2404 -
3.0 3288 - 0.7531
3.0109 3300 0.2284 -
3.1022 3400 0.226 -
3.1934 3500 0.212 -
3.2847 3600 0.2228 -
3.3759 3700 0.2132 -
3.4672 3800 0.1971 -
3.5584 3900 0.2004 -
3.6496 4000 0.2247 -
3.7409 4100 0.2226 -
3.8321 4200 0.2064 -
3.9234 4300 0.1961 -
4.0 4384 - 0.7638
4.0146 4400 0.1811 -
4.1058 4500 0.1722 -
4.1971 4600 0.1732 -
4.2883 4700 0.1954 -
4.3796 4800 0.203 -
4.4708 4900 0.184 -
4.5620 5000 0.189 -
4.6533 5100 0.1932 -
4.7445 5200 0.1596 -
4.8358 5300 0.1756 -
4.9270 5400 0.188 -
5.0 5480 - 0.7706
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.10.18
  • Sentence Transformers: 4.1.0
  • Transformers: 4.44.2
  • PyTorch: 2.7.0+cu128
  • Accelerate: 1.7.0
  • Datasets: 3.6.0
  • Tokenizers: 0.19.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

GISTEmbedLoss

@misc{solatorio2024gistembed,
    title={GISTEmbed: Guided In-sample Selection of Training Negatives for Text Embedding Fine-tuning},
    author={Aivin V. Solatorio},
    year={2024},
    eprint={2402.16829},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}