thang1943's picture
phobert-base-v2-gloss
b6c16e3 verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:43803
  - loss:GISTEmbedLoss
base_model: vinai/phobert-base-v2
widget:
  - source_sentence: >-
      Nâng mũi tiêm filler Chào bạn, Hiện, trên thị trường có rất nhiều quảng
      cáo về việc nâng mũi, nhưng tóm lại chỉ có 4 phương pháp đó là: Nâng mũi
      bằng bằng filler, chỉ Nâng mũi thường (đặt sóng đơn thuần) Nâng mũi bọc
      sụn, bọc da nhân tạo Nâng mũi cấu trúc Dựa theo hình dáng của mũi, chẳng
      hạn như thấp ở gốc mũi rồi uốn lượn thành hình chữ S được gọi là S-line,
      hoặc mũi tương tự như chữ L sẽ gọi là L-line. Gần đây, nhiều chị em phụ nữ
      xôn xao với các phương pháp nâng mũi như Nanoform, Surgiform, tuy nhiên
      đây chỉ là vật liệu được sử dụng trong quá trình nâng mũi. Có thể thấy các
      vậy liệu sử dụng trong nâng mũi là muôn hình vạn trạng, vì vậy trước khi
      cân nhắc làm đẹp cũng như bảo đảm sức khỏe, tôi khuyên mọi người nên nắm
      rõ các thông tin trên, cũng như hình thức thực hiện, ai sẽ tiến hành làm
      đẹp cho bạn và nếu có chuyện gì sẽ phải kiếm ai. Thân mến. (Trích GLTT của
      AloBacsi: )
    sentences:
      - "Chào AloBacsi,\r\n\r\nTôi muốn biết 1 lần có thể bán bao nhiêu máu và 1 tuần có thể bán bao nhiêu lần. Xin cảm ơn."
      - >-
        Kính thưa AloBacsi, Em viêm gan B mạn (HBsAg +; HbeAg +) từ trước khi có
        thai và nay em đang có thai ở tháng thứ 5 của thai kỳ. Em vừa đi xét
        nghiệm đếm virut và có kết quả: nồng độ virut (copies/mL) trong huyết
        tương: > 9,89 x 10^8; nồng độ virut (IU/mL) trong huyết tương: > 1,70 x
        10^8; ngưỡng phát hiện: >= 116 copies/mL. AST 26; ALT 34; GGT 19; Ure
        1,9; Creatinin 40. Anti-Hbe âm tính; Đông máu cơ bản: PT 113,1;
        Fibrinogen 5,6; APTT 28,1; Bệnh chứng 0,84; Số lượng INR 0,94. Kết quả
        siêu âm gan không to, nhu mô đều không có khối khu trú bất thường; đường
        mật trong gan, ống túi mật, túi mật, tĩnh mạch cửa, tuỵ, lách, thận
        phải, thận trái bình thường. Với các kết luận trên bác sĩ tại BV Bệnh
        nhiệt đới Trung ương kết luận chức năng gan của em bình thường. Nhưng
        điều trị di truyền sang con thì do ngưỡng virut của em lớn, thông thường
        người ta điều trị 3 tháng cuối nhưng ngưỡng virut của em cao nên cần
        điều trị 4 tháng đến khi sinh con. Và thuốc bác sĩ kê cho em là Protevir
        300mg - 120 viên. Nhưng em được biết thuốc điều trị virut phải được dùng
        khi HBeAg - nếu dừng thuốc virut sẽ bùng phát nhưng hướng dẫn sử dụng
        của thuốc cũng nói thuốc không được dùng khi cho con bú. Em đang rất băn
        khoăn đến lúc sinh em tiếp tục điều trị thuốc hay ngừng thuốc để cho con
        bú. Và giờ em đang mang thai tuần 23 có được dùng thêm thuốc bổ gan nào
        không? Tính tới ngày hôm nay em đã uống 3 viên Protevir. Mong AloBacsi
        giúp em em tiếp tục dùng thuốc hay dừng lại là tốt nhất cho thai nhi và
        khi sinh bé ra sau này. Mong muốn của em là sức khoẻ tốt nhất cho em bé.
        Em xin chân thành cảm ơn AloBacsi và mong sớm nhận được tư vấn. .
      - >-
        Em đang tìm hiểu thông tin để nâng mũi thì thấy nhiều quảng cáo về nâng
        mũi S-line rồi L-line, L-line cao tây, Nanoform, Surgiform… nên cảm thấy
        khá là rối. Nhờ bác sĩ cho biết hiện nay có những phương pháp nâng mũi
        nào ạ? Em cảm ơn.
  - source_sentence: ' Chào em, hình thành là do tổn thương các lớp thượng bì, nhưng lớp tế bào mầm, màng đáy hầu như còn nguyên vẹn. Em không nên chích cho bóng nước này vỡ, bởi vì đó được xem như lớp màng bảo vệ vùng da tổn thương bên dưới khỏi nhiễm khuẩn, khi vỡ sẽ dễ bị nhiễm trùng, cứ để “y nguyên” thì bóng nước sẽ tự khô dần. Em nên rửa vết thương hằng ngày bằng nước muối sinh lý (Nacl 0.9%), sau đó dùng gạc mềm chấm khô, thoa kem trị phỏng, và quấn lại bằng gạc lưới khô, không quấn quá chặt gây chèn ép, quấn đủ để che chắn tránh va đập thêm và giảm tiếp xúc với môi trường bẩn xung quanh. Trường hợp bóng nước lớn bể ra, da xung quanh viêm nề đau ngứa nhiều thì em cần khám chuyên khoa da liễu để được hướng dẫn, kê toa xử lý thích hợp. Trân trọng!'
    sentences:
      - >-
        Em bị kiến ba khoang cắn giờ nó nổi phồng như bị bỏng. Em có nên chọc
        thủng vết đó không ạ?
      - >-
        Chồng cháu bị gãy 2 xương cẳng chân, đã mổ chốt đinh. Cháu xin hỏi nên
        ăn uống những gì để mau phục hồi và có phải kiêng gì không ạ?
      - Nguy  hội chứng bartter
  - source_sentence: >-
      Chào em, Trước hết, thông tin em cung cấp thêm rất ít giá trị hỗ trợ chẩn
      đoán. Cụ thể là BS không biết “lúc trước em khám tổng quát” là lúc nào,
      lúc đó đã có các khó chịu hiện tại chưa… Thứ hai là siêu âm bụng, thử máu
      không phải là một “công cụ lọc bệnh”, siêu âm bụng và thử máu mà bình
      thường thì không có nghĩa là không có bệnh gì, vì xét nghiệm máu thì gồm
      nhiều loại lắm, và nhiều bệnh cho kết quả siêu âm bụng và thử máu cơ bản
      hoàn toàn bình thường. Hiện tại, các triệu chứng của em “trải dọc” theo
      ống tiêu hóa, phía trên thì khó nuốt, đau họng, muốn nôn, ở giữa thì đau
      bụng, và phía cuối thì đi cầu phân lỏng. Tình trạng này có thể gặp trong
      nhiều bệnh lý khác nhau, có thể xuất phát từ ổ viêm ở hầu họng kèm hội
      chứng ruột kích thích, có thể là viêm dạ dày ruột… Nhìn chung em cần khám
      chuyên khoa Tiêu hóa, để BS thăm khám trực tiếp cho em, hỏi kỹ bệnh sử,
      xem xét các xét nghiệm đã làm xem có cần thêm xét nghiệm gì khác không, từ
      đó sẽ có hướng chẩn đoán và điều trị thích hợp. Trong thời gian này, em
      nên nghỉ ngơi, ăn chín uống sạch, ăn thực phẩm dễ tiêu ít dầu mỡ, uống đầy
      đủ nước trong ngày. Thân mến.
    sentences:
      - Tìm hiểu chung dày sừng ánh sáng
      - "Bác sĩ cho em hỏi,\r\n\r\nEm năm nay 26 tuổi, không có hứng thú quen bạn gái, lông chân em không có, trắng mịn hơn chân con gái. Có phải em bị thiếu hoóc môn nam không ạ? Có cách nào giúp mọc lông chân không ạ? Em rất mất tự tin khi mặc quần ngắn."
      - "Thưa BS,\r\n\r\nEm hay bị đau bụng bất thường, đi cầu hay có phân lỏng và trong lúc ăn cơm hay ăn bất cứ đồ ăn nào thì có hiện tượng khó nuốt, đau cổ họng và muốn ói ra ngoài. Em không biết mình đã bị bệnh gì, mong BS trả lời giúp em ạ."
  - source_sentence: >-
      Chế độ sinh hoạt & phòng ngừa liệt dây hồi quy Những thói quen sinh hoạt
      có thể giúp bạn hạn chế diễn tiến của liệt dây hồi quy Chế độ sinh hoạt:
      Một số lưu ý trong sinh hoạt bạn cần chú ý để không làm tiến triển nặng
      tình trạng liệt dây thần kinh: Tuân thủ hướng dẫn của bác sĩ; Tránh các
      môn thể thao hoặc các sinh hoạt dễ gây chấn thương vùng đầu cổ. Chế độ
      dinh dưỡng: Bổ sung đầy đủ các chất cần thiết cho cơ thể. Nếu bạn có triệu
      chứng nuốt khó, chế độ ăn nên ưu tiên các thực phẩm dễ tiêu hóa, các thức
      ăn lỏng phòng ngừa bị sặc gây viêm phổi hít. Chế độ ăn nên ưu tiên các
      thực phẩm dễ tiêu hóa, các thức ăn lỏng phòng ngừa bị sặc gây viêm phổi
      hít Phương pháp phòng ngừa liệt dây hồi quy hiệu quả Khi bạn được chẩn
      đoán liệt dây thần kinh thanh quản quặt ngược, tùy vào mỗi nguyên nhân gây
      ra bệnh mà bác sĩ sẽ đưa ra phương pháp phòng ngừa phù hợp với bạn. Nếu
      bạn có các triệu chứng nghi ngờ nguyên nhân bệnh lý ác tính thì việc theo
      dõi triệu chứng là điều quan trọng. Tránh các hoạt động có thể chấn thương
      trực tiếp đến vùng cổ, ngực.
    sentences:
      - Chế độ sinh hoạt & phòng ngừa liệt dây hồi quy
      - Tìm hiểu chung viêm võng mạc
      - "Chào AloBacsi,\r\n\r\nTôi hay bị viêm họng và cảm cúm. Mỗi lần cảm cúm, sốt tôi đều uống Paracetamol, nhưng sau khi uống 5 - 10 phút tôi có cảm giác như hít phải khói than, ngứa cổ và gây ho. Có phải tôi bị mẫn cảm với Paracetamol không ạ? Xin cảm ơn. (Trường Giang - Hà Giang)"
  - source_sentence: >-
      Mô tả ngắn:

      Thuốc A.T Simvastatin 20  sản phẩm Công ty Cổ phần Dược phẩm An Thiên,
       thành phần chính  Simvastatin. Đây  thuốc được sử dụng để điều trị
      bổ sung cùng chế độ ăn kiêng để giảm hiện tượng tăng cholesterol toàn phần
      (C-toàn phần), cholesterol lipoprotein tỉ trọng thấp (LDL-C),
      apolipoprotein B (Apo B), triglyceride (TG),  cholesterol lipoprotein tỉ
      trọng không cao (không-HDL-C),  để tăng cholesterol lipoprotein tỉ trọng
      cao (HDL-C)  bệnh nhân  tăng cholesterol máu nguyên phát (dị hợp tử 
      tính chất gia đình  không  tính chất gia đình) hoặc tăng lipid máu hỗn
      hợp.

      Thành phần:

      Simvastatin: 20mg

      Chỉ định:

      Thuốc A.T Simvastatin 20 được chỉ định dùng trong các trường hợp sau:

      Tăng cholesterol máu nguyên phát, thuốc được chỉ định như điều trị bổ sung
      cùng chế độ ăn kiêng để giảm hiện tượng tăng cholesterol toàn phần (C-toàn
      phần), cholesterol lipoprotein tỉ trọng thấp (LDL-C), apolipoprotein B
      (Apo B), triglyceride (TG),  cholesterol lipoprotein tỉ trọng không cao
      (không-HDL-C),  để tăng cholesterol lipoprotein tỉ trọng cao (HDL-C) 
      bệnh nhân  tăng cholesterol máu nguyên phát (dị hợp tử  tính chất gia
      đình  không  tính chất gia đình) hoặc tăng lipid máu hỗn hợp.
    sentences:
      - >-
        Thuốc Camisept USP sử dụng để rửa sạch, phòng ngừa các bệnh nấm phụ khoa
        (220ml)
      - >-
        Thuốc A.T Simvastatin 20mg An Thiên điều trị Tăng cholesterol máu nguyên
        phát (3 vỉ x 10 viên)
      - "Chào BS,\r\n\r\nBS cho em hỏi mẹ em bị đau tất cả các khớp, có thuốc nào tốt không và em nghe có thuốc Glucosamin. Mẹ em bị viêm tai và đau họng thì không dùng được phải không ạ? Mong nhận được phản hồi từ BS. Em cảm ơn."
datasets:
  - meandyou200175/dataset_full_fixed
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy@1
  - cosine_accuracy@3
  - cosine_accuracy@5
  - cosine_accuracy@10
  - cosine_precision@1
  - cosine_precision@3
  - cosine_precision@5
  - cosine_precision@10
  - cosine_recall@1
  - cosine_recall@3
  - cosine_recall@5
  - cosine_recall@10
  - cosine_ndcg@10
  - cosine_mrr@10
  - cosine_map@100
model-index:
  - name: SentenceTransformer based on vinai/phobert-base-v2
    results:
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 768
          type: dim_768
        metrics:
          - type: cosine_accuracy@1
            value: 0.6490138787436085
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.7724616508400293
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.8140978816654493
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.8697954711468225
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.6490138787436085
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.2574872169466764
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.16281957633308983
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.08697954711468224
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.6490138787436085
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.7724616508400293
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.8140978816654493
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.8697954711468225
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.7567320390026925
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.7209091330712972
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.7261734236865027
            name: Cosine Map@100

SentenceTransformer based on vinai/phobert-base-v2

This is a sentence-transformers model finetuned from vinai/phobert-base-v2 on the dataset_full_fixed dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: vinai/phobert-base-v2
  • Maximum Sequence Length: 256 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity
  • Training Dataset:

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("phobert-base-v2-gloss")
# Run inference
sentences = [
    'Mô tả ngắn:\nThuốc A.T Simvastatin 20 là sản phẩm Công ty Cổ phần Dược phẩm An Thiên, có thành phần chính là Simvastatin. Đây là thuốc được sử dụng để điều trị bổ sung cùng chế độ ăn kiêng để giảm hiện tượng tăng cholesterol toàn phần (C-toàn phần), cholesterol lipoprotein tỉ trọng thấp (LDL-C), apolipoprotein B (Apo B), triglyceride (TG), và cholesterol lipoprotein tỉ trọng không cao (không-HDL-C), và để tăng cholesterol lipoprotein tỉ trọng cao (HDL-C) ở bệnh nhân có tăng cholesterol máu nguyên phát (dị hợp tử có tính chất gia đình và không có tính chất gia đình) hoặc tăng lipid máu hỗn hợp.\nThành phần:\nSimvastatin: 20mg\nChỉ định:\nThuốc A.T Simvastatin 20 được chỉ định dùng trong các trường hợp sau:\nTăng cholesterol máu nguyên phát, thuốc được chỉ định như điều trị bổ sung cùng chế độ ăn kiêng để giảm hiện tượng tăng cholesterol toàn phần (C-toàn phần), cholesterol lipoprotein tỉ trọng thấp (LDL-C), apolipoprotein B (Apo B), triglyceride (TG), và cholesterol lipoprotein tỉ trọng không cao (không-HDL-C), và để tăng cholesterol lipoprotein tỉ trọng cao (HDL-C) ở bệnh nhân có tăng cholesterol máu nguyên phát (dị hợp tử có tính chất gia đình và không có tính chất gia đình) hoặc tăng lipid máu hỗn hợp.',
    'Thuốc A.T Simvastatin 20mg An Thiên điều trị Tăng cholesterol máu nguyên phát (3 vỉ x 10 viên)',
    'Chào BS,\r\n\r\nBS cho em hỏi mẹ em bị đau tất cả các khớp, có thuốc nào tốt không và em nghe có thuốc Glucosamin. Mẹ em bị viêm tai và đau họng thì không dùng được phải không ạ? Mong nhận được phản hồi từ BS. Em cảm ơn.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Information Retrieval

Metric Value
cosine_accuracy@1 0.649
cosine_accuracy@3 0.7725
cosine_accuracy@5 0.8141
cosine_accuracy@10 0.8698
cosine_precision@1 0.649
cosine_precision@3 0.2575
cosine_precision@5 0.1628
cosine_precision@10 0.087
cosine_recall@1 0.649
cosine_recall@3 0.7725
cosine_recall@5 0.8141
cosine_recall@10 0.8698
cosine_ndcg@10 0.7567
cosine_mrr@10 0.7209
cosine_map@100 0.7262

Training Details

Training Dataset

dataset_full_fixed

  • Dataset: dataset_full_fixed at ef2e7fd
  • Size: 43,803 training samples
  • Columns: positive and query
  • Approximate statistics based on the first 1000 samples:
    positive query
    type string string
    details
    • min: 31 tokens
    • mean: 184.76 tokens
    • max: 256 tokens
    • min: 5 tokens
    • mean: 74.27 tokens
    • max: 256 tokens
  • Samples:
    positive query
    Chào em, Trước hết, em đã điều trị đứt dây chằng chéo trước chưa? Nếu em đã phẫu thuật điều trị đứt dây chằng chéo trước thì sau 3 tháng, em có thể bắt đầu tập yoga trở lại, tất nhiên là phải tập từ từ theo sức mình, các động tác từ dễ đến khó. Nếu em chưa điều trị đứt dây chằng chéo trước thì việc chơi các môn thể thao, kể cả yoga, cần tránh các động tác dùng đến cẳng chân - khớp gối vì có nguy cơ trật khớp. Khi bị dứt dây chằng chéo trước, phần mâm chày của cẳng chân có xu hướng bị bán trật ra trước lúc chạy nhảy, xoay người. Những người bị đứt dây chằng chéo trước đôi khi không biết mình bị đứt dây chằng mà chỉ thấy lâu lâu bị sụm té, nhất là khi chạy, nhảy, leo cầu thang hay khi đi nhanh và xoay người đột ngột. Sự bán trật khớp gối của người bị đứt dây chằng chéo trước khiến việc vận động mạnh của bệnh nhân hạn chế, mặt khác khớp gối thoái hóa do khớp gối bị bán trật thường xuyên. Đó là lý do khiến các bác sĩ phải mổ để tái tạo dây chằng chéo trước cho bệnh nhân. Đứt dây chằng thì ... Em bị dứt dây chằng chéo trước, vậy có thể tập được yoga không bác sĩ? Mong bác sĩ cho em lời khuyên ạ.
    Chào em, Hình ảnh X-quang như trên là bằng chứng gợi ý . Tuy nhiên, em cần làm thêm xét nghiệm đàm, tìm vi khuẩn lao (gọi là AFB đàm) làm tối thiểu 3 mẫu, nếu có 1 mẫu dương tính được chẩn đoán xác định lao phổi, em sẽ được điều trị tại trạm chống lao địa phương hoặc tại BV Phạm Ngọc Thạch tùy theo hiện trạng sức khỏe hiện tại. Trường hợp 3 mẫu đàm âm tính, nếu có các triệu chứng nhiễm lao chung em sẽ được làm thêm 3 mẫu đàm nữa và được hội chuẩn với chuyên gia hô hấp để xem xét điều trị lao. Thân mến! Xin chào bác sĩ,


    Kết quả X-quang là thâm nhiễm xơ vùng trên và sườn phải, vùng giữa bên trái. BS chẩn đoán là lao phổi có đúng không? Nếu chưa đủ kết luận thì làm thêm xét nghiệm gì nữa ạ? Xin cảm ơn BS.
    Chỉ số đường huyết lúc đói ở mức 5,45 mmol/L là bình thường Chào bạn Đường huyết đói được định nghĩa là đường huyết đo sau khi nhịn ăn ít nhất 8 giờ, lấy máu tĩnh mạch và buổi sáng. Đường huyết đói có chỉ số bình thường 70-100 mg/dL tương ứng 3,88- 5,55 mmol/L theo tiêu chuẩn Hiệp hội Đái tháo đường Hoa Kỳ (ADA). Do đó, đường huyết đói của bạn ở mức 5,42 là trong giới hạn bình thường bạn nhé! Chào bác sĩ,Kết quả xét nghiệm glucose lúc đói của em có chỉ số 5,42mmol/L. Như vậy có ổn không ạ?
  • Loss: GISTEmbedLoss with these parameters:
    {'guide': SentenceTransformer(
      (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
      (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
      (2): Normalize()
    ), 'temperature': 0.01, 'margin_strategy': 'absolute', 'margin': 0.0}
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: epoch
  • per_device_train_batch_size: 200
  • per_device_eval_batch_size: 200
  • learning_rate: 1e-06
  • num_train_epochs: 5
  • lr_scheduler_type: constant_with_warmup
  • warmup_ratio: 0.1
  • bf16: True
  • tf32: False
  • load_best_model_at_end: True
  • optim: adamw_torch_fused
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: epoch
  • prediction_loss_only: True
  • per_device_train_batch_size: 200
  • per_device_eval_batch_size: 200
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 1e-06
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 5
  • max_steps: -1
  • lr_scheduler_type: constant_with_warmup
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: False
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • eval_use_gather_object: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Click to expand
Epoch Step Training Loss dim_768_cosine_ndcg@10
-1 -1 - 0.1484
0.0455 10 11.4251 -
0.0909 20 11.4794 -
0.1364 30 11.3822 -
0.1818 40 10.7379 -
0.2273 50 10.3104 -
0.2727 60 9.7628 -
0.3182 70 8.6263 -
0.3636 80 8.1373 -
0.4091 90 7.1869 -
0.4545 100 6.3167 -
0.5 110 5.3152 -
0.5455 120 4.5314 -
0.5909 130 3.752 -
0.6364 140 3.3901 -
0.6818 150 2.947 -
0.7273 160 2.5918 -
0.7727 170 2.4167 -
0.8182 180 2.2655 -
0.8636 190 2.0746 -
0.9091 200 1.9378 -
0.9545 210 1.8902 -
1.0 220 1.5983 0.5831
1.0455 230 1.6749 -
1.0909 240 1.5945 -
1.1364 250 1.5606 -
1.1818 260 1.4134 -
1.2273 270 1.3958 -
1.2727 280 1.416 -
1.3182 290 1.4131 -
1.3636 300 1.2604 -
1.4091 310 1.2475 -
1.4545 320 1.1835 -
1.5 330 1.1184 -
1.5455 340 1.1365 -
1.5909 350 1.1258 -
1.6364 360 1.0866 -
1.6818 370 1.1356 -
1.7273 380 1.094 -
1.7727 390 1.0312 -
1.8182 400 1.0143 -
1.8636 410 0.943 -
1.9091 420 0.9405 -
1.9545 430 0.9687 -
2.0 440 0.8296 0.7100
2.0455 450 0.951 -
2.0909 460 0.9334 -
2.1364 470 0.8836 -
2.1818 480 0.8543 -
2.2273 490 0.9503 -
2.2727 500 0.8737 -
2.3182 510 0.8757 -
2.3636 520 0.8313 -
2.4091 530 0.7678 -
2.4545 540 0.8151 -
2.5 550 0.8573 -
2.5455 560 0.7598 -
2.5909 570 0.8508 -
2.6364 580 0.7947 -
2.6818 590 0.771 -
2.7273 600 0.8582 -
2.7727 610 0.7967 -
2.8182 620 0.8315 -
2.8636 630 0.8048 -
2.9091 640 0.8296 -
2.9545 650 0.7431 -
3.0 660 0.7041 0.7339
3.0455 670 0.7783 -
3.0909 680 0.7217 -
3.1364 690 0.7571 -
3.1818 700 0.6938 -
3.2273 710 0.7176 -
3.2727 720 0.7291 -
3.3182 730 0.7894 -
3.3636 740 0.7121 -
3.4091 750 0.7371 -
3.4545 760 0.6819 -
3.5 770 0.7264 -
3.5455 780 0.6336 -
3.5909 790 0.7073 -
3.6364 800 0.7376 -
3.6818 810 0.7071 -
3.7273 820 0.6733 -
3.7727 830 0.7581 -
3.8182 840 0.6735 -
3.8636 850 0.6495 -
3.9091 860 0.6835 -
3.9545 870 0.684 -
4.0 880 0.6506 0.7478
4.0455 890 0.6689 -
4.0909 900 0.6441 -
4.1364 910 0.7037 -
4.1818 920 0.5784 -
4.2273 930 0.663 -
4.2727 940 0.7332 -
4.3182 950 0.6072 -
4.3636 960 0.636 -
4.4091 970 0.6488 -
4.4545 980 0.6635 -
4.5 990 0.6138 -
4.5455 1000 0.6488 -
4.5909 1010 0.5974 -
4.6364 1020 0.6348 -
4.6818 1030 0.6153 -
4.7273 1040 0.6438 -
4.7727 1050 0.6058 -
4.8182 1060 0.6368 -
4.8636 1070 0.6268 -
4.9091 1080 0.6126 -
4.9545 1090 0.5718 -
5.0 1100 0.5638 0.7567
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.10.12
  • Sentence Transformers: 4.1.0
  • Transformers: 4.44.2
  • PyTorch: 2.7.0+cu128
  • Accelerate: 1.7.0
  • Datasets: 3.6.0
  • Tokenizers: 0.19.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

GISTEmbedLoss

@misc{solatorio2024gistembed,
    title={GISTEmbed: Guided In-sample Selection of Training Negatives for Text Embedding Fine-tuning},
    author={Aivin V. Solatorio},
    year={2024},
    eprint={2402.16829},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}