metadata
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:43803
- loss:GISTEmbedLoss
base_model: vinai/phobert-base-v2
widget:
- source_sentence: >-
Nâng mũi tiêm filler Chào bạn, Hiện, trên thị trường có rất nhiều quảng
cáo về việc nâng mũi, nhưng tóm lại chỉ có 4 phương pháp đó là: Nâng mũi
bằng bằng filler, chỉ Nâng mũi thường (đặt sóng đơn thuần) Nâng mũi bọc
sụn, bọc da nhân tạo Nâng mũi cấu trúc Dựa theo hình dáng của mũi, chẳng
hạn như thấp ở gốc mũi rồi uốn lượn thành hình chữ S được gọi là S-line,
hoặc mũi tương tự như chữ L sẽ gọi là L-line. Gần đây, nhiều chị em phụ nữ
xôn xao với các phương pháp nâng mũi như Nanoform, Surgiform, tuy nhiên
đây chỉ là vật liệu được sử dụng trong quá trình nâng mũi. Có thể thấy các
vậy liệu sử dụng trong nâng mũi là muôn hình vạn trạng, vì vậy trước khi
cân nhắc làm đẹp cũng như bảo đảm sức khỏe, tôi khuyên mọi người nên nắm
rõ các thông tin trên, cũng như hình thức thực hiện, ai sẽ tiến hành làm
đẹp cho bạn và nếu có chuyện gì sẽ phải kiếm ai. Thân mến. (Trích GLTT của
AloBacsi: )
sentences:
- "Chào AloBacsi,\r\n\r\nTôi muốn biết 1 lần có thể bán bao nhiêu máu và 1 tuần có thể bán bao nhiêu lần. Xin cảm ơn."
- >-
Kính thưa AloBacsi, Em viêm gan B mạn (HBsAg +; HbeAg +) từ trước khi có
thai và nay em đang có thai ở tháng thứ 5 của thai kỳ. Em vừa đi xét
nghiệm đếm virut và có kết quả: nồng độ virut (copies/mL) trong huyết
tương: > 9,89 x 10^8; nồng độ virut (IU/mL) trong huyết tương: > 1,70 x
10^8; ngưỡng phát hiện: >= 116 copies/mL. AST 26; ALT 34; GGT 19; Ure
1,9; Creatinin 40. Anti-Hbe âm tính; Đông máu cơ bản: PT 113,1;
Fibrinogen 5,6; APTT 28,1; Bệnh chứng 0,84; Số lượng INR 0,94. Kết quả
siêu âm gan không to, nhu mô đều không có khối khu trú bất thường; đường
mật trong gan, ống túi mật, túi mật, tĩnh mạch cửa, tuỵ, lách, thận
phải, thận trái bình thường. Với các kết luận trên bác sĩ tại BV Bệnh
nhiệt đới Trung ương kết luận chức năng gan của em bình thường. Nhưng
điều trị di truyền sang con thì do ngưỡng virut của em lớn, thông thường
người ta điều trị 3 tháng cuối nhưng ngưỡng virut của em cao nên cần
điều trị 4 tháng đến khi sinh con. Và thuốc bác sĩ kê cho em là Protevir
300mg - 120 viên. Nhưng em được biết thuốc điều trị virut phải được dùng
khi HBeAg - nếu dừng thuốc virut sẽ bùng phát nhưng hướng dẫn sử dụng
của thuốc cũng nói thuốc không được dùng khi cho con bú. Em đang rất băn
khoăn đến lúc sinh em tiếp tục điều trị thuốc hay ngừng thuốc để cho con
bú. Và giờ em đang mang thai tuần 23 có được dùng thêm thuốc bổ gan nào
không? Tính tới ngày hôm nay em đã uống 3 viên Protevir. Mong AloBacsi
giúp em em tiếp tục dùng thuốc hay dừng lại là tốt nhất cho thai nhi và
khi sinh bé ra sau này. Mong muốn của em là sức khoẻ tốt nhất cho em bé.
Em xin chân thành cảm ơn AloBacsi và mong sớm nhận được tư vấn. .
- >-
Em đang tìm hiểu thông tin để nâng mũi thì thấy nhiều quảng cáo về nâng
mũi S-line rồi L-line, L-line cao tây, Nanoform, Surgiform… nên cảm thấy
khá là rối. Nhờ bác sĩ cho biết hiện nay có những phương pháp nâng mũi
nào ạ? Em cảm ơn.
- source_sentence: ' Chào em, hình thành là do tổn thương các lớp thượng bì, nhưng lớp tế bào mầm, màng đáy hầu như còn nguyên vẹn. Em không nên chích cho bóng nước này vỡ, bởi vì đó được xem như lớp màng bảo vệ vùng da tổn thương bên dưới khỏi nhiễm khuẩn, khi vỡ sẽ dễ bị nhiễm trùng, cứ để “y nguyên” thì bóng nước sẽ tự khô dần. Em nên rửa vết thương hằng ngày bằng nước muối sinh lý (Nacl 0.9%), sau đó dùng gạc mềm chấm khô, thoa kem trị phỏng, và quấn lại bằng gạc lưới khô, không quấn quá chặt gây chèn ép, quấn đủ để che chắn tránh va đập thêm và giảm tiếp xúc với môi trường bẩn xung quanh. Trường hợp bóng nước lớn bể ra, da xung quanh viêm nề đau ngứa nhiều thì em cần khám chuyên khoa da liễu để được hướng dẫn, kê toa xử lý thích hợp. Trân trọng!'
sentences:
- >-
Em bị kiến ba khoang cắn giờ nó nổi phồng như bị bỏng. Em có nên chọc
thủng vết đó không ạ?
- >-
Chồng cháu bị gãy 2 xương cẳng chân, đã mổ chốt đinh. Cháu xin hỏi nên
ăn uống những gì để mau phục hồi và có phải kiêng gì không ạ?
- Nguy cơ hội chứng bartter
- source_sentence: >-
Chào em, Trước hết, thông tin em cung cấp thêm rất ít giá trị hỗ trợ chẩn
đoán. Cụ thể là BS không biết “lúc trước em khám tổng quát” là lúc nào,
lúc đó đã có các khó chịu hiện tại chưa… Thứ hai là siêu âm bụng, thử máu
không phải là một “công cụ lọc bệnh”, siêu âm bụng và thử máu mà bình
thường thì không có nghĩa là không có bệnh gì, vì xét nghiệm máu thì gồm
nhiều loại lắm, và nhiều bệnh cho kết quả siêu âm bụng và thử máu cơ bản
hoàn toàn bình thường. Hiện tại, các triệu chứng của em “trải dọc” theo
ống tiêu hóa, phía trên thì khó nuốt, đau họng, muốn nôn, ở giữa thì đau
bụng, và phía cuối thì đi cầu phân lỏng. Tình trạng này có thể gặp trong
nhiều bệnh lý khác nhau, có thể xuất phát từ ổ viêm ở hầu họng kèm hội
chứng ruột kích thích, có thể là viêm dạ dày ruột… Nhìn chung em cần khám
chuyên khoa Tiêu hóa, để BS thăm khám trực tiếp cho em, hỏi kỹ bệnh sử,
xem xét các xét nghiệm đã làm xem có cần thêm xét nghiệm gì khác không, từ
đó sẽ có hướng chẩn đoán và điều trị thích hợp. Trong thời gian này, em
nên nghỉ ngơi, ăn chín uống sạch, ăn thực phẩm dễ tiêu ít dầu mỡ, uống đầy
đủ nước trong ngày. Thân mến.
sentences:
- Tìm hiểu chung dày sừng ánh sáng
- "Bác sĩ cho em hỏi,\r\n\r\nEm năm nay 26 tuổi, không có hứng thú quen bạn gái, lông chân em không có, trắng mịn hơn chân con gái. Có phải em bị thiếu hoóc môn nam không ạ? Có cách nào giúp mọc lông chân không ạ? Em rất mất tự tin khi mặc quần ngắn."
- "Thưa BS,\r\n\r\nEm hay bị đau bụng bất thường, đi cầu hay có phân lỏng và trong lúc ăn cơm hay ăn bất cứ đồ ăn nào thì có hiện tượng khó nuốt, đau cổ họng và muốn ói ra ngoài. Em không biết mình đã bị bệnh gì, mong BS trả lời giúp em ạ."
- source_sentence: >-
Chế độ sinh hoạt & phòng ngừa liệt dây hồi quy Những thói quen sinh hoạt
có thể giúp bạn hạn chế diễn tiến của liệt dây hồi quy Chế độ sinh hoạt:
Một số lưu ý trong sinh hoạt bạn cần chú ý để không làm tiến triển nặng
tình trạng liệt dây thần kinh: Tuân thủ hướng dẫn của bác sĩ; Tránh các
môn thể thao hoặc các sinh hoạt dễ gây chấn thương vùng đầu cổ. Chế độ
dinh dưỡng: Bổ sung đầy đủ các chất cần thiết cho cơ thể. Nếu bạn có triệu
chứng nuốt khó, chế độ ăn nên ưu tiên các thực phẩm dễ tiêu hóa, các thức
ăn lỏng phòng ngừa bị sặc gây viêm phổi hít. Chế độ ăn nên ưu tiên các
thực phẩm dễ tiêu hóa, các thức ăn lỏng phòng ngừa bị sặc gây viêm phổi
hít Phương pháp phòng ngừa liệt dây hồi quy hiệu quả Khi bạn được chẩn
đoán liệt dây thần kinh thanh quản quặt ngược, tùy vào mỗi nguyên nhân gây
ra bệnh mà bác sĩ sẽ đưa ra phương pháp phòng ngừa phù hợp với bạn. Nếu
bạn có các triệu chứng nghi ngờ nguyên nhân bệnh lý ác tính thì việc theo
dõi triệu chứng là điều quan trọng. Tránh các hoạt động có thể chấn thương
trực tiếp đến vùng cổ, ngực.
sentences:
- Chế độ sinh hoạt & phòng ngừa liệt dây hồi quy
- Tìm hiểu chung viêm võng mạc
- "Chào AloBacsi,\r\n\r\nTôi hay bị viêm họng và cảm cúm. Mỗi lần cảm cúm, sốt tôi đều uống Paracetamol, nhưng sau khi uống 5 - 10 phút tôi có cảm giác như hít phải khói than, ngứa cổ và gây ho. Có phải tôi bị mẫn cảm với Paracetamol không ạ? Xin cảm ơn. (Trường Giang - Hà Giang)"
- source_sentence: >-
Mô tả ngắn:
Thuốc A.T Simvastatin 20 là sản phẩm Công ty Cổ phần Dược phẩm An Thiên,
có thành phần chính là Simvastatin. Đây là thuốc được sử dụng để điều trị
bổ sung cùng chế độ ăn kiêng để giảm hiện tượng tăng cholesterol toàn phần
(C-toàn phần), cholesterol lipoprotein tỉ trọng thấp (LDL-C),
apolipoprotein B (Apo B), triglyceride (TG), và cholesterol lipoprotein tỉ
trọng không cao (không-HDL-C), và để tăng cholesterol lipoprotein tỉ trọng
cao (HDL-C) ở bệnh nhân có tăng cholesterol máu nguyên phát (dị hợp tử có
tính chất gia đình và không có tính chất gia đình) hoặc tăng lipid máu hỗn
hợp.
Thành phần:
Simvastatin: 20mg
Chỉ định:
Thuốc A.T Simvastatin 20 được chỉ định dùng trong các trường hợp sau:
Tăng cholesterol máu nguyên phát, thuốc được chỉ định như điều trị bổ sung
cùng chế độ ăn kiêng để giảm hiện tượng tăng cholesterol toàn phần (C-toàn
phần), cholesterol lipoprotein tỉ trọng thấp (LDL-C), apolipoprotein B
(Apo B), triglyceride (TG), và cholesterol lipoprotein tỉ trọng không cao
(không-HDL-C), và để tăng cholesterol lipoprotein tỉ trọng cao (HDL-C) ở
bệnh nhân có tăng cholesterol máu nguyên phát (dị hợp tử có tính chất gia
đình và không có tính chất gia đình) hoặc tăng lipid máu hỗn hợp.
sentences:
- >-
Thuốc Camisept USP sử dụng để rửa sạch, phòng ngừa các bệnh nấm phụ khoa
(220ml)
- >-
Thuốc A.T Simvastatin 20mg An Thiên điều trị Tăng cholesterol máu nguyên
phát (3 vỉ x 10 viên)
- "Chào BS,\r\n\r\nBS cho em hỏi mẹ em bị đau tất cả các khớp, có thuốc nào tốt không và em nghe có thuốc Glucosamin. Mẹ em bị viêm tai và đau họng thì không dùng được phải không ạ? Mong nhận được phản hồi từ BS. Em cảm ơn."
datasets:
- meandyou200175/dataset_full_fixed
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- cosine_accuracy@1
- cosine_accuracy@3
- cosine_accuracy@5
- cosine_accuracy@10
- cosine_precision@1
- cosine_precision@3
- cosine_precision@5
- cosine_precision@10
- cosine_recall@1
- cosine_recall@3
- cosine_recall@5
- cosine_recall@10
- cosine_ndcg@10
- cosine_mrr@10
- cosine_map@100
model-index:
- name: SentenceTransformer based on vinai/phobert-base-v2
results:
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: dim 768
type: dim_768
metrics:
- type: cosine_accuracy@1
value: 0.6490138787436085
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.7724616508400293
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.8140978816654493
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.8697954711468225
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.6490138787436085
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.2574872169466764
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.16281957633308983
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.08697954711468224
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.6490138787436085
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.7724616508400293
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.8140978816654493
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.8697954711468225
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.7567320390026925
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.7209091330712972
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.7261734236865027
name: Cosine Map@100
SentenceTransformer based on vinai/phobert-base-v2
This is a sentence-transformers model finetuned from vinai/phobert-base-v2 on the dataset_full_fixed dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: vinai/phobert-base-v2
- Maximum Sequence Length: 256 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Cosine Similarity
- Training Dataset:
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("phobert-base-v2-gloss")
# Run inference
sentences = [
'Mô tả ngắn:\nThuốc A.T Simvastatin 20 là sản phẩm Công ty Cổ phần Dược phẩm An Thiên, có thành phần chính là Simvastatin. Đây là thuốc được sử dụng để điều trị bổ sung cùng chế độ ăn kiêng để giảm hiện tượng tăng cholesterol toàn phần (C-toàn phần), cholesterol lipoprotein tỉ trọng thấp (LDL-C), apolipoprotein B (Apo B), triglyceride (TG), và cholesterol lipoprotein tỉ trọng không cao (không-HDL-C), và để tăng cholesterol lipoprotein tỉ trọng cao (HDL-C) ở bệnh nhân có tăng cholesterol máu nguyên phát (dị hợp tử có tính chất gia đình và không có tính chất gia đình) hoặc tăng lipid máu hỗn hợp.\nThành phần:\nSimvastatin: 20mg\nChỉ định:\nThuốc A.T Simvastatin 20 được chỉ định dùng trong các trường hợp sau:\nTăng cholesterol máu nguyên phát, thuốc được chỉ định như điều trị bổ sung cùng chế độ ăn kiêng để giảm hiện tượng tăng cholesterol toàn phần (C-toàn phần), cholesterol lipoprotein tỉ trọng thấp (LDL-C), apolipoprotein B (Apo B), triglyceride (TG), và cholesterol lipoprotein tỉ trọng không cao (không-HDL-C), và để tăng cholesterol lipoprotein tỉ trọng cao (HDL-C) ở bệnh nhân có tăng cholesterol máu nguyên phát (dị hợp tử có tính chất gia đình và không có tính chất gia đình) hoặc tăng lipid máu hỗn hợp.',
'Thuốc A.T Simvastatin 20mg An Thiên điều trị Tăng cholesterol máu nguyên phát (3 vỉ x 10 viên)',
'Chào BS,\r\n\r\nBS cho em hỏi mẹ em bị đau tất cả các khớp, có thuốc nào tốt không và em nghe có thuốc Glucosamin. Mẹ em bị viêm tai và đau họng thì không dùng được phải không ạ? Mong nhận được phản hồi từ BS. Em cảm ơn.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Information Retrieval
- Dataset:
dim_768
- Evaluated with
InformationRetrievalEvaluator
with these parameters:{ "truncate_dim": 768 }
Metric | Value |
---|---|
cosine_accuracy@1 | 0.649 |
cosine_accuracy@3 | 0.7725 |
cosine_accuracy@5 | 0.8141 |
cosine_accuracy@10 | 0.8698 |
cosine_precision@1 | 0.649 |
cosine_precision@3 | 0.2575 |
cosine_precision@5 | 0.1628 |
cosine_precision@10 | 0.087 |
cosine_recall@1 | 0.649 |
cosine_recall@3 | 0.7725 |
cosine_recall@5 | 0.8141 |
cosine_recall@10 | 0.8698 |
cosine_ndcg@10 | 0.7567 |
cosine_mrr@10 | 0.7209 |
cosine_map@100 | 0.7262 |
Training Details
Training Dataset
dataset_full_fixed
- Dataset: dataset_full_fixed at ef2e7fd
- Size: 43,803 training samples
- Columns:
positive
andquery
- Approximate statistics based on the first 1000 samples:
positive query type string string details - min: 31 tokens
- mean: 184.76 tokens
- max: 256 tokens
- min: 5 tokens
- mean: 74.27 tokens
- max: 256 tokens
- Samples:
positive query Chào em, Trước hết, em đã điều trị đứt dây chằng chéo trước chưa? Nếu em đã phẫu thuật điều trị đứt dây chằng chéo trước thì sau 3 tháng, em có thể bắt đầu tập yoga trở lại, tất nhiên là phải tập từ từ theo sức mình, các động tác từ dễ đến khó. Nếu em chưa điều trị đứt dây chằng chéo trước thì việc chơi các môn thể thao, kể cả yoga, cần tránh các động tác dùng đến cẳng chân - khớp gối vì có nguy cơ trật khớp. Khi bị dứt dây chằng chéo trước, phần mâm chày của cẳng chân có xu hướng bị bán trật ra trước lúc chạy nhảy, xoay người. Những người bị đứt dây chằng chéo trước đôi khi không biết mình bị đứt dây chằng mà chỉ thấy lâu lâu bị sụm té, nhất là khi chạy, nhảy, leo cầu thang hay khi đi nhanh và xoay người đột ngột. Sự bán trật khớp gối của người bị đứt dây chằng chéo trước khiến việc vận động mạnh của bệnh nhân hạn chế, mặt khác khớp gối thoái hóa do khớp gối bị bán trật thường xuyên. Đó là lý do khiến các bác sĩ phải mổ để tái tạo dây chằng chéo trước cho bệnh nhân. Đứt dây chằng thì ...
Em bị dứt dây chằng chéo trước, vậy có thể tập được yoga không bác sĩ? Mong bác sĩ cho em lời khuyên ạ.
Chào em, Hình ảnh X-quang như trên là bằng chứng gợi ý . Tuy nhiên, em cần làm thêm xét nghiệm đàm, tìm vi khuẩn lao (gọi là AFB đàm) làm tối thiểu 3 mẫu, nếu có 1 mẫu dương tính được chẩn đoán xác định lao phổi, em sẽ được điều trị tại trạm chống lao địa phương hoặc tại BV Phạm Ngọc Thạch tùy theo hiện trạng sức khỏe hiện tại. Trường hợp 3 mẫu đàm âm tính, nếu có các triệu chứng nhiễm lao chung em sẽ được làm thêm 3 mẫu đàm nữa và được hội chuẩn với chuyên gia hô hấp để xem xét điều trị lao. Thân mến!
Xin chào bác sĩ,
Kết quả X-quang là thâm nhiễm xơ vùng trên và sườn phải, vùng giữa bên trái. BS chẩn đoán là lao phổi có đúng không? Nếu chưa đủ kết luận thì làm thêm xét nghiệm gì nữa ạ? Xin cảm ơn BS.Chỉ số đường huyết lúc đói ở mức 5,45 mmol/L là bình thường Chào bạn Đường huyết đói được định nghĩa là đường huyết đo sau khi nhịn ăn ít nhất 8 giờ, lấy máu tĩnh mạch và buổi sáng. Đường huyết đói có chỉ số bình thường 70-100 mg/dL tương ứng 3,88- 5,55 mmol/L theo tiêu chuẩn Hiệp hội Đái tháo đường Hoa Kỳ (ADA). Do đó, đường huyết đói của bạn ở mức 5,42 là trong giới hạn bình thường bạn nhé!
Chào bác sĩ,Kết quả xét nghiệm glucose lúc đói của em có chỉ số 5,42mmol/L. Như vậy có ổn không ạ?
- Loss:
GISTEmbedLoss
with these parameters:{'guide': SentenceTransformer( (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True}) (2): Normalize() ), 'temperature': 0.01, 'margin_strategy': 'absolute', 'margin': 0.0}
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: epochper_device_train_batch_size
: 200per_device_eval_batch_size
: 200learning_rate
: 1e-06num_train_epochs
: 5lr_scheduler_type
: constant_with_warmupwarmup_ratio
: 0.1bf16
: Truetf32
: Falseload_best_model_at_end
: Trueoptim
: adamw_torch_fusedbatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: epochprediction_loss_only
: Trueper_device_train_batch_size
: 200per_device_eval_batch_size
: 200per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 1e-06weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 5max_steps
: -1lr_scheduler_type
: constant_with_warmuplr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Truefp16
: Falsefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Falselocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Trueignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torch_fusedoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Falsehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseeval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseeval_use_gather_object
: Falseprompts
: Nonebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Click to expand
Epoch | Step | Training Loss | dim_768_cosine_ndcg@10 |
---|---|---|---|
-1 | -1 | - | 0.1484 |
0.0455 | 10 | 11.4251 | - |
0.0909 | 20 | 11.4794 | - |
0.1364 | 30 | 11.3822 | - |
0.1818 | 40 | 10.7379 | - |
0.2273 | 50 | 10.3104 | - |
0.2727 | 60 | 9.7628 | - |
0.3182 | 70 | 8.6263 | - |
0.3636 | 80 | 8.1373 | - |
0.4091 | 90 | 7.1869 | - |
0.4545 | 100 | 6.3167 | - |
0.5 | 110 | 5.3152 | - |
0.5455 | 120 | 4.5314 | - |
0.5909 | 130 | 3.752 | - |
0.6364 | 140 | 3.3901 | - |
0.6818 | 150 | 2.947 | - |
0.7273 | 160 | 2.5918 | - |
0.7727 | 170 | 2.4167 | - |
0.8182 | 180 | 2.2655 | - |
0.8636 | 190 | 2.0746 | - |
0.9091 | 200 | 1.9378 | - |
0.9545 | 210 | 1.8902 | - |
1.0 | 220 | 1.5983 | 0.5831 |
1.0455 | 230 | 1.6749 | - |
1.0909 | 240 | 1.5945 | - |
1.1364 | 250 | 1.5606 | - |
1.1818 | 260 | 1.4134 | - |
1.2273 | 270 | 1.3958 | - |
1.2727 | 280 | 1.416 | - |
1.3182 | 290 | 1.4131 | - |
1.3636 | 300 | 1.2604 | - |
1.4091 | 310 | 1.2475 | - |
1.4545 | 320 | 1.1835 | - |
1.5 | 330 | 1.1184 | - |
1.5455 | 340 | 1.1365 | - |
1.5909 | 350 | 1.1258 | - |
1.6364 | 360 | 1.0866 | - |
1.6818 | 370 | 1.1356 | - |
1.7273 | 380 | 1.094 | - |
1.7727 | 390 | 1.0312 | - |
1.8182 | 400 | 1.0143 | - |
1.8636 | 410 | 0.943 | - |
1.9091 | 420 | 0.9405 | - |
1.9545 | 430 | 0.9687 | - |
2.0 | 440 | 0.8296 | 0.7100 |
2.0455 | 450 | 0.951 | - |
2.0909 | 460 | 0.9334 | - |
2.1364 | 470 | 0.8836 | - |
2.1818 | 480 | 0.8543 | - |
2.2273 | 490 | 0.9503 | - |
2.2727 | 500 | 0.8737 | - |
2.3182 | 510 | 0.8757 | - |
2.3636 | 520 | 0.8313 | - |
2.4091 | 530 | 0.7678 | - |
2.4545 | 540 | 0.8151 | - |
2.5 | 550 | 0.8573 | - |
2.5455 | 560 | 0.7598 | - |
2.5909 | 570 | 0.8508 | - |
2.6364 | 580 | 0.7947 | - |
2.6818 | 590 | 0.771 | - |
2.7273 | 600 | 0.8582 | - |
2.7727 | 610 | 0.7967 | - |
2.8182 | 620 | 0.8315 | - |
2.8636 | 630 | 0.8048 | - |
2.9091 | 640 | 0.8296 | - |
2.9545 | 650 | 0.7431 | - |
3.0 | 660 | 0.7041 | 0.7339 |
3.0455 | 670 | 0.7783 | - |
3.0909 | 680 | 0.7217 | - |
3.1364 | 690 | 0.7571 | - |
3.1818 | 700 | 0.6938 | - |
3.2273 | 710 | 0.7176 | - |
3.2727 | 720 | 0.7291 | - |
3.3182 | 730 | 0.7894 | - |
3.3636 | 740 | 0.7121 | - |
3.4091 | 750 | 0.7371 | - |
3.4545 | 760 | 0.6819 | - |
3.5 | 770 | 0.7264 | - |
3.5455 | 780 | 0.6336 | - |
3.5909 | 790 | 0.7073 | - |
3.6364 | 800 | 0.7376 | - |
3.6818 | 810 | 0.7071 | - |
3.7273 | 820 | 0.6733 | - |
3.7727 | 830 | 0.7581 | - |
3.8182 | 840 | 0.6735 | - |
3.8636 | 850 | 0.6495 | - |
3.9091 | 860 | 0.6835 | - |
3.9545 | 870 | 0.684 | - |
4.0 | 880 | 0.6506 | 0.7478 |
4.0455 | 890 | 0.6689 | - |
4.0909 | 900 | 0.6441 | - |
4.1364 | 910 | 0.7037 | - |
4.1818 | 920 | 0.5784 | - |
4.2273 | 930 | 0.663 | - |
4.2727 | 940 | 0.7332 | - |
4.3182 | 950 | 0.6072 | - |
4.3636 | 960 | 0.636 | - |
4.4091 | 970 | 0.6488 | - |
4.4545 | 980 | 0.6635 | - |
4.5 | 990 | 0.6138 | - |
4.5455 | 1000 | 0.6488 | - |
4.5909 | 1010 | 0.5974 | - |
4.6364 | 1020 | 0.6348 | - |
4.6818 | 1030 | 0.6153 | - |
4.7273 | 1040 | 0.6438 | - |
4.7727 | 1050 | 0.6058 | - |
4.8182 | 1060 | 0.6368 | - |
4.8636 | 1070 | 0.6268 | - |
4.9091 | 1080 | 0.6126 | - |
4.9545 | 1090 | 0.5718 | - |
5.0 | 1100 | 0.5638 | 0.7567 |
- The bold row denotes the saved checkpoint.
Framework Versions
- Python: 3.10.12
- Sentence Transformers: 4.1.0
- Transformers: 4.44.2
- PyTorch: 2.7.0+cu128
- Accelerate: 1.7.0
- Datasets: 3.6.0
- Tokenizers: 0.19.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
GISTEmbedLoss
@misc{solatorio2024gistembed,
title={GISTEmbed: Guided In-sample Selection of Training Negatives for Text Embedding Fine-tuning},
author={Aivin V. Solatorio},
year={2024},
eprint={2402.16829},
archivePrefix={arXiv},
primaryClass={cs.LG}
}