--- tags: - sentence-transformers - sentence-similarity - feature-extraction - generated_from_trainer - dataset_size:32292 - loss:TripletLoss base_model: keepitreal/vietnamese-sbert widget: - source_sentence: 2. Trách nhiệm của Bộ Công an trong việc thực hiện bảo hiểm cháy, nổ bắt buộc? sentences: - '. Nguồn thu từ bảo hiểm cháy, nổ bắt buộc cho hoạt động phòng cháy, chữa cháy được sử dụng như sau: a) Hỗ trợ trang bị phương tiện, thiết bị phòng cháy, chữa cháy cho lực lượng Cảnh sát phòng cháy và chữa cháy. Chi cho nội dung này không vượt quá % số tiền thực tế thu được từ bảo hiểm cháy, nổ bắt buộc của các doanh nghiệp bảo hiểm trong năm tài chính. b) Hỗ trợ tuyên truyền, phổ biến pháp luật, kiến thức phòng cháy, chữa cháy và bảo hiểm cháy, nổ bắt buộc. Chi cho nội dung này không vượt quá % số tiền thực tế thu được từ bảo hiểm cháy, nổ bắt buộc của các doanh nghiệp bảo hiểm trong năm tài chính. c) Hỗ trợ lực lượng Cảnh sát phòng cháy và chữa cháy trong các hoạt động sau: Điều tra nguyên nhân vụ cháy; bồi dưỡng nghiệp vụ, kiểm tra an toàn về phòng cháy và chữa cháy; giám sát việc tham gia bảo hiểm cháy, nổ bắt buộc của các cơ sở có nguy hiểm về cháy, nổ. Chi cho nội dung này không vượt quá % số tiền thực tế thu được từ bảo hiểm cháy, nổ bắt buộc của các doanh nghiệp bảo hiểm trong năm tài chính. d) Hỗ trợ khen thưởng thành tích của tổ chức, cá nhân trực tiếp tham gia, phối hợp trong công tác phòng cháy, chữa cháy. Chi cho nội dung này không vượt quá % số tiền thực tế thu được từ bảo hiểm cháy, nổ bắt buộc của các doanh nghiệp bảo hiểm trong năm tài chính”.' - . Nghị định này quy định nguyên tắc, trình tự, thủ tục thi hành các biện pháp giám sát, giáo dục người dưới tuổi phạm tội được miễn trách nhiệm hình sự; quyền và nghĩa vụ của người được giám sát, giáo dục; trách nhiệm của gia đình, cơ quan, tổ chức, cá nhân có liên quan trong việc giám sát, giáo dục người dưới tuổi phạm tội được miễn trách nhiệm hình sự; trách nhiệm của các bộ, Ủy ban nhân dân các cấp trong việc tổ chức thi hành các biện pháp giám sát, giáo dục. - . Doanh nghiệp khoa học và công nghệ được miễn, giảm tiền thuê đất, thuê mặt nước theo quy định của pháp luật về đất đai. - source_sentence: Các trường hợp người trúng tuyển viên chức được miễn thực hiện chế độ tập sự được quy định như thế nào? sentences: - . Sửa đổi, bổ sung như sau:“. Trong thời hạn ngày làm việc, kể từ ngày hết thời hạn đọc hồ sơ theo quy định tại của Luật này, cơ quan lập hồ sơ đề nghị quy định tại và của Luật này gửi hồ sơ cho Chủ tịch Ủy ban nhân dân cấp xã.Trong thời hạn ngày làm việc, kể từ ngày nhận được hồ sơ, Chủ tịch Ủy ban nhân dân cấp xã tổ chức và chủ trì cuộc họp tư vấn với sự tham gia của Trưởng Công an cấp xã, công chức tư pháp - hộ tịch, đại diện Ủy ban Mặt trận Tổ quốc Việt Nam và một số tổ chức chính trị - xã hội, tổ chức xã hội cùng cấp có liên quan, đại diện dân cư ở cơ sở. Người bị đề nghị áp dụng biện pháp giáo dục tại xã, phường, thị trấn, người đại diện hợp pháp của họ, cha mẹ, người giám hộ của người chưa thành niên phải được mời tham gia cuộc họp và phát biểu ý kiến của mình về việc áp dụng biện pháp.”. - '. Cấp có thẩm quyền bổ nhiệm chủ trì hoặc ủy quyền chủ trì thực hiện quy trình bổ nhiệm đối với các trường hợp sau: a) Bổ nhiệm người đứng đầu, cấp phó của người đứng đầu đơn vị sự nghiệp công lập mới được thành lập; b) Trường hợp thực hiện quy trình bổ nhiệm mà thời điểm đó đơn vị sự nghiệp công lập chỉ có lãnh đạo là người đứng đầu hoặc là cấp phó của người đứng đầu hoặc khuyết vị trí lãnh đạo hoặc thực hiện quy trình bổ nhiệm lãnh đạo là người đứng đầu; c) Trường hợp thực hiện quy trình bổ nhiệm mà thời điểm đó nội bộ lãnh đạo đơn vị sự nghiệp công lập mất đoàn kết, nhiều người vi phạm kỷ luật, nếu thực hiện quy trình bổ nhiệm sẽ thiếu khách quan; d) Trường hợp vì thiên tai, tai nạn hoặc vì các lý do bất khả kháng khác mà đơn vị sự nghiệp công lập không còn người lãnh đạo, quản lý.Người chủ trì có quyền bỏ phiếu tại các bước theo quy định.' - . Tổ chức chứng nhận sự phù hợp thực hiện việc chứng nhận hợp chuẩn hoặc chứng nhận hợp quy hoặc cả chứng nhận hợp chuẩn và chứng nhận hợp quy. - source_sentence: Thủ tục cấp Giấy phép lưu hành xe quá tải trọng được quy định như thế nào? sentences: - . Cục Đường cao tốc Việt Nam chịu trách nhiệm công bố tải trọng và khổ giới hạn của các tuyến đường cao tốc được phân cấp, ủy quyền trên Trang Thông tin điện tử của Cục Đường cao tốc Việt Nam; đồng thời gửi số liệu về Cục Đường bộ Việt Nam để cập nhật trên Trang thông tin điện tử của Cục Đường bộ Việt Nam. - . Chế độ báo cáo của Sở giao dịch chứng khoán a) Sở giao dịch chứng khoán thực hiện chế độ báo cáo định kỳ hàng quý, hàng năm cho Ủy ban Chứng khoán Nhà nước về tình hình chào bán, giao dịch trái phiếu doanh nghiệp gồm chào bán tại thị trường trong nước và chào bán ra thị trường quốc tế. b) Ngoài chế độ báo cáo định kỳ theo quy định tại điểm a khoản này, Sở giao dịch chứng khoán báo cáo đột xuất cho Ủy ban Chứng khoán Nhà nước theo yêu cầu của cơ quan quản lý. - '. Xe ô tô tải, xe ô tô tải chuyên dùng, xe ô tô chuyên dùng là loại xe ô tô được định nghĩa tại các tiêu chuẩn TCVN : , TCVN : .' - source_sentence: Trình tự thực hiện thủ tục giải thể trung tâm giáo dục thường xuyên được quy định như thế nào? sentences: - '. Trung tâm giáo dục thường xuyên bị giải thể khi xảy ra một trong các trường hợp sau đây: a) Vi phạm nghiêm trọng các quy định về quản lý, tổ chức, hoạt động của trung tâm; b) Hết thời gian đình chỉ ghi trong quyết định đình chỉ hoạt động mà không khắc phục được nguyên nhân dẫn đến việc đình chỉ; c) Mục tiêu và nội dung hoạt động trong quyết định thành lập trung tâm giáo dục thường xuyên không còn phù hợp với yêu cầu phát triển kinh tế - xã hội tại địa phương.' - . Áp dụng thuế suất đối với hàng hóa xuất khẩu tại chỗ, nhập khẩu tại chỗ a) Hàng hóa xuất khẩu tại chỗ áp dụng mức thuế suất thuế xuất khẩu quy định tại của Chính phủ về Biểu thuế xuất khẩu, Biểu thuế nhập khẩu ưu đãi, Danh mục hàng hóa và mức thuế tuyệt đối, thuế hỗn hợp, thuế nhập khẩu ngoài hạn ngạch thuế quan (sau đây gọi là ), của Chính phủ sửa đổi, bổ sung một số điều của và của Chính phủ sửa đổi, bổ sung một số điều của (sau đây gọi là ) và văn bản sửa đổi, bổ sung, thay thế (nếu có). b) Hàng hóa nhập khẩu tại chỗ (trừ hàng hóa nhập khẩu tại chỗ từ khu phi thuế quan quy định tại điểm c khoản này) áp dụng mức thuế suất thuế nhập khẩu ưu đãi quy định tại , và văn bản sửa đổi, bổ sung, thay thế (nếu có). c) Hàng hóa đáp ứng điều kiện xuất xứ từ nước, nhóm nước hoặc vùng lãnh thổ thực hiện đối xử tối huệ quốc trong quan hệ thương mại với Việt Nam nhập khẩu tại chỗ từ khu phi thuế quan vào thị trường trong nước; hàng hóa sản xuất, gia công, tái chế, lắp ráp tại khu phi thuế quan không đáp ứng các điều kiện để hưởng thuế suất thuế nhập khẩu ưu đãi đặc biệt nhập khẩu tại chỗ từ khu phi thuế quan vào thị trường trong nước, áp dụng mức thuế suất thuế nhập khẩu ưu đãi quy định tại , và văn bản sửa đổi, bổ sung, thay thế (nếu có).Hàng hóa đáp ứng điều kiện xuất xứ từ nước, nhóm nước hoặc vùng lãnh thổ có thỏa thuận ưu đãi đặc biệt về thuế nhập khẩu trong quan hệ thương mại với Việt Nam nhập khẩu tại chỗ từ khu phi thuế quan vào thị trường trong nước và đáp ứng các điều kiện khác để hưởng thuế suất thuế nhập khẩu ưu đãi đặc biệt; hàng hóa sản xuất, gia công, tái chế, lắp ráp tại khu phi thuế quan đáp ứng các điều kiện để hưởng thuế suất thuế nhập khẩu ưu đãi đặc biệt nhập khẩu tại chỗ từ khu phi thuế quan vào thị trường trong nước, áp dụng mức thuế suất thuế nhập khẩu ưu đãi đặc biệt quy định tại các Nghị định của Chính phủ về Biểu thuế nhập khẩu ưu đãi đặc biệt để thực hiện điều ước quốc tế mà Cộng hòa xã hội chủ nghĩa Việt Nam là thành viên.Hàng hóa nhập khẩu không đáp ứng điều kiện xuất xứ từ nước, nhóm nước hoặc vùng lãnh thổ thực hiện đối xử tối huệ quốc và không đáp ứng các điều kiện để được hưởng mức thuế suất thuế nhập khẩu ưu đãi đặc biệt nhập khẩu tại chỗ từ khu phi thuế quan vào thị trường trong nước - . Hạn mức vay nước ngoài trung, dài hạn theo phương thức tự vay tự trả là mức vay thương mại nước ngoài trung, dài hạn của doanh nghiệp, tổ chức tài chính, tín dụng, chi nhánh ngân hàng nước ngoài, hợp tác xã, liên minh hợp tác xã được xác định bằng số tiền vay thực nhận trừ đi số trả nợ gốc trong kỳ tính hạn mức. - source_sentence: Việc kiểm định chất lượng đầu vào công chức tổ chức hằng năm như thế nào? sentences: - . Việc kiểm định chất lượng đầu vào công chức được tổ chức định kỳ lần vào tháng và tháng hàng năm. - . Cơ sở mua bán, xuất khẩu, nhập khẩu, chuyển nhượng trang thiết bị y tế, nguyên liệu sản xuất, chất ngoại kiểm có chứa chất ma túy và tiền chất có trách nhiệm báo cáo gửi Bộ Y tế và gửi Bộ Công an theo định kỳ hằng năm trước ngày tháng của năm tiếp theo. - . Sửa đổi điểm b như sau:“ b) Tổ chức thi vòng :Thí sinh được thông báo kết quả vòng ngay sau khi kết thúc thời gian làm bài thi. Không thực hiện việc phúc khảo đối với kết quả thi vòng .”. pipeline_tag: sentence-similarity library_name: sentence-transformers metrics: - cosine_accuracy model-index: - name: SentenceTransformer based on keepitreal/vietnamese-sbert results: - task: type: triplet name: Triplet dataset: name: ai job validation type: ai-job-validation metrics: - type: cosine_accuracy value: 0.9546999931335449 name: Cosine Accuracy --- # SentenceTransformer based on keepitreal/vietnamese-sbert This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [keepitreal/vietnamese-sbert](https://huggingface.co/keepitreal/vietnamese-sbert). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more. ## Model Details ### Model Description - **Model Type:** Sentence Transformer - **Base model:** [keepitreal/vietnamese-sbert](https://huggingface.co/keepitreal/vietnamese-sbert) - **Maximum Sequence Length:** 256 tokens - **Output Dimensionality:** 768 dimensions - **Similarity Function:** Cosine Similarity ### Model Sources - **Documentation:** [Sentence Transformers Documentation](https://sbert.net) - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers) - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers) ### Full Model Architecture ``` SentenceTransformer( (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True}) ) ``` ## Usage ### Direct Usage (Sentence Transformers) First install the Sentence Transformers library: ```bash pip install -U sentence-transformers ``` Then you can load this model and run inference. ```python from sentence_transformers import SentenceTransformer # Download from the 🤗 Hub model = SentenceTransformer("sentence_transformers_model_id") # Run inference sentences = [ 'Việc kiểm định chất lượng đầu vào công chức tổ chức hằng năm như thế nào?', '. Việc kiểm định chất lượng đầu vào công chức được tổ chức định kỳ lần vào tháng và tháng hàng năm.', '. Cơ sở mua bán, xuất khẩu, nhập khẩu, chuyển nhượng trang thiết bị y tế, nguyên liệu sản xuất, chất ngoại kiểm có chứa chất ma túy và tiền chất có trách nhiệm báo cáo gửi Bộ Y tế và gửi Bộ Công an theo định kỳ hằng năm trước ngày tháng của năm tiếp theo.', ] embeddings = model.encode(sentences) print(embeddings.shape) # [3, 768] # Get the similarity scores for the embeddings similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [3, 3] ``` ## Evaluation ### Metrics #### Triplet * Dataset: `ai-job-validation` * Evaluated with [TripletEvaluator](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator) | Metric | Value | |:--------------------|:-----------| | **cosine_accuracy** | **0.9547** | ## Training Details ### Training Dataset #### Unnamed Dataset * Size: 32,292 training samples * Columns: sentence_0, sentence_1, and sentence_2 * Approximate statistics based on the first 1000 samples: | | sentence_0 | sentence_1 | sentence_2 | |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | string | | details | | | | * Samples: | sentence_0 | sentence_1 | sentence_2 | |:-------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | Nhiệm vụ, quyền hạn của cơ quan thanh tra ở cơ quan thuộc Chính phủ như thế nào? | . Cơ quan thanh tra ở cơ quan thuộc Chính phủ thực hiện nhiệm vụ thanh tra trong phạm vi quản lý của cơ quan thuộc Chính phủ. | . Sỹ quan máy trực ca có nhiệm vụ sau đây: a) Điều hành thợ máy, sỹ quan kỹ thuật điện, thợ kỹ thuật điện; thường xuyên theo dõi chế độ làm việc của các máy, thiết bị, lò, nồi hơi theo đúng quy trình kỹ thuật; b) Tổ chức thực hiện nhiệm vụ của ca trực ở buồng máy, buồng lò, bảo đảm trật tự và vệ sinh công nghiệp ở buồng máy; c) Bảo đảm các máy móc thuộc bộ phận máy hoạt động bình thường, an toàn và xử lý kịp thời các sự cố xảy ra; d) Theo dõi công việc sửa chữa của những người trên bờ xuống tàu làm việc thuộc bộ phận mình phụ trách, bảo đảm an toàn lao động, phòng chống cháy nổ, an toàn kỹ thuật cho tàu và phòng ngừa ô nhiễm môi trường; đ) Theo dõi tiêu hao nhiên liệu, sử dụng các vật tư kỹ thuật của tàu; e) Tiến hành đo dầu, nước ở các két; bơm nước la canh buồng máy, nước dằn, nhiên liệu để điều chỉnh tàu theo yêu cầu của sỹ quan boong trực ca; khi tiến hành bơm nước thải các loại phải thực hiện theo đúng quy định; g) Khi tàu hành trình, sỹ quan máy trực ca có nhiệm vụ thực hiện nghi... | | Trách nhiệm của thương nhân, tổ chức cung cấp dịch vụ sàn giao dịch thương mại điện tử được quy định như thế nào? | . Nhà đầu tư có hoạt động đầu tư vào doanh nghiệp nhỏ và vừa khởi nghiệp sáng tạo theo quy định của pháp luật về hỗ trợ doanh nghiệp nhỏ và vừa không phải thực hiện quy định tại Điều này.”. Sửa đổi, bổ sung như sau:“. Tổ chức thực hiện. Bộ Công Thương có trách nhiệm: a) Thực hiện quản lý hoạt động thương mại điện tử, thúc đẩy chuyển đổi số trong lĩnh vực thương mại; b) Phối hợp với Bộ Thông tin và Truyền thông, Bộ Công an trong bảo vệ an toàn thông tin, an ninh mạng đối với hoạt động thương mại điện tử. Kiến nghị Bộ Công an xử lý theo pháp luật đối với các hành vi vi phạm về an ninh mạng trong thương mại điện tử; c) Tổ chức thông tin, phổ biến, truyền thông về pháp luật liên quan đến hoạt động thương mại điện tử; d) Thanh tra, kiểm tra, giải quyết khiếu nại và xử lý vi phạm về hoạt động thương mại điện tử; đ) Hướng dẫn, kiểm tra việc tổ chức thực hiện Nghị định này. | . Trong Thông tư này, tỷ lệ tổn thương cơ thể (sau đây được gọi tắt là: TTCT) được dùng chung cho tỷ lệ suy giảm khả năng lao động, tỷ lệ thương tích, tỷ lệ thương tật, tỷ lệ bệnh tật, tỷ lệ tổn hại sức khỏe. | | 2. Không đi nghĩa vụ quân sự theo lệnh gọi nhập ngũ bị xử phạt hành chính như thế nào? | . Bổ sung vào sau “. Hình thức xử phạt. Đối với mỗi hành vi vi phạm hành chính trong lĩnh vực quốc phòng, cơ yếu, tổ chức, cá nhân phải chịu hình thức xử phạt chính là cảnh cáo hoặc phạt tiền. | . Người nào không chấp hành đúng quy định của pháp luật về đăng ký nghĩa vụ quân sự, không chấp hành lệnh gọi nhập ngũ, lệnh gọi tập trung huấn luyện, đã bị xử phạt hành chính về hành vi này hoặc đã bị kết án về tội này, chưa được xoá án tích mà còn vi phạm, thì bị phạt cải tạo không giam giữ đến hai năm hoặc phạt tù từ ba tháng đến hai năm. | * Loss: [TripletLoss](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#tripletloss) with these parameters: ```json { "distance_metric": "TripletDistanceMetric.COSINE", "triplet_margin": 0.3 } ``` ### Training Hyperparameters #### Non-Default Hyperparameters - `eval_strategy`: steps - `per_device_train_batch_size`: 32 - `per_device_eval_batch_size`: 32 - `multi_dataset_batch_sampler`: round_robin #### All Hyperparameters
Click to expand - `overwrite_output_dir`: False - `do_predict`: False - `eval_strategy`: steps - `prediction_loss_only`: True - `per_device_train_batch_size`: 32 - `per_device_eval_batch_size`: 32 - `per_gpu_train_batch_size`: None - `per_gpu_eval_batch_size`: None - `gradient_accumulation_steps`: 1 - `eval_accumulation_steps`: None - `torch_empty_cache_steps`: None - `learning_rate`: 5e-05 - `weight_decay`: 0.0 - `adam_beta1`: 0.9 - `adam_beta2`: 0.999 - `adam_epsilon`: 1e-08 - `max_grad_norm`: 1 - `num_train_epochs`: 3 - `max_steps`: -1 - `lr_scheduler_type`: linear - `lr_scheduler_kwargs`: {} - `warmup_ratio`: 0.0 - `warmup_steps`: 0 - `log_level`: passive - `log_level_replica`: warning - `log_on_each_node`: True - `logging_nan_inf_filter`: True - `save_safetensors`: True - `save_on_each_node`: False - `save_only_model`: False - `restore_callback_states_from_checkpoint`: False - `no_cuda`: False - `use_cpu`: False - `use_mps_device`: False - `seed`: 42 - `data_seed`: None - `jit_mode_eval`: False - `use_ipex`: False - `bf16`: False - `fp16`: False - `fp16_opt_level`: O1 - `half_precision_backend`: auto - `bf16_full_eval`: False - `fp16_full_eval`: False - `tf32`: None - `local_rank`: 0 - `ddp_backend`: None - `tpu_num_cores`: None - `tpu_metrics_debug`: False - `debug`: [] - `dataloader_drop_last`: False - `dataloader_num_workers`: 0 - `dataloader_prefetch_factor`: None - `past_index`: -1 - `disable_tqdm`: False - `remove_unused_columns`: True - `label_names`: None - `load_best_model_at_end`: False - `ignore_data_skip`: False - `fsdp`: [] - `fsdp_min_num_params`: 0 - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False} - `fsdp_transformer_layer_cls_to_wrap`: None - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None} - `deepspeed`: None - `label_smoothing_factor`: 0.0 - `optim`: adamw_torch - `optim_args`: None - `adafactor`: False - `group_by_length`: False - `length_column_name`: length - `ddp_find_unused_parameters`: None - `ddp_bucket_cap_mb`: None - `ddp_broadcast_buffers`: False - `dataloader_pin_memory`: True - `dataloader_persistent_workers`: False - `skip_memory_metrics`: True - `use_legacy_prediction_loop`: False - `push_to_hub`: False - `resume_from_checkpoint`: None - `hub_model_id`: None - `hub_strategy`: every_save - `hub_private_repo`: None - `hub_always_push`: False - `gradient_checkpointing`: False - `gradient_checkpointing_kwargs`: None - `include_inputs_for_metrics`: False - `include_for_metrics`: [] - `eval_do_concat_batches`: True - `fp16_backend`: auto - `push_to_hub_model_id`: None - `push_to_hub_organization`: None - `mp_parameters`: - `auto_find_batch_size`: False - `full_determinism`: False - `torchdynamo`: None - `ray_scope`: last - `ddp_timeout`: 1800 - `torch_compile`: False - `torch_compile_backend`: None - `torch_compile_mode`: None - `include_tokens_per_second`: False - `include_num_input_tokens_seen`: False - `neftune_noise_alpha`: None - `optim_target_modules`: None - `batch_eval_metrics`: False - `eval_on_start`: False - `use_liger_kernel`: False - `eval_use_gather_object`: False - `average_tokens_across_devices`: False - `prompts`: None - `batch_sampler`: batch_sampler - `multi_dataset_batch_sampler`: round_robin
### Training Logs | Epoch | Step | Training Loss | ai-job-validation_cosine_accuracy | |:------:|:----:|:-------------:|:---------------------------------:| | -1 | -1 | - | 0.6577 | | 0.1980 | 200 | - | 0.8359 | | 0.3960 | 400 | - | 0.9021 | | 0.4950 | 500 | 0.1213 | - | | 0.5941 | 600 | - | 0.9176 | | 0.7921 | 800 | - | 0.9388 | | 0.9901 | 1000 | 0.0303 | 0.9411 | | 1.0 | 1010 | - | 0.9463 | | 1.1881 | 1200 | - | 0.9437 | | 1.3861 | 1400 | - | 0.9530 | | 1.4851 | 1500 | 0.0135 | - | | 1.5842 | 1600 | - | 0.9494 | | 1.7822 | 1800 | - | 0.9547 | ### Framework Versions - Python: 3.11.13 - Sentence Transformers: 4.1.0 - Transformers: 4.52.4 - PyTorch: 2.6.0+cu124 - Accelerate: 1.8.1 - Datasets: 3.6.0 - Tokenizers: 0.21.2 ## Citation ### BibTeX #### Sentence Transformers ```bibtex @inproceedings{reimers-2019-sentence-bert, title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks", author = "Reimers, Nils and Gurevych, Iryna", booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing", month = "11", year = "2019", publisher = "Association for Computational Linguistics", url = "https://arxiv.org/abs/1908.10084", } ``` #### TripletLoss ```bibtex @misc{hermans2017defense, title={In Defense of the Triplet Loss for Person Re-Identification}, author={Alexander Hermans and Lucas Beyer and Bastian Leibe}, year={2017}, eprint={1703.07737}, archivePrefix={arXiv}, primaryClass={cs.CV} } ```