SentenceTransformer based on bkai-foundation-models/vietnamese-bi-encoder
This is a sentence-transformers model finetuned from bkai-foundation-models/vietnamese-bi-encoder on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: bkai-foundation-models/vietnamese-bi-encoder
- Maximum Sequence Length: 256 tokens
- Output Dimensionality: 768 tokens
- Similarity Function: Cosine Similarity
- Training Dataset:
- json
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("tanbinh2210/vietnamese-bi-encoder-on-vbpl-with-neg")
# Run inference
sentences = [
'Biên_bản tạm giữ tài_liệu , đồ_vật được lập như_thế_nào và có những nội_dung gì ?',
'thư_tín , điện_tín , bưu_kiện , bưu_phẩm bị thu_giữ biết . Nếu việc thông_báo cản_trở điều_tra thì sau khi cản_trở đó không còn nữa , cơ_quan ra_lệnh thu_giữ phải thông_báo ngay . Điều 198 . Tạm giữ tài_liệu , đồ_vật khi khám_xét 1 . Khi khám_xét , Điều_tra_viên được tạm giữ đồ_vật là vật_chứng và tài_liệu có liên_quan trực_tiếp đến vụ án . Đối_với đồ_vật thuộc loại cấm tàng_trữ , lưu_hành thì phải thu_giữ và chuyển ngay cho cơ_quan quản_lý có thẩm_quyền . Trường_hợp cần_thiết phải niêm_phong thì tiến_hành trước mặt chủ_sở_hữu đồ_vật , người_quản_lý đồ_vật , người chứng_kiến , đại_diện gia_đình , đại_diện chính_quyền xã , phường , thị_trấn nơi khám_xét . 2 . Việc tạm giữ tài_liệu , đồ_vật khi tiến_hành khám_xét được lập biên_bản theo quy_định tại Điều 133 của Bộ_luật này . Biên_bản tạm giữ được lập thành bốn bản , trong đó một bản giao cho người chủ tài_liệu , đồ_vật hoặc người_quản_lý tài_liệu , đồ_vật , một bản đưa vào hồ_sơ vụ án , một bản giao cho Viện_kiểm_sát cùng cấp và một bản giao cho cơ_quan quản_lý tài_liệu , đồ_vật bị tạm giữ .',
'tài_liệu điện_tử về tạm giữ , tạm giam . Chương II QUY_ĐỊNH CỤ_THỂ Điều 5 . Hồ_sơ quản_lý tạm giữ , tạm giam 1 . Hồ_sơ giấy , gồm các loại tài_liệu quy_định tại Khoản 1 , Khoản 2 Điều 17 Luật Thi_hành tạm giữ , tạm giam . 2 . Hồ_sơ điện_tử là tập_hợp thông_tin chứa các thông_tin cơ_bản liên_quan đến người bị tạm giữ , người bị tạm giam quy_định tại Khoản 1 , Khoản 2 Điều 17 Luật Thi_hành tạm giữ , tạm giam . Điều 6 . Tổ_chức , cá_nhân lập , quản_lý , lưu_trữ hồ_sơ quản_lý tạm giữ , tạm giam 1 . Cơ_quan lập , quản_lý , lưu_trữ hồ_sơ quản_lý tạm giữ , tạm giam a ) Cơ_quan Quản_lý thi_hành án hình_sự Bộ Quốc_phòng ; b ) Cơ_quan Thi_hành án hình_sự cấp quân_khu ; c ) Bộ_Chỉ_huy Bộ_đội biên_phòng cấp tỉnh có Đồn biên_phòng được tổ_chức buồng tạm giữ ; d ) Trại tạm giam thuộc Bộ Quốc_phòng , quân_khu , quân_đoàn ; đ ) Cơ_quan Điều_tra hình_sự khu_vực có nhà tạm giữ ; e ) Đồn biên_phòng có buồng tạm giữ ; 2 . Cá_nhân lập , quản_lý , lưu_trữ hồ_sơ quản_lý tạm giữ , tạm giam a ) Nhân_viên lưu_trữ ; b ) Trợ_lý giam_giữ kiêm hồ_sơ ;',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Training Details
Training Dataset
json
- Dataset: json
- Size: 194,225 training samples
- Columns:
query
,pos
, andneg
- Approximate statistics based on the first 1000 samples:
query pos neg type string string string details - min: 9 tokens
- mean: 19.54 tokens
- max: 51 tokens
- min: 88 tokens
- mean: 179.38 tokens
- max: 256 tokens
- min: 67 tokens
- mean: 180.11 tokens
- max: 256 tokens
- Samples:
query pos neg Phân_biệt đối_xử trong việc_làm và nghề_nghiệp có bị nghiêm_cấm không ?
lao_động , người sử_dụng lao_động theo quy_định của pháp_luật . 3 . Cá_nhân có trách_nhiệm chủ_động tìm_kiếm việc_làm và tham_gia tạo việc_làm . Điều 9 . Những hành_vi bị nghiêm_cấm 1 . Phân_biệt đối_xử trong việc_làm và nghề_nghiệp . 2 . Xâm_phạm thân_thể , danh_dự , nhân_phẩm , tài_sản , quyền , lợi_ích hợp_pháp của người lao_động , người sử_dụng lao_động . 3 . Tuyển_dụng , sử_dụng người lao_động vào làm_việc trái quy_định của pháp_luật . 4 . Dụ_dỗ , hứa_hẹn và quảng_cáo gian_dối để lừa_gạt người lao_động hoặc lợi_dụng dịch_vụ việc_làm , thông_tin thị_trường lao_động để thực_hiện những hành_vi trái pháp_luật . 5 . Gian_lận , giả_mạo hồ_sơ trong việc thực_hiện chính_sách về việc_làm . 6 . Cản_trở , gây khó_khăn hoặc làm thiệt_hại đến quyền và lợi_ích hợp_pháp của người lao_động , người sử_dụng lao_động . Chương II CHÍNH_SÁCH HỖ_TRỢ TẠO VIỆC_LÀM Mục 1 CHÍNH_SÁCH TÍN_DỤNG ƯU_ĐÃI TẠO VIỆC_LÀM Điều 10 . Tín_dụng ưu_đãi tạo việc_làm Nhà_nước thực_hiện chính_sách tín_dụng ưu_đãi để hỗ_trợ tạo việc_làm , duy_trì và mở_rộng việc_làm từ Quỹ quốc_gia về việc_làm và các nguồn tín_dụng khác .
làm_việc ở nước_ngoài theo quy_định của Luật này . 2 . Người sử_dụng lao_động ở nước_ngoài là doanh_nghiệp , tổ_chức , cá_nhân trực_tiếp thuê_mướn , sử_dụng người lao_động Việt_Nam làm_việc cho mình ở nước_ngoài theo hợp_đồng lao_động . 3 . Bên nước_ngoài tiếp_nhận lao_động là người sử_dụng lao_động ở nước_ngoài , tổ_chức dịch_vụ việc_làm ở nước_ngoài . 4 . Phân_biệt đối_xử là hành_vi phân_biệt , loại_trừ hoặc ưu_tiên dựa trên chủng_tộc , màu_da , nguồn_gốc quốc_gia hoặc nguồn_gốc xã_hội , dân_tộc , giới_tính , độ tuổi , tình_trạng thai_sản , tình_trạng hôn_nhân , tôn_giáo , tín_ngưỡng , chính_kiến , khuyết_tật , trách_nhiệm gia_đình hoặc trên cơ_sở tình_trạng nhiễm HIV hoặc vì lý_do thành_lập , gia_nhập và hoạt_động công_đoàn , tổ_chức của người lao_động tại doanh_nghiệp có tác_động làm ảnh_hưởng đến bình_đẳng về cơ_hội việc_làm hoặc nghề_nghiệp . Việc phân_biệt , loại_trừ hoặc ưu_tiên xuất_phát từ yêu_cầu đặc_thù của công_việc và các hành_vi duy_trì , bảo_vệ việc_làm cho người lao_động dễ bị tổn_thương thì không bị xem là phân_biệt đối_xử .
Công_ty tôi bị phong_tỏa tài_khoản vì liên_quan đến hành_vi phạm_tội , nhưng tài_khoản đó cũng có tiền_của cá_nhân tôi , tôi có bị ảnh_hưởng không ?
nhượng , đánh_tráo , cất_giấu , hủy_hoại tài_sản bị kê_biên thì người này phải chịu trách_nhiệm theo quy_định của pháp_luật . 3 . Khi kê_biên tài_sản của pháp_nhân phải có_mặt những người sau : a ) Người đại_diện theo pháp_luật của pháp_nhân ; b ) Đại_diện chính_quyền xã , phường , thị_trấn nơi pháp_nhân có tài_sản bị kê_biên ; c ) Người chứng_kiến . 4 . Thẩm_quyền , trình_tự , thủ_tục kê_biên tài_sản được thực_hiện theo quy_định tại Điều 128 của Bộ_luật này . Điều 438 . Phong_tỏa tài_khoản 1 . Phong_tỏa tài_khoản áp_dụng đối_với pháp_nhân bị khởi_tố , điều_tra , truy_tố , xét_xử về tội mà Bộ_luật_hình_sự quy_định hình_phạt tiền hoặc để bảo_đảm bồi_thường thiệt_hại và có căn_cứ xác_định pháp_nhân đó có tài_khoản tại tổ_chức tín_dụng hoặc Kho_bạc Nhà_nước . 2 . Phong_tỏa tài_khoản cũng được áp_dụng đối_với tài_khoản của cá_nhân , tổ_chức khác nếu có căn_cứ xác_định số tiền trong tài_khoản đó liên_quan đến hành_vi phạm_tội của pháp_nhân . 3 . Chỉ phong_tỏa số tiền trong tài_khoản tương_ứng với mức có_thể phạt tiền hoặc bồi_thường thiệt_hại .
phán chủ tọa phiên tòa có quyền ra_lệnh phong_tỏa tài_khoản . Lệnh phong_tỏa tài_khoản của những người được quy_định tại điểm a_khoản 1 Điều 113 của Bộ_luật này phải được thông_báo ngay cho Viện_kiểm_sát cùng cấp trước khi thi_hành . 3 . Chỉ phong_tỏa số tiền trong tài_khoản tương_ứng với mức có_thể bị phạt tiền , bị tịch_thu tài_sản hoặc bồi_thường thiệt_hại . Người được giao thực_hiện lệnh phong_tỏa , quản_lý tài_khoản bị phong_tỏa mà giải_tỏa việc phong_tỏa tài_khoản thì phải chịu trách_nhiệm hình_sự theo quy_định của Bộ_luật_hình_sự .
Cơ_quan đại_diện ngoại_giao , cơ_quan lãnh_sự và tổ_chức quốc_tế có vai_trò gì trong việc giải_quyết kinh_phí đưa người chấp_hành án phạt trục_xuất về nước ?
Nam đối_với người chấp_hành án , Tòa_án phải gửi quyết_định đó cho cơ_quan thi_hành án hình_sự Công_an cấp tỉnh nơi Tòa_án đã ra quyết_định thi_hành án có trụ_sở , Viện_kiểm_sát cùng cấp . Điều 124 . Chi_phí trục_xuất Người chấp_hành án phạt trục_xuất phải chịu chi_phí vé máy_bay , ô_tô , tàu hỏa , tàu_biển để rời khỏi lãnh_thổ Việt_Nam ; trường_hợp người chấp_hành án phạt trục_xuất không có khả_năng tự chịu chi_phí thì cơ_quan thi_hành án hình_sự Công_an cấp tỉnh phối_hợp với cơ_quan quản_lý xuất_nhập_cảnh yêu_cầu cơ_quan đại_diện ngoại_giao , cơ_quan lãnh_sự của nước mà người đó mang quốc_tịch hoặc cơ_quan đại_diện của tổ_chức quốc_tế mà người đó làm_việc , cơ_quan , tổ_chức đã bảo_lãnh người đó vào Việt_Nam giải_quyết kinh_phí đưa người chấp_hành án phạt trục_xuất về nước ; trường_hợp đã yêu_cầu mà cơ_quan , tổ_chức đó vẫn chưa giải_quyết được kinh_phí nhưng vì lý_do an_ninh quốc_gia cần phải trục_xuất ngay thì Thủ_trưởng cơ_quan thi_hành án hình_sự Công_an cấp tỉnh báo_cáo cơ_quan quản_lý thi_hành án hình_sự thuộc Bộ Công_an quyết_định việc sử_dụng ngân_sách nhà_nước chi_trả vé máy_bay , ô_tô , tàu hỏa , tàu_biển cho người chấp_hành án phạt trục_xuất .
nhiệm của Bộ Ngoại_giao 1 . Giải_quyết các thủ_tục đối_ngoại liên_quan đến việc thi_hành quyết_định trục_xuất và các thủ_tục có liên_quan khác đối_với trường_hợp người bị tạm giữ , áp_giải theo thủ_tục hành_chính là người nước_ngoài . 2 . Trao_đổi , cung_cấp thông_tin liên_quan cho các cơ_quan có thẩm_quyền nước_ngoài , cơ_quan đại_diện ngoại_giao và lãnh_sự của nước mà người mang hộ_chiếu hoặc giấy_tờ thay_thế hộ_chiếu bị áp_dụng biện_pháp tạm giữ , áp_giải theo thủ_tục hành_chính và áp_dụng hình_thức xử_phạt trục_xuất . 3 . Chỉ_đạo các Sở Ngoại_vụ phối_hợp với các cơ_quan_chức_năng , cơ_quan đại_diện ngoại_giao hoặc cơ_quan đại_diện lãnh_sự của nước mà người mang hộ_chiếu hoặc giấy_tờ thay_thế hộ_chiếu bị tạm giữ hành_chính , bị trục_xuất ( trong trường_hợp bị chết ) để giải_quyết . Điều 36 . Trách_nhiệm của Bộ Tài_chính Bảo_đảm kinh_phí cho việc áp_dụng biện_pháp tạm giữ , áp_giải người theo thủ_tục hành_chính và áp_dụng hình_thức xử_phạt trục_xuất theo kế_hoạch được giao trong dự_toán ngân_sách hàng năm của Bộ Công_an . Điều 37 . Trách_nhiệm của Bộ Y_tế
- Loss:
MultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Evaluation Dataset
json
- Dataset: json
- Size: 194,225 evaluation samples
- Columns:
query
,pos
, andneg
- Approximate statistics based on the first 1000 samples:
query pos neg type string string string details - min: 9 tokens
- mean: 19.75 tokens
- max: 49 tokens
- min: 72 tokens
- mean: 181.41 tokens
- max: 256 tokens
- min: 65 tokens
- mean: 178.38 tokens
- max: 256 tokens
- Samples:
query pos neg Thẩm_phán chủ tọa phiên tòa có những nhiệm_vụ và quyền_hạn gì trong vụ án hình_sự ?
vụ án hình_sự có những nhiệm_vụ , quyền_hạn : a ) Nghiên_cứu hồ_sơ vụ án trước khi mở phiên tòa ; b ) Tiến_hành xét_xử vụ án ; c ) Tiến_hành hoạt_động tố_tụng và biểu_quyết những vấn_đề thuộc thẩm_quyền của Hội_đồng xét_xử ; d ) Tiến_hành hoạt_động tố_tụng khác thuộc thẩm_quyền của Tòa_án theo sự phân_công của Chánh_án Tòa_án . 2 . Thẩm_phán chủ tọa phiên tòa có những nhiệm_vụ , quyền_hạn quy_định tại khoản 1 Điều này và những nhiệm_vụ , quyền_hạn : a ) Quyết_định áp_dụng , thay_đổi , hủy bỏ biện_pháp ngăn_chặn , biện_pháp cưỡng_chế , trừ biện_pháp tạm giam ; b ) Quyết_định trả hồ_sơ để điều_tra bổ_sung ; c ) Quyết_định đưa vụ án ra xét_xử ; quyết_định đình_chỉ hoặc tạm đình_chỉ vụ án ; d ) Điều_hành việc xét_xử vụ án , tranh_tụng tại phiên tòa ; đ ) Quyết_định trưng_cầu giám_định , giám_định bổ_sung hoặc giám_định lại , thực_nghiệm điều_tra ; thay_đổi hoặc yêu_cầu thay_đổi người giám_định ; yêu_cầu định_giá tài_sản , yêu_cầu thay_đổi người định_giá tài_sản ;
cá_nhân cung_cấp tài_liệu , chứng_cứ hoặc xác_minh , thu_thập tài_liệu , chứng_cứ theo quy_định của Luật này ; 11 . Chủ_tọa hoặc tham_gia Hội_đồng xét_xử vụ án hành_chính ; biểu_quyết những vấn_đề thuộc thẩm_quyền của Hội_đồng xét_xử ; 12 . Xem_xét về tính hợp_pháp của văn_bản hành_chính , hành_vi hành_chính có liên_quan đến quyết_định hành_chính , hành_vi hành_chính bị kiện và đề_nghị Chánh_án Tòa_án kiến_nghị với cơ_quan , cá_nhân có thẩm_quyền xem_xét văn_bản hành_chính , hành_vi hành_chính đó theo quy_định của pháp_luật ; 13 . Phát_hiện và đề_nghị Chánh_án Tòa_án kiến_nghị với cơ_quan có thẩm_quyền xem_xét , sửa_đổi , bổ_sung hoặc bãi_bỏ văn_bản quy_phạm_pháp_luật có dấu_hiệu trái với Hiến_pháp , luật , văn_bản quy_phạm_pháp_luật của cơ_quan nhà_nước cấp trên theo quy_định của Luật này ; 14 . Xử_lý hành_vi cản_trở hoạt_động tố_tụng_hành_chính theo quy_định của pháp_luật ; 15 . Thực_hiện nhiệm_vụ , quyền_hạn khác theo quy_định của Luật này . Điều 39 . Nhiệm_vụ , quyền_hạn của Hội_thẩm_nhân_dân Khi được Chánh_án Tòa_án phân_công , Hội_thẩm_nhân_dân có những nhiệm_vụ , quyền_hạn sau đây :
Khi phê_duyệt quy_hoạch_đô_thị , quy_hoạch xây_dựng nông_thôn , quy_hoạch xây_dựng khu công_nghiệp , khu nghiên_cứu đào_tạo , cơ_quan nhà_nước có thẩm_quyền có trách_nhiệm xác_định rõ diện_tích đất để xây_dựng nhà ở xã_hội như_thế_nào ?
duyệt quy_hoạch_đô_thị , quy_hoạch xây_dựng nông_thôn , quy_hoạch xây_dựng khu công_nghiệp , khu nghiên_cứu đào_tạo , Ủy_ban_nhân_dân có thẩm_quyền phê_duyệt quy_hoạch có trách_nhiệm xác_định rõ diện_tích đất để xây_dựng nhà ở xã_hội . 2 . Diện_tích đất và các thông_tin về khu_vực , địa_điểm dành để phát_triển nhà ở xã_hội phải được công_bố công_khai trên Cổng thông_tin điện_tử của Ủy_ban_nhân_dân cấp tỉnh và cơ_quan quản_lý nhà ở cấp tỉnh . 3 . Đất để phát_triển nhà ở xã_hội bao_gồm : a ) Đất được Nhà_nước giao để xây_dựng nhà ở cho thuê , cho thuê mua , bán ; b ) Đất được Nhà_nước cho thuê để xây_dựng nhà ở cho thuê ; c ) Diện_tích đất ở trong dự_án đầu_tư xây_dựng nhà ở thương_mại mà chủ đầu_tư phải dành để xây_dựng nhà ở xã_hội theo quy_định tại khoản 2 Điều 16 của Luật này ; d ) Đất ở hợp_pháp của tổ_chức , hộ gia_đình , cá_nhân dùng để xây_dựng nhà ở xã_hội . Điều 57 . Chủ đầu_tư dự_án xây_dựng nhà ở xã_hội
được phê_duyệt , quỹ đất 20 % dành để xây_dựng nhà ở xã_hội trong các dự_án phát_triển nhà ở thương_mại , khu đô_thị mới nhưng chưa sử_dụng để giao cho các chủ đầu_tư có nhu_cầu đầu_tư xây_dựng nhà ở xã_hội ; đ ) Xây_dựng , trình Ủy_ban_nhân_dân cấp tỉnh phê_duyệt kế_hoạch phát_triển quỹ nhà ở công_vụ do tỉnh quản_lý ( bao_gồm nhu_cầu đất_đai và vốn đầu_tư xây_dựng ) theo quy_định về tiêu_chuẩn diện_tích nhà ở công_vụ do Thủ_tướng Chính_phủ ban_hành ; e ) Xây_dựng , ban_hành khung_giá cho thuê nhà ở công_vụ ; khung_giá cho thuê , thuê mua và giá bán nhà ở thuộc sở_hữu nhà_nước phù_hợp với điều_kiện thực_tế của tỉnh ; tổ_chức thực_hiện các nhiệm_vụ về tiếp_nhận quỹ nhà ở tự_quản của Trung_ương và của tỉnh để thống_nhất quản_lý , thực_hiện bán nhà ở thuộc sở_hữu nhà_nước cho người đang thuê theo quy_định của pháp_luật ; g ) Tham_gia định_giá các loại nhà trên địa_bàn theo khung_giá , nguyên_tắc và phương_pháp định_giá các loại nhà của Nhà_nước ;
Ủy ban_nhân_dân các cấp có trách_nhiệm gì trong quản_lý_nhà_nước về an_toàn , vệ_sinh lao_động ?
sinh lao_động 1 . Chính_phủ thống_nhất quản_lý_nhà_nước về an_toàn , vệ_sinh lao_động . 2 . Bộ Lao_động - Thương_binh_và Xã_hội chịu trách_nhiệm trước Chính_phủ thống_nhất thực_hiện quản_lý_nhà_nước về an_toàn , vệ_sinh lao_động . 3 . Các bộ , cơ_quan ngang bộ trong phạm_vi nhiệm_vụ , quyền_hạn của mình có trách_nhiệm thực_hiện quản_lý_nhà_nước về an_toàn , vệ_sinh lao_động . 4 . Ủy ban_nhân_dân các cấp trong phạm_vi nhiệm_vụ , quyền_hạn của mình thực_hiện quản_lý_nhà_nước về an_toàn , vệ_sinh lao_động . Điều 84 . Trách_nhiệm quản_lý_nhà_nước về an_toàn , vệ_sinh lao_động của Bộ_trưởng Bộ Lao_động - Thương_binh_và Xã_hội 1 . Chủ_trì xây_dựng , trình cơ_quan nhà_nước có thẩm_quyền ban_hành hoặc ban_hành theo thẩm_quyền và tổ_chức thực_hiện pháp_luật , chính_sách , kế_hoạch về an_toàn , vệ_sinh lao_động , chương_trình quốc_gia về an_toàn , vệ_sinh lao_động ; lập hồ_sơ quốc_gia về an_toàn , vệ_sinh lao_động .
chữa_cháy và cứu nạn , cứu_hộ tại các cụm công_nghiệp . Điều 32 . Quyền_hạn , trách_nhiệm của Ủy_ban_nhân_dân cấp tỉnh Ủy_ban_nhân_dân cấp tỉnh là cơ_quan quản_lý_nhà_nước về cụm công_nghiệp trên địa_bàn có quyền_hạn , trách_nhiệm : 1 . Chỉ_đạo xây_dựng , thực_hiện phương_án phát_triển cụm công_nghiệp trên địa_bàn ; quyết_định thành_lập , mở_rộng , điều_chỉnh hoặc bãi_bỏ quyết_định thành_lập , mở_rộng cụm công_nghiệp ; quy_định hoặc trình cơ_quan có thẩm_quyền quy_định việc hỗ_trợ đầu_tư từ ngân_sách địa_phương để xây_dựng hạ_tầng kỹ_thuật trong và ngoài các cụm công_nghiệp trên địa_bàn ; tổ_chức thực_thi các chính_sách , pháp_luật , kế_hoạch hoạt_động phát_triển cụm công_nghiệp trên địa_bàn . 2 . Ban_hành Quy_chế quản_lý cụm công_nghiệp , giải_quyết các thủ_tục triển_khai dự_án đầu_tư xây_dựng hạ_tầng kỹ_thuật và dự_án sản_xuất kinh_doanh trong cụm công_nghiệp theo cơ_chế một cửa , một cửa liên_thông .
- Loss:
MultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Training Hyperparameters
Non-Default Hyperparameters
overwrite_output_dir
: Trueper_device_train_batch_size
: 12per_device_eval_batch_size
: 12learning_rate
: 1e-05num_train_epochs
: 4warmup_ratio
: 0.1fp16
: Truebatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Truedo_predict
: Falseeval_strategy
: noprediction_loss_only
: Trueper_device_train_batch_size
: 12per_device_eval_batch_size
: 12per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 1e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 4max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Falseignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Falsehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseeval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseeval_use_gather_object
: Falsebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Click to expand
Epoch | Step | Training Loss |
---|---|---|
0.0386 | 500 | 0.5727 |
0.0772 | 1000 | 0.4231 |
0.1158 | 1500 | 0.3581 |
0.1545 | 2000 | 0.2753 |
0.1931 | 2500 | 0.2553 |
0.2317 | 3000 | 0.2217 |
0.2703 | 3500 | 0.2054 |
0.3089 | 4000 | 0.1945 |
0.3475 | 4500 | 0.1796 |
0.3861 | 5000 | 0.1786 |
0.4247 | 5500 | 0.1579 |
0.4634 | 6000 | 0.1628 |
0.5020 | 6500 | 0.144 |
0.5406 | 7000 | 0.1412 |
0.5792 | 7500 | 0.1339 |
0.6178 | 8000 | 0.138 |
0.6564 | 8500 | 0.1254 |
0.6950 | 9000 | 0.1193 |
0.7336 | 9500 | 0.1175 |
0.7723 | 10000 | 0.1094 |
0.8109 | 10500 | 0.1025 |
0.8495 | 11000 | 0.1148 |
0.8881 | 11500 | 0.1064 |
0.9267 | 12000 | 0.0969 |
0.9653 | 12500 | 0.1002 |
1.0039 | 13000 | 0.1016 |
1.0426 | 13500 | 0.0944 |
1.0812 | 14000 | 0.0918 |
1.1198 | 14500 | 0.0894 |
1.1584 | 15000 | 0.0814 |
1.1970 | 15500 | 0.0787 |
1.2356 | 16000 | 0.0779 |
1.2742 | 16500 | 0.063 |
1.3128 | 17000 | 0.0631 |
1.3515 | 17500 | 0.0567 |
1.3901 | 18000 | 0.0579 |
1.4287 | 18500 | 0.0488 |
1.4673 | 19000 | 0.0475 |
1.5059 | 19500 | 0.0468 |
1.5445 | 20000 | 0.0457 |
1.5831 | 20500 | 0.0426 |
1.6217 | 21000 | 0.0488 |
1.6604 | 21500 | 0.0455 |
1.6990 | 22000 | 0.0364 |
1.7376 | 22500 | 0.0444 |
1.7762 | 23000 | 0.0419 |
1.8148 | 23500 | 0.0374 |
1.8534 | 24000 | 0.0424 |
1.8920 | 24500 | 0.0378 |
1.9307 | 25000 | 0.0359 |
1.9693 | 25500 | 0.0393 |
2.0079 | 26000 | 0.0405 |
2.0465 | 26500 | 0.0331 |
2.0851 | 27000 | 0.0355 |
2.1237 | 27500 | 0.0342 |
2.1623 | 28000 | 0.0389 |
2.2009 | 28500 | 0.035 |
2.2396 | 29000 | 0.0338 |
2.2782 | 29500 | 0.0268 |
2.3168 | 30000 | 0.0294 |
2.3554 | 30500 | 0.0279 |
2.3940 | 31000 | 0.0266 |
2.4326 | 31500 | 0.0238 |
2.4712 | 32000 | 0.0204 |
2.5098 | 32500 | 0.0227 |
2.5485 | 33000 | 0.0219 |
2.5871 | 33500 | 0.0196 |
2.6257 | 34000 | 0.0238 |
2.6643 | 34500 | 0.0218 |
2.7029 | 35000 | 0.0176 |
2.7415 | 35500 | 0.022 |
2.7801 | 36000 | 0.0208 |
2.8188 | 36500 | 0.0183 |
2.8574 | 37000 | 0.0217 |
2.8960 | 37500 | 0.0175 |
2.9346 | 38000 | 0.0195 |
2.9732 | 38500 | 0.0178 |
3.0118 | 39000 | 0.0228 |
3.0504 | 39500 | 0.0155 |
3.0890 | 40000 | 0.024 |
3.1277 | 40500 | 0.0169 |
3.1663 | 41000 | 0.0225 |
3.2049 | 41500 | 0.0189 |
3.2435 | 42000 | 0.0166 |
3.2821 | 42500 | 0.0149 |
3.3207 | 43000 | 0.0165 |
3.3593 | 43500 | 0.0179 |
3.3979 | 44000 | 0.0138 |
3.4366 | 44500 | 0.0137 |
3.4752 | 45000 | 0.0128 |
3.5138 | 45500 | 0.0136 |
3.5524 | 46000 | 0.012 |
3.5910 | 46500 | 0.0117 |
3.6296 | 47000 | 0.0136 |
3.6682 | 47500 | 0.0146 |
3.7068 | 48000 | 0.0117 |
3.7455 | 48500 | 0.0131 |
3.7841 | 49000 | 0.0127 |
3.8227 | 49500 | 0.0124 |
3.8613 | 50000 | 0.0123 |
3.8999 | 50500 | 0.0122 |
3.9385 | 51000 | 0.0111 |
3.9771 | 51500 | 0.0118 |
Framework Versions
- Python: 3.10.14
- Sentence Transformers: 3.1.1
- Transformers: 4.44.0
- PyTorch: 2.4.0
- Accelerate: 0.33.0
- Datasets: 2.21.0
- Tokenizers: 0.19.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
- Downloads last month
- 8
Inference Providers
NEW
This model is not currently available via any of the supported third-party Inference Providers, and
the model is not deployed on the HF Inference API.
Model tree for tanbinh2210/vietnamese-bi-encoder-on-vbpl-with-neg
Base model
bkai-foundation-models/vietnamese-bi-encoder