Tnt3o5's picture
Add new SentenceTransformer model
c5e862e verified
---
base_model: Tnt3o5/tnt_v4_lega_new_tokens
library_name: sentence-transformers
metrics:
- cosine_accuracy@1
- cosine_accuracy@3
- cosine_accuracy@5
- cosine_accuracy@10
- cosine_precision@1
- cosine_precision@3
- cosine_precision@5
- cosine_precision@10
- cosine_recall@1
- cosine_recall@3
- cosine_recall@5
- cosine_recall@10
- cosine_ndcg@10
- cosine_mrr@10
- cosine_map@100
pipeline_tag: sentence-similarity
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:101442
- loss:MatryoshkaLoss
- loss:MultipleNegativesRankingLoss
widget:
- source_sentence: Ai quyền điều_chỉnh Mệnh_lệnh vận_chuyển vật_liệu nổ công_nghiệp
trong doanh_nghiệp Quân_đội ?
sentences:
- 'Quyền đăng_ký sáng_chế , kiểu_dáng công_nghiệp , thiết_kế bố_trí Tổ_chức , cá_nhân
sau đây có quyền đăng_ký sáng_chế , kiểu_dáng công_nghiệp , thiết_kế bố_trí :
Tác giả_tạo ra sáng_chế , kiểu_dáng công_nghiệp , thiết_kế bố_trí bằng công_sức
và chi_phí của mình ; Tổ_chức , cá_nhân đầu_tư kinh_phí , phương_tiện vật_chất
cho tác_giả dưới hình_thức giao việc , thuê việc , tổ_chức , cá_nhân được giao
quản_lý nguồn gen cung_cấp nguồn gen , tri_thức truyền_thống về nguồn gen theo
hợp_đồng tiếp_cận nguồn gen và chia_sẻ lợi_ích , trừ trường_hợp các bên có thỏa_thuận
khác hoặc trường_hợp quy_định tại Điều_86a của Luật này . Trường_hợp nhiều tổ_chức
, cá_nhân cùng nhau tạo ra hoặc đầu_tư để tạo ra sáng_chế , kiểu_dáng công_nghiệp
, thiết_kế bố_trí thì các tổ_chức , cá_nhân đó đều có quyền đăng_ký và quyền đăng_ký
đó chỉ được thực_hiện nếu được tất_cả các tổ_chức , cá_nhân đó đồng_ý . Tổ_chức
, cá_nhân có quyền đăng_ký quy_định tại Điều này có quyền chuyển_giao quyền đăng_ký
cho tổ_chức , cá_nhân khác dưới hình_thức hợp_đồng bằng văn_bản , để thừa_kế hoặc
kế_thừa theo quy_định của pháp_luật , kể_cả trường_hợp đã nộp đơn đăng_ký .'
- 'Nhiệm_vụ cụ_thể của các thành_viên Hội_đồng Ngoài việc thực_hiện các nhiệm_vụ
quy_định tại Điều_5 của Quy_chế này , Thành_viên Hội_đồng còn có nhiệm_vụ cụ_thể
sau đây : Thành_viên Hội_đồng là Lãnh_đạo Vụ Pháp_chế có nhiệm_vụ giúp Chủ_tịch
, Phó Chủ_tịch Hội_đồng , Hội_đồng , điều_hành các công_việc thường_xuyên của
Hội_đồng ; trực_tiếp lãnh_đạo Tổ Thường_trực ; giải_quyết công_việc đột_xuất của
Hội_đồng khi cả Chủ_tịch và Phó Chủ_tịch Hội đồng_đều đi vắng . Thành_viên Hội_đồng
là Lãnh_đạo Vụ An_toàn giao_thông có nhiệm_vụ trực_tiếp theo_dõi , đôn_đốc , kiểm_tra
và phối_hợp với thủ_trưởng các cơ_quan , đơn_vị thuộc Bộ , Thành_viên Hội_đồng
là Lãnh_đạo Văn_phòng Ủy_ban ATGTQG , Giám_đốc Sở GTVT , Chủ_tịch Tập_đoàn VINASHIN
, Tổng giám_đốc các Tổng Công_ty : Hàng_hải Việt_Nam , Đường_sắt Việt_Nam , Hàng_không
Việt_Nam chỉ_đạo công_tác tuyên_truyền PBGDPL về trật_tự , an_toàn giao_thông
.'
- Cấp , điều_chỉnh , thu_hồi tạm ngừng cấp_Mệnh lệnh vận_chuyển vật_liệu nổ công_nghiệp
, tiền chất thuốc_nổ Tổng_Tham_mưu_trưởng cấp , điều_chỉnh , thu_hồi hoặc ủy_quyền
cho người chỉ_huy cơ_quan , đơn_vị thuộc quyền dưới một cấp cấp , điều_chỉnh ,
thu_hồi Mệnh_lệnh vận_chuyển vật_liệu nổ công_nghiệp , tiền chất thuốc_nổ cho
5 doanh_nghiệp trực_thuộc Bộ Quốc_phòng các doanh_nghiệp cổ_phần vốn
nhà_nước do Bộ Quốc_phòng làm đại_diện chủ sở_hữu . Đối_với trường_hợp đột_xuất
khác không trong kế_hoạch được Tổng_Tham_mưu_trưởng phê_duyệt như quy_định
tại Điều_5 Thông_tư này , cơ_quan , đơn_vị , doanh_nghiệp cấp dưới báo_cáo cơ_quan
, đơn_vị , doanh_nghiệp trực_thuộc Bộ Quốc_phòng đề_nghị Tổng_Tham_mưu_trưởng
cấp_Mệnh lệnh vận_chuyển vật_liệu nổ công_nghiệp , tiền chất thuốc_nổ . Người
chỉ_huy cơ_quan , đơn_vị ( không phải doanh nghiệ trực_thuộc Bộ Quốc_phòng căn_cứ
vào kế_hoạch được Tổng_Tham_mưu_trưởng phê_duyệt , thực_hiện hoặc ủy_quyền cho
người chỉ_huy cơ_quan , đơn_vị thuộc quyền dưới một cấp cấp , điều_chỉnh , thu_hồi
Mệnh_lệnh vận_chuyển vật_liệu nổ công_nghiệp , tiền chất thuốc_nổ cho đối_tượng
thuộc phạm_vi quản_lý .
- source_sentence: Ai quyền quyết_định phong quân_hàm Đại_tá đối_với sĩ_quan Quân_đội
giữ chức_vụ Chính_ủy Lữ_đoàn ?
sentences:
- 'Thẩm_quyền quyết_định đối_với sĩ_quan Thẩm_quyền bổ_nhiệm , miễn_nhiệm , cách_chức
, phong , thăng , giáng , tước quân_hàm đối_với sĩ_quan được quy_định như sau
: Chủ_tịch_nước bổ_nhiệm , miễn_nhiệm , cách_chức Tổng_Tham_mưu_trưởng , Chủ_nhiệm
Tổng_Cục_Chính_trị ; phong , thăng , giáng , tước quân_hàm Cấp tướng , Chuẩn Đô_đốc
, Phó Đô_đốc , Đô_đốc Hải_quân ; Thủ_tướng_Chính_phủ bổ_nhiệm , miễn_nhiệm , cách_chức
Thứ_trưởng ; Phó_Tổng_Tham_mưu_trưởng , Phó Chủ_nhiệm Tổng_Cục_Chính_trị ; Giám_đốc
, Chính_ủy Học_viện Quốc_phòng ; Chủ_nhiệm Tổng_cục , Tổng cục_trưởng , Chính_ủy
Tổng_cục ; Tư_lệnh , Chính_ủy Quân_khu ; Tư_lệnh , Chính_ủy Quân_chủng ; Tư_lệnh
, Chính_ủy Bộ_đội Biên_phòng ; Tư_lệnh , Chính_ủy Cảnh_sát biển Việt_Nam ; Trưởng_Ban
Cơ_yếu Chính_phủ và các chức_vụ khác theo quy_định của Cấp có thẩm_quyền ; Bộ_trưởng_Bộ_Quốc_phòng
bổ_nhiệm , miễn_nhiệm , cách_chức các chức_vụ và phong , thăng , giáng , tước
các Cấp_bậc quân_hàm còn lại và nâng lương sĩ_quan ; Việc bổ_nhiệm , miễn_nhiệm
, cách_chức các chức_vụ thuộc ngành Kiểm_sát , Toà_án , Thi_hành án trong quân_đội
được thực_hiện theo quy_định của pháp_luật . Cấp có thẩm_quyền quyết_định bổ_nhiệm
đến chức_vụ nào thì có quyền miễn_nhiệm , cách_chức , giáng chức , quyết_định
kéo_dài thời_hạn phục_vụ tại_ngũ , điều_động , biệt_phái , giao chức_vụ thấp hơn
, cho thôi phục_vụ tại_ngũ , chuyển ngạch và giải ngạch sĩ_quan dự_bị đến chức_vụ
đó .'
- 'Nhiệm_vụ , quyền_hạn của Tổng Giám_đốc Trình Hội_đồng thành_viên VNPT để Hội_đồng
thành_viên Trình cơ_quan nhà_nước có thẩm_quyền quyết_định hoặc phê_duyệt các
nội_dung thuộc quyền của chủ sở_hữu đối_với VNPT theo quy_định của Điều_lệ này
. Trình Hội_đồng thành_viên VNPT xem_xét , quyết_định các nội_dung thuộc thẩm_quyền
của Hội_đồng thành_viên VNPT. Ban_hành quy_chế quản_lý nội_bộ sau khi Hội_đồng
thành_viên thông_qua . Theo phân_cấp hoặc ủy_quyền theo quy_định của Điều_lệ này
, Quy_chế_tài_chính , các quy_chế quản_lý nội_bộ của VNPT và các quy_định khác
của pháp_luật , Tổng Giám_đốc quyết_định : Các dự_án đầu_tư ; hợp_đồng mua , bán
tài_sản . Các hợp_đồng vay , thuê , cho thuê và hợp_đồng khác . Phương_án sử_dụng
vốn , tài_sản của VNPT để góp vốn , mua cổ_phần của các doanh_nghiệp . Ban_hành
các quy_định , quy Trình nội_bộ phục_vụ công_tác quản_lý , Điều_hành sản_xuất
kinh_doanh của VNPT. Quyết_định thành_lập , giải_thể , tổ_chức lại các đơn_vị
kinh_tế hạch_toán phụ_thuộc đơn_vị trực_thuộc của VNPT.'
- 'Thẩm_quyền quyết_định đối_với sĩ_quan Thẩm_quyền bổ_nhiệm , miễn_nhiệm , cách_chức
, phong , thăng , giáng , tước quân_hàm đối_với sĩ_quan được quy_định như sau
: Chủ_tịch_nước bổ_nhiệm , miễn_nhiệm , cách_chức Tổng_Tham_mưu_trưởng , Chủ_nhiệm
Tổng_Cục_Chính_trị ; phong , thăng , giáng , tước quân_hàm Cấp tướng , Chuẩn Đô_đốc
, Phó Đô_đốc , Đô_đốc Hải_quân ; Thủ_tướng_Chính_phủ bổ_nhiệm , miễn_nhiệm , cách_chức
Thứ_trưởng ; Phó_Tổng_Tham_mưu_trưởng , Phó Chủ_nhiệm Tổng_Cục_Chính_trị ; Giám_đốc
, Chính_ủy Học_viện Quốc_phòng ; Chủ_nhiệm Tổng_cục , Tổng cục_trưởng , Chính_ủy
Tổng_cục ; Tư_lệnh , Chính_ủy Quân_khu ; Tư_lệnh , Chính_ủy Quân_chủng ; Tư_lệnh
, Chính_ủy Bộ_đội Biên_phòng ; Tư_lệnh , Chính_ủy Cảnh_sát biển Việt_Nam ; Trưởng_Ban
Cơ_yếu Chính_phủ và các chức_vụ khác theo quy_định của Cấp có thẩm_quyền ; Bộ_trưởng_Bộ_Quốc_phòng
bổ_nhiệm , miễn_nhiệm , cách_chức các chức_vụ và phong , thăng , giáng , tước
các Cấp_bậc quân_hàm còn lại và nâng lương sĩ_quan ; Việc bổ_nhiệm , miễn_nhiệm
, cách_chức các chức_vụ thuộc ngành Kiểm_sát , Toà_án , Thi_hành án trong quân_đội
được thực_hiện theo quy_định của pháp_luật . Cấp có thẩm_quyền quyết_định bổ_nhiệm
đến chức_vụ nào thì có quyền miễn_nhiệm , cách_chức , giáng chức , quyết_định
kéo_dài thời_hạn phục_vụ tại_ngũ , điều_động , biệt_phái , giao chức_vụ thấp hơn
, cho thôi phục_vụ tại_ngũ , chuyển ngạch và giải ngạch sĩ_quan dự_bị đến chức_vụ
đó .'
- source_sentence: Ai quyền quyết_định thành_lập Hội_đồng Giám_định y_khoa cấp
tỉnh ? Hội_đồng tư_cách pháp_nhân không ?
sentences:
- Thẩm_quyền thành_lập Hội_đồng giám_định y_khoa các cấp Hội_đồng giám_định y_khoa
cấp tỉnh do cơ_quan chuyên_môn thuộc Ủy_ban_nhân_dân tỉnh quyết_định thành_lập
. Hội_đồng giám_định y_khoa cấp trung_ương do Bộ_Y_tế quyết_định thành_lập . Bộ
Quốc_phòng , Bộ_Công_An , Bộ_Giao_thông_Vận_tải căn_cứ quy_định của Thông_tư này
để quyết_định thành_lập Hội_đồng giám_định y_khoa các Bộ theo quy_định tại điểm_b
Khoản_2 Điều_161 Nghị_định số 131/2021/NĐCP.
- Thẩm_quyền phong , thăng , giáng , tước cấp_bậc hàm , nâng lương sĩ_quan , hạ
sĩ_quan , chiến_sĩ ; bổ_nhiệm , miễn_nhiệm , cách_chức , giáng chức các chức_vụ
; bổ_nhiệm , miễn_nhiệm chức_danh trong Công_an nhân_dân Chủ_tịch_nước phong ,
thăng cấp_bậc hàm_cấp tướng đối_với sĩ_quan Công_an nhân_dân . Thủ_tướng_Chính_phủ
bổ_nhiệm chức_vụ Thứ_trưởng Bộ_Công_An ; quyết_định nâng lương cấp_bậc hàm Đại_tướng
, Thượng_tướng . Bộ_trưởng Bộ_Công_An quyết_định nâng lương cấp_bậc hàm Trung_tướng
, Thiếu_tướng ; quy_định việc phong , thăng , nâng lương các cấp_bậc hàm , bổ_nhiệm
các chức_vụ , chức_danh còn lại trong Công_an nhân_dân . Người thẩm_quyền phong
, thăng cấp_bậc hàm nào thì thẩm_quyền giáng , tước cấp_bậc hàm đó ; mỗi lần
chỉ được thăng , giáng 01 cấp_bậc hàm , trừ trường_hợp đặc_biệt mới xét thăng
, giáng nhiều cấp_bậc hàm . Người thẩm_quyền bổ_nhiệm chức_vụ nào thì thẩm_quyền
miễn_nhiệm , cách_chức , giáng chức đối_với chức_vụ đó . Người thẩm_quyền bổ_nhiệm
chức_danh nào thì thẩm_quyền miễn_nhiệm đối_với chức_danh đó .
- Thẩm_quyền duyệt kế_hoạch Đại_hội Đoàn các cấp Ban Thường_vụ Đoàn cấp trên trực_tiếp
trách_nhiệm thẩm_quyền duyệt kế_hoạch Đại_hội Đoàn các đơn_vị trực_thuộc
. Ban Bí_thư Trung_ương Đoàn duyệt kế_hoạch Đại_hội Đoàn cấp tỉnh .
- source_sentence: Ai quyền hợp_đồng cộng tác_viên với người đáp_ứng đủ tiêu_chuẩn
nguyện_vọng làm Cộng tác_viên pháp điển ?
sentences:
- 'Thẩm_quyền lập biên_bản_vi_phạm hành_chính trong lĩnh_vực Kiểm_toán_Nhà_nước_Người
có thẩm_quyền lập biên_bản_vi_phạm hành_chính trong lĩnh_vực Kiểm_toán_Nhà_nước
quy_định tại Điều_15 của Pháp_lệnh số { 04 / 2023 / UBTVQH15 , } bao_gồm : Kiểm
toán_viên nhà_nước ; Tổ_trưởng tổ kiểm_toán ; Phó trưởng_đoàn kiểm_toán ; Trưởng_đoàn
kiểm_toán ; đ ) Kiểm toán_trưởng . Trường_hợp người đang thi_hành nhiệm_vụ kiểm_toán
, kiểm_tra thực_hiện kết_luận , kiến_nghị kiểm_toán , nhiệm_vụ tiếp_nhận báo_cáo
cáo định_kỳ hoặc nhiệm_vụ khác mà không phải là người có thẩm_quyền lập biên_bản_vi_phạm
hành_chính , nếu phát_hiện_hành_vi vi_phạm hành_chính trong lĩnh_vực Kiểm_toán_Nhà_nước
thì phải lập biên_bản làm_việc để ghi_nhận sự_việc và chuyển ngay biên_bản làm_việc
đến người có thẩm_quyền để lập biên_bản_vi_phạm hành_chính theo quy_định .'
- '" Điều Đăng_ký_kết_hôn Việc kết_hôn phải được đăng_ký và do cơ_quan nhà_nước
có thẩm_Quyền thực_hiện theo quy_định của Luật này và pháp Luật về hộ_tịch . Việc
kết_hôn không được đăng_ký theo quy_định tại khoản này thì không có giá_trị pháp_lý
. Vợ_chồng đã ly_hôn muốn xác_lập lại quan_hệ vợ_chồng thì phải đăng_ký kết_hôn
. Điều Giải_quyết hậu_quả của việc nam , nữ chung sống với nhau như vợ_chồng mà
không đăng_ký kết_hôn Nam , nữ có đủ điều_kiện kết_hôn theo quy_định của Luật
này chung sống với nhau như vợ_chồng mà không đăng_ký kết_hôn thì không làm phát_sinh
Quyền , nghĩa_vụ giữa vợ và chồng . Quyền , nghĩa_vụ đối_với con , tài_sản , nghĩa_vụ
và hợp_đồng giữa các bên được giải_quyết theo quy_định tại Điều_15 và Điều_16
của Luật này . Trong trường_hợp nam , nữ chung sống với nhau như vợ_chồng theo
quy_định tại Khoản 1_Điều này nhưng sau đó thực_hiện việc đăng_ký kết_hôn theo
quy_định của pháp Luật thì quan_hệ hôn_nhân được xác_lập từ thời điểm đăng_ký
kết_hôn . "'
- Thẩm_quyền , trách_nhiệm của các đơn_vị thuộc Bộ_Tư_pháp trong việc quản_lý ,
sử_dụng Cộng tác_viên Các đơn_vị thuộc Bộ_Tư_pháp Thủ_trưởng đơn_vị thực_hiện
pháp điển quyền hợp_đồng cộng_tác với người đáp_ứng đủ tiêu_chuẩn quy_định
tại Điều_2 Quy_chế này , nguyện_vọng làm Cộng tác_viên theo nhu_cầu thực_tế
phạm_vi , tính_chất công_việc thực_hiện pháp điển của đơn_vị ; thông_báo cho
Cục Kiểm_tra văn_bản quy_phạm pháp_luật về việc hợp_đồng thuê Cộng tác_viên
tình_hình thực_hiện công_việc của Cộng tác_viên . Đơn_vị thực_hiện pháp điển
không được sử_dụng cán_bộ , công_chức , viên_chức thuộc biên_chế của đơn_vị làm
Cộng tác_viên với đơn_vị mình . Thủ_trưởng đơn_vị thuộc Bộ_Tư_pháp thực_hiện pháp
điển có_thể tham_khảo Danh_sách nguồn Cộng tác_viên do Cục Kiểm_tra văn_bản quy_phạm
pháp_luật lập để hợp_đồng thuê Cộng tác_viên thực_hiện công_tác pháp điển thuộc
thẩm_quyền , trách_nhiệm của đơn_vị mình .
- source_sentence: Ai quyền_hủy bỏ kết_quả bầu_cử quyết_định bầu_cử lại đại_biểu
Quốc_hội ?
sentences:
- '" Điều Thẩm_quyền quyết_định tạm hoãn gọi nhập_ngũ , miễn gọi nhập_ngũ và công_nhận
hoàn_thành nghĩa_vụ quân_sự tại_ngũ Chủ_tịch Ủy_ban_nhân_dân cấp huyện quyết_định
tạm hoãn gọi nhập_ngũ và miễn gọi nhập_ngũ đối_với công_dân quy_định tại Điều_41
của Luật này . Chỉ huy_trưởng Ban chỉ_huy quân_sự cấp huyện quyết_định công_nhận
hoàn_thành nghĩa_vụ quân_sự tại_ngũ đối_với công_dân quy_định tại Khoản_4 Điều_4
của Luật này . "'
- Cơ_cấu tổ_chức Tổng cục_trưởng Tổng_cục Hải_quan quy_định nhiệm_vụ quyền_hạn
của các Phòng , Đội , Hải_Đội thuộc trực_thuộc Cục Điều_tra chống buôn_lậu
.
- Hủy_bỏ kết_quả bầu_cử quyết_định bầu_cử lại Hội_đồng_Bầu_cử_Quốc_gia tự mình
hoặc theo đề_nghị của Ủy_ban_Thường_vụ_Quốc_hội , Chính_phủ , Ủy_ban trung_ương
Mặt_trận_Tổ_quốc Việt_Nam , Ủy_ban bầu_cử tỉnh Hủy_bỏ kết_quả bầu_cử khu_vực
bỏ_phiếu , đơn_vị bầu_cử vi_phạm_pháp_luật nghiêm_trọng quyết_định ngày
bầu_cử lại khu_vực bỏ_phiếu , đơn_vị bầu_cử đó . Trong trường_hợp bầu_cử lại
thì ngày bầu_cử được tiến_hành chậm nhất 15 ngày sau ngày bầu_cử đầu_tiên .
Trong cuộc bầu_cử lại , cử_tri chỉ chọn bầu trong danh_sách những người ứng_cử
tại cuộc bầu_cử đầu_tiên .
model-index:
- name: SentenceTransformer based on Tnt3o5/tnt_v4_lega_new_tokens
results:
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: dim 256
type: dim_256
metrics:
- type: cosine_accuracy@1
value: 0.4254
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.6052
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.6636
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.7248
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.4254
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.20706666666666665
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.13752
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.07594
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.4051
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.58215
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.6421
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.7052
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.5619612781230402
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.526433492063493
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.514814431994549
name: Cosine Map@100
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: dim 128
type: dim_128
metrics:
- type: cosine_accuracy@1
value: 0.4264
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.6
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.662
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.7194
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.4264
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.2053333333333333
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.13707999999999998
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.07544
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.40606666666666663
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.57705
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.6404666666666667
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.70015
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.5591685699820262
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.5244388095238101
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.5128272708639572
name: Cosine Map@100
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: dim 64
type: dim_64
metrics:
- type: cosine_accuracy@1
value: 0.4076
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.5866
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.6478
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.708
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.4076
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.20026666666666665
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.13403999999999996
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.0741
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.38761666666666666
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.5637666666666666
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.6255666666666667
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.6879833333333333
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.5444437738024127
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.5090488888888896
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.49745729547355066
name: Cosine Map@100
---
# SentenceTransformer based on Tnt3o5/tnt_v4_lega_new_tokens
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Tnt3o5/tnt_v4_lega_new_tokens](https://huggingface.co/Tnt3o5/tnt_v4_lega_new_tokens). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [Tnt3o5/tnt_v4_lega_new_tokens](https://huggingface.co/Tnt3o5/tnt_v4_lega_new_tokens) <!-- at revision 289ae9c89e03b40e6aa02c8a8b307759eff5ad5b -->
- **Maximum Sequence Length:** 256 tokens
- **Output Dimensionality:** 768 dimensions
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("Tnt3o5/tnt_v5_lega_new_tokens")
# Run inference
sentences = [
'Ai có quyền_hủy bỏ kết_quả bầu_cử và quyết_định bầu_cử lại đại_biểu Quốc_hội ?',
'Hủy_bỏ kết_quả bầu_cử và quyết_định bầu_cử lại Hội_đồng_Bầu_cử_Quốc_gia tự mình hoặc theo đề_nghị của Ủy_ban_Thường_vụ_Quốc_hội , Chính_phủ , Ủy_ban trung_ương Mặt_trận_Tổ_quốc Việt_Nam , Ủy_ban bầu_cử ở tỉnh Hủy_bỏ kết_quả bầu_cử ở khu_vực bỏ_phiếu , đơn_vị bầu_cử có vi_phạm_pháp_luật nghiêm_trọng và quyết_định ngày bầu_cử lại ở khu_vực bỏ_phiếu , đơn_vị bầu_cử đó . Trong trường_hợp bầu_cử lại thì ngày bầu_cử được tiến_hành chậm nhất là 15 ngày sau ngày bầu_cử đầu_tiên . Trong cuộc bầu_cử lại , cử_tri chỉ chọn bầu trong danh_sách những người ứng_cử tại cuộc bầu_cử đầu_tiên .',
'Cơ_cấu tổ_chức Tổng cục_trưởng Tổng_cục Hải_quan quy_định nhiệm_vụ và quyền_hạn của các Phòng , Đội , Hải_Đội thuộc và trực_thuộc Cục Điều_tra chống buôn_lậu .',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
<!--
### Direct Usage (Transformers)
<details><summary>Click to see the direct usage in Transformers</summary>
</details>
-->
<!--
### Downstream Usage (Sentence Transformers)
You can finetune this model on your own dataset.
<details><summary>Click to expand</summary>
</details>
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
## Evaluation
### Metrics
#### Information Retrieval
* Datasets: `dim_256`, `dim_128` and `dim_64`
* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
| Metric | dim_256 | dim_128 | dim_64 |
|:--------------------|:----------|:-----------|:-----------|
| cosine_accuracy@1 | 0.4254 | 0.4264 | 0.4076 |
| cosine_accuracy@3 | 0.6052 | 0.6 | 0.5866 |
| cosine_accuracy@5 | 0.6636 | 0.662 | 0.6478 |
| cosine_accuracy@10 | 0.7248 | 0.7194 | 0.708 |
| cosine_precision@1 | 0.4254 | 0.4264 | 0.4076 |
| cosine_precision@3 | 0.2071 | 0.2053 | 0.2003 |
| cosine_precision@5 | 0.1375 | 0.1371 | 0.134 |
| cosine_precision@10 | 0.0759 | 0.0754 | 0.0741 |
| cosine_recall@1 | 0.4051 | 0.4061 | 0.3876 |
| cosine_recall@3 | 0.5821 | 0.577 | 0.5638 |
| cosine_recall@5 | 0.6421 | 0.6405 | 0.6256 |
| cosine_recall@10 | 0.7052 | 0.7002 | 0.688 |
| **cosine_ndcg@10** | **0.562** | **0.5592** | **0.5444** |
| cosine_mrr@10 | 0.5264 | 0.5244 | 0.509 |
| cosine_map@100 | 0.5148 | 0.5128 | 0.4975 |
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 101,442 training samples
* Columns: <code>anchor</code> and <code>positive</code>
* Approximate statistics based on the first 1000 samples:
| | anchor | positive |
|:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
| type | string | string |
| details | <ul><li>min: 7 tokens</li><li>mean: 20.75 tokens</li><li>max: 46 tokens</li></ul> | <ul><li>min: 10 tokens</li><li>mean: 155.2 tokens</li><li>max: 256 tokens</li></ul> |
* Samples:
| anchor | positive |
|:-----------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| <code>" Người_lớn ( trên 16 tuổi ) " được hiểu là “ Người_lớn và trẻ_em trên 16 tuổi ”</code> | <code>" Khi triển_khai “ Hướng_dẫn quản_lý tại nhà đối_với người mắc COVID - 19 ” , đề_nghị hướng_dẫn , làm rõ một_số nội_dung như sau : . Mục 3 “ Người_lớn ( trên 16 tuổ ” : đề_nghị hướng_dẫn là “ Người_lớn và trẻ_em trên 16 tuổi ” . "</code> |
| <code>03 Quy_chuẩn kỹ_thuật quốc_gia được ban_hành tại Thông_tư 04 là Quy_chuẩn nào ?</code> | <code>Ban_hành kèm theo Thông_tư này 03 Quy_chuẩn kỹ_thuật quốc_gia sau : Quy_chuẩn kỹ_thuật quốc_gia về bộ trục bánh_xe của đầu_máy , toa_xe Số_hiệu : QCVN 110 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về bộ móc_nối , đỡ đấm của đầu_máy , toa_xe Số_hiệu : QCVN 111 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về van hãm sử_dụng trên đầu_máy , toa_xe Số_hiệu : QCVN 112 : 2023/BGTVT.</code> |
| <code>03 Tổng công_ty Cảng hàng_không thực_hiện hợp_nhất có trách_nhiệm như thế_nào theo quy_định ?</code> | <code>Các Tổng công_ty thực_hiện hợp_nhất nêu tại Điều_1 Quyết_định này có trách_nhiệm chuyển_giao nguyên_trạng toàn_bộ tài_sản , tài_chính , lao_động , đất_đai , dự_án đang triển_khai , các quyền , nghĩa_vụ và lợi_ích hợp_pháp khác sang Tổng công_ty Cảng hàng_không Việt_Nam . Trong thời_gian chưa chuyển_giao , Chủ_tịch Hội_đồng thành_viên , Tổng giám_đốc và các cá_nhân có liên_quan của 03 Tổng công_ty thực_hiện hợp_nhất chịu trách_nhiệm quản_lý toàn_bộ tài_sản , tiền vốn của Tổng công_ty , không để hư_hỏng , hao_hụt , thất_thoát .</code> |
* Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
```json
{
"loss": "MultipleNegativesRankingLoss",
"matryoshka_dims": [
256,
128,
64
],
"matryoshka_weights": [
1,
1,
1
],
"n_dims_per_step": -1
}
```
### Evaluation Dataset
#### Unnamed Dataset
* Size: 4,450 evaluation samples
* Columns: <code>anchor</code> and <code>positive</code>
* Approximate statistics based on the first 1000 samples:
| | anchor | positive |
|:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
| type | string | string |
| details | <ul><li>min: 7 tokens</li><li>mean: 20.75 tokens</li><li>max: 46 tokens</li></ul> | <ul><li>min: 10 tokens</li><li>mean: 155.2 tokens</li><li>max: 256 tokens</li></ul> |
* Samples:
| anchor | positive |
|:-----------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| <code>" Người_lớn ( trên 16 tuổi ) " được hiểu là “ Người_lớn và trẻ_em trên 16 tuổi ”</code> | <code>" Khi triển_khai “ Hướng_dẫn quản_lý tại nhà đối_với người mắc COVID - 19 ” , đề_nghị hướng_dẫn , làm rõ một_số nội_dung như sau : . Mục 3 “ Người_lớn ( trên 16 tuổ ” : đề_nghị hướng_dẫn là “ Người_lớn và trẻ_em trên 16 tuổi ” . "</code> |
| <code>03 Quy_chuẩn kỹ_thuật quốc_gia được ban_hành tại Thông_tư 04 là Quy_chuẩn nào ?</code> | <code>Ban_hành kèm theo Thông_tư này 03 Quy_chuẩn kỹ_thuật quốc_gia sau : Quy_chuẩn kỹ_thuật quốc_gia về bộ trục bánh_xe của đầu_máy , toa_xe Số_hiệu : QCVN 110 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về bộ móc_nối , đỡ đấm của đầu_máy , toa_xe Số_hiệu : QCVN 111 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về van hãm sử_dụng trên đầu_máy , toa_xe Số_hiệu : QCVN 112 : 2023/BGTVT.</code> |
| <code>03 Tổng công_ty Cảng hàng_không thực_hiện hợp_nhất có trách_nhiệm như thế_nào theo quy_định ?</code> | <code>Các Tổng công_ty thực_hiện hợp_nhất nêu tại Điều_1 Quyết_định này có trách_nhiệm chuyển_giao nguyên_trạng toàn_bộ tài_sản , tài_chính , lao_động , đất_đai , dự_án đang triển_khai , các quyền , nghĩa_vụ và lợi_ích hợp_pháp khác sang Tổng công_ty Cảng hàng_không Việt_Nam . Trong thời_gian chưa chuyển_giao , Chủ_tịch Hội_đồng thành_viên , Tổng giám_đốc và các cá_nhân có liên_quan của 03 Tổng công_ty thực_hiện hợp_nhất chịu trách_nhiệm quản_lý toàn_bộ tài_sản , tiền vốn của Tổng công_ty , không để hư_hỏng , hao_hụt , thất_thoát .</code> |
* Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
```json
{
"loss": "MultipleNegativesRankingLoss",
"matryoshka_dims": [
256,
128,
64
],
"matryoshka_weights": [
1,
1,
1
],
"n_dims_per_step": -1
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: steps
- `per_device_train_batch_size`: 16
- `per_device_eval_batch_size`: 16
- `gradient_accumulation_steps`: 8
- `learning_rate`: 2e-05
- `weight_decay`: 0.01
- `max_grad_norm`: 0.1
- `max_steps`: 1200
- `lr_scheduler_type`: cosine
- `warmup_ratio`: 0.15
- `fp16`: True
- `load_best_model_at_end`: True
- `optim`: adamw_torch_fused
- `gradient_checkpointing`: True
- `batch_sampler`: no_duplicates
#### All Hyperparameters
<details><summary>Click to expand</summary>
- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: steps
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 16
- `per_device_eval_batch_size`: 16
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 8
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 2e-05
- `weight_decay`: 0.01
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 0.1
- `num_train_epochs`: 3.0
- `max_steps`: 1200
- `lr_scheduler_type`: cosine
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.15
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: False
- `fp16`: True
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: True
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch_fused
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: False
- `hub_always_push`: False
- `gradient_checkpointing`: True
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`:
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `use_liger_kernel`: False
- `eval_use_gather_object`: False
- `prompts`: None
- `batch_sampler`: no_duplicates
- `multi_dataset_batch_sampler`: proportional
</details>
### Training Logs
| Epoch | Step | Training Loss | Validation Loss | dim_256_cosine_ndcg@10 | dim_128_cosine_ndcg@10 | dim_64_cosine_ndcg@10 |
|:----------:|:--------:|:-------------:|:---------------:|:----------------------:|:----------------------:|:---------------------:|
| 0.5047 | 400 | 0.4797 | 0.3000 | 0.5544 | 0.5504 | 0.5393 |
| 1.0090 | 800 | 0.4274 | 0.2888 | 0.5583 | 0.5534 | 0.5415 |
| **1.5136** | **1200** | **0.3211** | **0.2089** | **0.562** | **0.5592** | **0.5444** |
* The bold row denotes the saved checkpoint.
### Framework Versions
- Python: 3.10.14
- Sentence Transformers: 3.3.0
- Transformers: 4.45.1
- PyTorch: 2.4.0
- Accelerate: 0.34.2
- Datasets: 3.0.1
- Tokenizers: 0.20.0
## Citation
### BibTeX
#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
```
#### MatryoshkaLoss
```bibtex
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
```
#### MultipleNegativesRankingLoss
```bibtex
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->