Tnt3o5's picture
Add new SentenceTransformer model
c5e862e verified
metadata
base_model: Tnt3o5/tnt_v4_lega_new_tokens
library_name: sentence-transformers
metrics:
  - cosine_accuracy@1
  - cosine_accuracy@3
  - cosine_accuracy@5
  - cosine_accuracy@10
  - cosine_precision@1
  - cosine_precision@3
  - cosine_precision@5
  - cosine_precision@10
  - cosine_recall@1
  - cosine_recall@3
  - cosine_recall@5
  - cosine_recall@10
  - cosine_ndcg@10
  - cosine_mrr@10
  - cosine_map@100
pipeline_tag: sentence-similarity
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:101442
  - loss:MatryoshkaLoss
  - loss:MultipleNegativesRankingLoss
widget:
  - source_sentence: >-
      Ai có quyền điều_chỉnh Mệnh_lệnh vận_chuyển vật_liệu nổ công_nghiệp trong
      doanh_nghiệp Quân_đội ?
    sentences:
      - >-
        Quyền đăng_ký sáng_chế , kiểu_dáng công_nghiệp , thiết_kế bố_trí Tổ_chức
        , cá_nhân sau đây có quyền đăng_ký sáng_chế , kiểu_dáng công_nghiệp ,
        thiết_kế bố_trí : Tác giả_tạo ra sáng_chế , kiểu_dáng công_nghiệp ,
        thiết_kế bố_trí bằng công_sức và chi_phí của mình ; Tổ_chức , cá_nhân
        đầu_tư kinh_phí , phương_tiện vật_chất cho tác_giả dưới hình_thức giao
        việc , thuê việc , tổ_chức , cá_nhân được giao quản_lý nguồn gen
        cung_cấp nguồn gen , tri_thức truyền_thống về nguồn gen theo hợp_đồng
        tiếp_cận nguồn gen và chia_sẻ lợi_ích , trừ trường_hợp các bên có
        thỏa_thuận khác hoặc trường_hợp quy_định tại Điều_86a của Luật này .
        Trường_hợp nhiều tổ_chức , cá_nhân cùng nhau tạo ra hoặc đầu_tư để tạo
        ra sáng_chế , kiểu_dáng công_nghiệp , thiết_kế bố_trí thì các tổ_chức ,
        cá_nhân đó đều có quyền đăng_ký và quyền đăng_ký đó chỉ được thực_hiện
        nếu được tất_cả các tổ_chức , cá_nhân đó đồng_ý . Tổ_chức , cá_nhân có
        quyền đăng_ký quy_định tại Điều này có quyền chuyển_giao quyền đăng_ký
        cho tổ_chức , cá_nhân khác dưới hình_thức hợp_đồng bằng văn_bản , để
        thừa_kế hoặc kế_thừa theo quy_định của pháp_luật , kể_cả trường_hợp đã
        nộp đơn đăng_ký .
      - >-
        Nhiệm_vụ cụ_thể của các thành_viên Hội_đồng Ngoài việc thực_hiện các
        nhiệm_vụ quy_định tại Điều_5 của Quy_chế này , Thành_viên Hội_đồng còn
        có nhiệm_vụ cụ_thể sau đây : Thành_viên Hội_đồng là Lãnh_đạo Vụ Pháp_chế
        có nhiệm_vụ giúp Chủ_tịch , Phó Chủ_tịch Hội_đồng , Hội_đồng , điều_hành
        các công_việc thường_xuyên của Hội_đồng ; trực_tiếp lãnh_đạo Tổ
        Thường_trực ; giải_quyết công_việc đột_xuất của Hội_đồng khi cả Chủ_tịch
        và Phó Chủ_tịch Hội đồng_đều đi vắng . Thành_viên Hội_đồng là Lãnh_đạo
        Vụ An_toàn giao_thông có nhiệm_vụ trực_tiếp theo_dõi , đôn_đốc ,
        kiểm_tra và phối_hợp với thủ_trưởng các cơ_quan , đơn_vị thuộc Bộ ,
        Thành_viên Hội_đồng là Lãnh_đạo Văn_phòng Ủy_ban ATGTQG , Giám_đốc Sở
        GTVT , Chủ_tịch Tập_đoàn VINASHIN , Tổng giám_đốc các Tổng Công_ty :
        Hàng_hải Việt_Nam , Đường_sắt Việt_Nam , Hàng_không Việt_Nam chỉ_đạo
        công_tác tuyên_truyền PBGDPL về trật_tự , an_toàn giao_thông .
      - >-
        Cấp , điều_chỉnh , thu_hồi và tạm ngừng cấp_Mệnh lệnh vận_chuyển
        vật_liệu nổ công_nghiệp , tiền chất thuốc_nổ Tổng_Tham_mưu_trưởng cấp ,
        điều_chỉnh , thu_hồi hoặc ủy_quyền cho người chỉ_huy cơ_quan , đơn_vị
        thuộc quyền dưới một cấp cấp , điều_chỉnh , thu_hồi Mệnh_lệnh vận_chuyển
        vật_liệu nổ công_nghiệp , tiền chất thuốc_nổ cho cá 5 doanh_nghiệp
        trực_thuộc Bộ Quốc_phòng và các doanh_nghiệp cổ_phần có vốn nhà_nước do
        Bộ Quốc_phòng làm đại_diện chủ sở_hữu . Đối_với trường_hợp đột_xuất khác
        không có trong kế_hoạch được Tổng_Tham_mưu_trưởng phê_duyệt như quy_định
        tại Điều_5 Thông_tư này , cơ_quan , đơn_vị , doanh_nghiệp cấp dưới
        báo_cáo cơ_quan , đơn_vị , doanh_nghiệp trực_thuộc Bộ Quốc_phòng đề_nghị
        Tổng_Tham_mưu_trưởng cấp_Mệnh lệnh vận_chuyển vật_liệu nổ công_nghiệp ,
        tiền chất thuốc_nổ . Người chỉ_huy cơ_quan , đơn_vị ( không phải doanh
        nghiệ trực_thuộc Bộ Quốc_phòng căn_cứ vào kế_hoạch được
        Tổng_Tham_mưu_trưởng phê_duyệt , thực_hiện hoặc ủy_quyền cho người
        chỉ_huy cơ_quan , đơn_vị thuộc quyền dưới một cấp cấp , điều_chỉnh ,
        thu_hồi Mệnh_lệnh vận_chuyển vật_liệu nổ công_nghiệp , tiền chất
        thuốc_nổ cho đối_tượng thuộc phạm_vi quản_lý .
  - source_sentence: >-
      Ai có quyền quyết_định phong quân_hàm Đại_tá đối_với sĩ_quan Quân_đội giữ
      chức_vụ Chính_ủy Lữ_đoàn ?
    sentences:
      - >-
        Thẩm_quyền quyết_định đối_với sĩ_quan Thẩm_quyền bổ_nhiệm , miễn_nhiệm ,
        cách_chức , phong , thăng , giáng , tước quân_hàm đối_với sĩ_quan được
        quy_định như sau : Chủ_tịch_nước bổ_nhiệm , miễn_nhiệm , cách_chức
        Tổng_Tham_mưu_trưởng , Chủ_nhiệm Tổng_Cục_Chính_trị ; phong , thăng ,
        giáng , tước quân_hàm Cấp tướng , Chuẩn Đô_đốc , Phó Đô_đốc , Đô_đốc
        Hải_quân ; Thủ_tướng_Chính_phủ bổ_nhiệm , miễn_nhiệm , cách_chức
        Thứ_trưởng ; Phó_Tổng_Tham_mưu_trưởng , Phó Chủ_nhiệm Tổng_Cục_Chính_trị
        ; Giám_đốc , Chính_ủy Học_viện Quốc_phòng ; Chủ_nhiệm Tổng_cục , Tổng
        cục_trưởng , Chính_ủy Tổng_cục ; Tư_lệnh , Chính_ủy Quân_khu ; Tư_lệnh ,
        Chính_ủy Quân_chủng ; Tư_lệnh , Chính_ủy Bộ_đội Biên_phòng ; Tư_lệnh ,
        Chính_ủy Cảnh_sát biển Việt_Nam ; Trưởng_Ban Cơ_yếu Chính_phủ và các
        chức_vụ khác theo quy_định của Cấp có thẩm_quyền ;
        Bộ_trưởng_Bộ_Quốc_phòng bổ_nhiệm , miễn_nhiệm , cách_chức các chức_vụ và
        phong , thăng , giáng , tước các Cấp_bậc quân_hàm còn lại và nâng lương
        sĩ_quan ; Việc bổ_nhiệm , miễn_nhiệm , cách_chức các chức_vụ thuộc ngành
        Kiểm_sát , Toà_án , Thi_hành án trong quân_đội được thực_hiện theo
        quy_định của pháp_luật . Cấp có thẩm_quyền quyết_định bổ_nhiệm đến
        chức_vụ nào thì có quyền miễn_nhiệm , cách_chức , giáng chức ,
        quyết_định kéo_dài thời_hạn phục_vụ tại_ngũ , điều_động , biệt_phái ,
        giao chức_vụ thấp hơn , cho thôi phục_vụ tại_ngũ , chuyển ngạch và giải
        ngạch sĩ_quan dự_bị đến chức_vụ đó .
      - >-
        Nhiệm_vụ , quyền_hạn của Tổng Giám_đốc Trình Hội_đồng thành_viên VNPT để
        Hội_đồng thành_viên Trình cơ_quan nhà_nước có thẩm_quyền quyết_định hoặc
        phê_duyệt các nội_dung thuộc quyền của chủ sở_hữu đối_với VNPT theo
        quy_định của Điều_lệ này . Trình Hội_đồng thành_viên VNPT xem_xét ,
        quyết_định các nội_dung thuộc thẩm_quyền của Hội_đồng thành_viên VNPT.
        Ban_hành quy_chế quản_lý nội_bộ sau khi Hội_đồng thành_viên thông_qua .
        Theo phân_cấp hoặc ủy_quyền theo quy_định của Điều_lệ này ,
        Quy_chế_tài_chính , các quy_chế quản_lý nội_bộ của VNPT và các quy_định
        khác của pháp_luật , Tổng Giám_đốc quyết_định : Các dự_án đầu_tư ;
        hợp_đồng mua , bán tài_sản . Các hợp_đồng vay , thuê , cho thuê và
        hợp_đồng khác . Phương_án sử_dụng vốn , tài_sản của VNPT để góp vốn ,
        mua cổ_phần của các doanh_nghiệp . Ban_hành các quy_định , quy Trình
        nội_bộ phục_vụ công_tác quản_lý , Điều_hành sản_xuất kinh_doanh của
        VNPT. Quyết_định thành_lập , giải_thể , tổ_chức lại các đơn_vị kinh_tế
        hạch_toán phụ_thuộc đơn_vị trực_thuộc của VNPT.
      - >-
        Thẩm_quyền quyết_định đối_với sĩ_quan Thẩm_quyền bổ_nhiệm , miễn_nhiệm ,
        cách_chức , phong , thăng , giáng , tước quân_hàm đối_với sĩ_quan được
        quy_định như sau : Chủ_tịch_nước bổ_nhiệm , miễn_nhiệm , cách_chức
        Tổng_Tham_mưu_trưởng , Chủ_nhiệm Tổng_Cục_Chính_trị ; phong , thăng ,
        giáng , tước quân_hàm Cấp tướng , Chuẩn Đô_đốc , Phó Đô_đốc , Đô_đốc
        Hải_quân ; Thủ_tướng_Chính_phủ bổ_nhiệm , miễn_nhiệm , cách_chức
        Thứ_trưởng ; Phó_Tổng_Tham_mưu_trưởng , Phó Chủ_nhiệm Tổng_Cục_Chính_trị
        ; Giám_đốc , Chính_ủy Học_viện Quốc_phòng ; Chủ_nhiệm Tổng_cục , Tổng
        cục_trưởng , Chính_ủy Tổng_cục ; Tư_lệnh , Chính_ủy Quân_khu ; Tư_lệnh ,
        Chính_ủy Quân_chủng ; Tư_lệnh , Chính_ủy Bộ_đội Biên_phòng ; Tư_lệnh ,
        Chính_ủy Cảnh_sát biển Việt_Nam ; Trưởng_Ban Cơ_yếu Chính_phủ và các
        chức_vụ khác theo quy_định của Cấp có thẩm_quyền ;
        Bộ_trưởng_Bộ_Quốc_phòng bổ_nhiệm , miễn_nhiệm , cách_chức các chức_vụ và
        phong , thăng , giáng , tước các Cấp_bậc quân_hàm còn lại và nâng lương
        sĩ_quan ; Việc bổ_nhiệm , miễn_nhiệm , cách_chức các chức_vụ thuộc ngành
        Kiểm_sát , Toà_án , Thi_hành án trong quân_đội được thực_hiện theo
        quy_định của pháp_luật . Cấp có thẩm_quyền quyết_định bổ_nhiệm đến
        chức_vụ nào thì có quyền miễn_nhiệm , cách_chức , giáng chức ,
        quyết_định kéo_dài thời_hạn phục_vụ tại_ngũ , điều_động , biệt_phái ,
        giao chức_vụ thấp hơn , cho thôi phục_vụ tại_ngũ , chuyển ngạch và giải
        ngạch sĩ_quan dự_bị đến chức_vụ đó .
  - source_sentence: >-
      Ai có quyền quyết_định thành_lập Hội_đồng Giám_định y_khoa cấp tỉnh ?
      Hội_đồng có tư_cách pháp_nhân không ?
    sentences:
      - >-
        Thẩm_quyền thành_lập Hội_đồng giám_định y_khoa các cấp Hội_đồng
        giám_định y_khoa cấp tỉnh do cơ_quan chuyên_môn thuộc Ủy_ban_nhân_dân
        tỉnh quyết_định thành_lập . Hội_đồng giám_định y_khoa cấp trung_ương do
        Bộ_Y_tế quyết_định thành_lập . Bộ Quốc_phòng , Bộ_Công_An ,
        Bộ_Giao_thông_Vận_tải căn_cứ quy_định của Thông_tư này để quyết_định
        thành_lập Hội_đồng giám_định y_khoa các Bộ theo quy_định tại điểm_b
        Khoản_2 Điều_161 Nghị_định số 131/2021/NĐCP.
      - >-
        Thẩm_quyền phong , thăng , giáng , tước cấp_bậc hàm , nâng lương sĩ_quan
        , hạ sĩ_quan , chiến_sĩ ; bổ_nhiệm , miễn_nhiệm , cách_chức , giáng chức
        các chức_vụ ; bổ_nhiệm , miễn_nhiệm chức_danh trong Công_an nhân_dân
        Chủ_tịch_nước phong , thăng cấp_bậc hàm_cấp tướng đối_với sĩ_quan
        Công_an nhân_dân . Thủ_tướng_Chính_phủ bổ_nhiệm chức_vụ Thứ_trưởng
        Bộ_Công_An ; quyết_định nâng lương cấp_bậc hàm Đại_tướng , Thượng_tướng
        . Bộ_trưởng Bộ_Công_An quyết_định nâng lương cấp_bậc hàm Trung_tướng ,
        Thiếu_tướng ; quy_định việc phong , thăng , nâng lương các cấp_bậc hàm ,
        bổ_nhiệm các chức_vụ , chức_danh còn lại trong Công_an nhân_dân . Người
        có thẩm_quyền phong , thăng cấp_bậc hàm nào thì có thẩm_quyền giáng ,
        tước cấp_bậc hàm đó ; mỗi lần chỉ được thăng , giáng 01 cấp_bậc hàm ,
        trừ trường_hợp đặc_biệt mới xét thăng , giáng nhiều cấp_bậc hàm . Người
        có thẩm_quyền bổ_nhiệm chức_vụ nào thì có thẩm_quyền miễn_nhiệm ,
        cách_chức , giáng chức đối_với chức_vụ đó . Người có thẩm_quyền bổ_nhiệm
        chức_danh nào thì có thẩm_quyền miễn_nhiệm đối_với chức_danh đó .
      - >-
        Thẩm_quyền duyệt kế_hoạch Đại_hội Đoàn các cấp Ban Thường_vụ Đoàn cấp
        trên trực_tiếp có trách_nhiệm và thẩm_quyền duyệt kế_hoạch Đại_hội Đoàn
        các đơn_vị trực_thuộc . Ban Bí_thư Trung_ương Đoàn duyệt kế_hoạch
        Đại_hội Đoàn cấp tỉnh .
  - source_sentence: >-
      Ai có quyền ký hợp_đồng cộng tác_viên với người đáp_ứng đủ tiêu_chuẩn có
      nguyện_vọng làm Cộng tác_viên pháp điển ?
    sentences:
      - >-
        Thẩm_quyền lập biên_bản_vi_phạm hành_chính trong lĩnh_vực
        Kiểm_toán_Nhà_nước_Người có thẩm_quyền lập biên_bản_vi_phạm hành_chính
        trong lĩnh_vực Kiểm_toán_Nhà_nước quy_định tại Điều_15 của Pháp_lệnh số
        { 04 / 2023 / UBTVQH15 , } bao_gồm : Kiểm toán_viên nhà_nước ; Tổ_trưởng
        tổ kiểm_toán ; Phó trưởng_đoàn kiểm_toán ; Trưởng_đoàn kiểm_toán ; đ )
        Kiểm toán_trưởng . Trường_hợp người đang thi_hành nhiệm_vụ kiểm_toán ,
        kiểm_tra thực_hiện kết_luận , kiến_nghị kiểm_toán , nhiệm_vụ tiếp_nhận
        báo_cáo cáo định_kỳ hoặc nhiệm_vụ khác mà không phải là người có
        thẩm_quyền lập biên_bản_vi_phạm hành_chính , nếu phát_hiện_hành_vi
        vi_phạm hành_chính trong lĩnh_vực Kiểm_toán_Nhà_nước thì phải lập
        biên_bản làm_việc để ghi_nhận sự_việc và chuyển ngay biên_bản làm_việc
        đến người có thẩm_quyền để lập biên_bản_vi_phạm hành_chính theo quy_định
        .
      - >-
        " Điều Đăng_ký_kết_hôn Việc kết_hôn phải được đăng_ký và do cơ_quan
        nhà_nước có thẩm_Quyền thực_hiện theo quy_định của Luật này và pháp Luật
        về hộ_tịch . Việc kết_hôn không được đăng_ký theo quy_định tại khoản này
        thì không có giá_trị pháp_lý . Vợ_chồng đã ly_hôn muốn xác_lập lại
        quan_hệ vợ_chồng thì phải đăng_ký kết_hôn . Điều Giải_quyết hậu_quả của
        việc nam , nữ chung sống với nhau như vợ_chồng mà không đăng_ký kết_hôn
        Nam , nữ có đủ điều_kiện kết_hôn theo quy_định của Luật này chung sống
        với nhau như vợ_chồng mà không đăng_ký kết_hôn thì không làm phát_sinh
        Quyền , nghĩa_vụ giữa vợ và chồng . Quyền , nghĩa_vụ đối_với con ,
        tài_sản , nghĩa_vụ và hợp_đồng giữa các bên được giải_quyết theo
        quy_định tại Điều_15 và Điều_16 của Luật này . Trong trường_hợp nam , nữ
        chung sống với nhau như vợ_chồng theo quy_định tại Khoản 1_Điều này
        nhưng sau đó thực_hiện việc đăng_ký kết_hôn theo quy_định của pháp Luật
        thì quan_hệ hôn_nhân được xác_lập từ thời điểm đăng_ký kết_hôn . "
      - >-
        Thẩm_quyền , trách_nhiệm của các đơn_vị thuộc Bộ_Tư_pháp trong việc
        quản_lý , sử_dụng Cộng tác_viên Các đơn_vị thuộc Bộ_Tư_pháp Thủ_trưởng
        đơn_vị thực_hiện pháp điển có quyền ký hợp_đồng cộng_tác với người
        đáp_ứng đủ tiêu_chuẩn quy_định tại Điều_2 Quy_chế này , có nguyện_vọng
        làm Cộng tác_viên theo nhu_cầu thực_tế và phạm_vi , tính_chất công_việc
        thực_hiện pháp điển của đơn_vị ; thông_báo cho Cục Kiểm_tra văn_bản
        quy_phạm pháp_luật về việc ký hợp_đồng thuê Cộng tác_viên và tình_hình
        thực_hiện công_việc của Cộng tác_viên . Đơn_vị thực_hiện pháp điển không
        được sử_dụng cán_bộ , công_chức , viên_chức thuộc biên_chế của đơn_vị
        làm Cộng tác_viên với đơn_vị mình . Thủ_trưởng đơn_vị thuộc Bộ_Tư_pháp
        thực_hiện pháp điển có_thể tham_khảo Danh_sách nguồn Cộng tác_viên do
        Cục Kiểm_tra văn_bản quy_phạm pháp_luật lập để ký hợp_đồng thuê Cộng
        tác_viên thực_hiện công_tác pháp điển thuộc thẩm_quyền , trách_nhiệm của
        đơn_vị mình .
  - source_sentence: >-
      Ai có quyền_hủy bỏ kết_quả bầu_cử và quyết_định bầu_cử lại đại_biểu
      Quốc_hội ?
    sentences:
      - >-
        " Điều Thẩm_quyền quyết_định tạm hoãn gọi nhập_ngũ , miễn gọi nhập_ngũ
        và công_nhận hoàn_thành nghĩa_vụ quân_sự tại_ngũ Chủ_tịch
        Ủy_ban_nhân_dân cấp huyện quyết_định tạm hoãn gọi nhập_ngũ và miễn gọi
        nhập_ngũ đối_với công_dân quy_định tại Điều_41 của Luật này . Chỉ
        huy_trưởng Ban chỉ_huy quân_sự cấp huyện quyết_định công_nhận hoàn_thành
        nghĩa_vụ quân_sự tại_ngũ đối_với công_dân quy_định tại Khoản_4 Điều_4
        của Luật này . "
      - >-
        Cơ_cấu tổ_chức Tổng cục_trưởng Tổng_cục Hải_quan quy_định nhiệm_vụ và
        quyền_hạn của các Phòng , Đội , Hải_Đội thuộc và trực_thuộc Cục Điều_tra
        chống buôn_lậu .
      - >-
        Hủy_bỏ kết_quả bầu_cử và quyết_định bầu_cử lại Hội_đồng_Bầu_cử_Quốc_gia
        tự mình hoặc theo đề_nghị của Ủy_ban_Thường_vụ_Quốc_hội , Chính_phủ ,
        Ủy_ban trung_ương Mặt_trận_Tổ_quốc Việt_Nam , Ủy_ban bầu_cử ở tỉnh
        Hủy_bỏ kết_quả bầu_cử ở khu_vực bỏ_phiếu , đơn_vị bầu_cử có
        vi_phạm_pháp_luật nghiêm_trọng và quyết_định ngày bầu_cử lại ở khu_vực
        bỏ_phiếu , đơn_vị bầu_cử đó . Trong trường_hợp bầu_cử lại thì ngày
        bầu_cử được tiến_hành chậm nhất là 15 ngày sau ngày bầu_cử đầu_tiên .
        Trong cuộc bầu_cử lại , cử_tri chỉ chọn bầu trong danh_sách những người
        ứng_cử tại cuộc bầu_cử đầu_tiên .
model-index:
  - name: SentenceTransformer based on Tnt3o5/tnt_v4_lega_new_tokens
    results:
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 256
          type: dim_256
        metrics:
          - type: cosine_accuracy@1
            value: 0.4254
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.6052
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.6636
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.7248
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.4254
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.20706666666666665
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.13752
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.07594
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.4051
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.58215
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.6421
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.7052
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.5619612781230402
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.526433492063493
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.514814431994549
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 128
          type: dim_128
        metrics:
          - type: cosine_accuracy@1
            value: 0.4264
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.6
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.662
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.7194
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.4264
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.2053333333333333
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.13707999999999998
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.07544
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.40606666666666663
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.57705
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.6404666666666667
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.70015
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.5591685699820262
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.5244388095238101
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.5128272708639572
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 64
          type: dim_64
        metrics:
          - type: cosine_accuracy@1
            value: 0.4076
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.5866
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.6478
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.708
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.4076
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.20026666666666665
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.13403999999999996
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.0741
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.38761666666666666
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.5637666666666666
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.6255666666666667
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.6879833333333333
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.5444437738024127
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.5090488888888896
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.49745729547355066
            name: Cosine Map@100

SentenceTransformer based on Tnt3o5/tnt_v4_lega_new_tokens

This is a sentence-transformers model finetuned from Tnt3o5/tnt_v4_lega_new_tokens. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: Tnt3o5/tnt_v4_lega_new_tokens
  • Maximum Sequence Length: 256 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("Tnt3o5/tnt_v5_lega_new_tokens")
# Run inference
sentences = [
    'Ai có quyền_hủy bỏ kết_quả bầu_cử và quyết_định bầu_cử lại đại_biểu Quốc_hội ?',
    'Hủy_bỏ kết_quả bầu_cử và quyết_định bầu_cử lại Hội_đồng_Bầu_cử_Quốc_gia tự mình hoặc theo đề_nghị của Ủy_ban_Thường_vụ_Quốc_hội , Chính_phủ , Ủy_ban trung_ương Mặt_trận_Tổ_quốc Việt_Nam , Ủy_ban bầu_cử ở tỉnh Hủy_bỏ kết_quả bầu_cử ở khu_vực bỏ_phiếu , đơn_vị bầu_cử có vi_phạm_pháp_luật nghiêm_trọng và quyết_định ngày bầu_cử lại ở khu_vực bỏ_phiếu , đơn_vị bầu_cử đó . Trong trường_hợp bầu_cử lại thì ngày bầu_cử được tiến_hành chậm nhất là 15 ngày sau ngày bầu_cử đầu_tiên . Trong cuộc bầu_cử lại , cử_tri chỉ chọn bầu trong danh_sách những người ứng_cử tại cuộc bầu_cử đầu_tiên .',
    'Cơ_cấu tổ_chức Tổng cục_trưởng Tổng_cục Hải_quan quy_định nhiệm_vụ và quyền_hạn của các Phòng , Đội , Hải_Đội thuộc và trực_thuộc Cục Điều_tra chống buôn_lậu .',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Information Retrieval

Metric dim_256 dim_128 dim_64
cosine_accuracy@1 0.4254 0.4264 0.4076
cosine_accuracy@3 0.6052 0.6 0.5866
cosine_accuracy@5 0.6636 0.662 0.6478
cosine_accuracy@10 0.7248 0.7194 0.708
cosine_precision@1 0.4254 0.4264 0.4076
cosine_precision@3 0.2071 0.2053 0.2003
cosine_precision@5 0.1375 0.1371 0.134
cosine_precision@10 0.0759 0.0754 0.0741
cosine_recall@1 0.4051 0.4061 0.3876
cosine_recall@3 0.5821 0.577 0.5638
cosine_recall@5 0.6421 0.6405 0.6256
cosine_recall@10 0.7052 0.7002 0.688
cosine_ndcg@10 0.562 0.5592 0.5444
cosine_mrr@10 0.5264 0.5244 0.509
cosine_map@100 0.5148 0.5128 0.4975

Training Details

Training Dataset

Unnamed Dataset

  • Size: 101,442 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 7 tokens
    • mean: 20.75 tokens
    • max: 46 tokens
    • min: 10 tokens
    • mean: 155.2 tokens
    • max: 256 tokens
  • Samples:
    anchor positive
    " Người_lớn ( trên 16 tuổi ) " được hiểu là “ Người_lớn và trẻ_em trên 16 tuổi ” " Khi triển_khai “ Hướng_dẫn quản_lý tại nhà đối_với người mắc COVID - 19 ” , đề_nghị hướng_dẫn , làm rõ một_số nội_dung như sau : . Mục 3 “ Người_lớn ( trên 16 tuổ ” : đề_nghị hướng_dẫn là “ Người_lớn và trẻ_em trên 16 tuổi ” . "
    03 Quy_chuẩn kỹ_thuật quốc_gia được ban_hành tại Thông_tư 04 là Quy_chuẩn nào ? Ban_hành kèm theo Thông_tư này 03 Quy_chuẩn kỹ_thuật quốc_gia sau : Quy_chuẩn kỹ_thuật quốc_gia về bộ trục bánh_xe của đầu_máy , toa_xe Số_hiệu : QCVN 110 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về bộ móc_nối , đỡ đấm của đầu_máy , toa_xe Số_hiệu : QCVN 111 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về van hãm sử_dụng trên đầu_máy , toa_xe Số_hiệu : QCVN 112 : 2023/BGTVT.
    03 Tổng công_ty Cảng hàng_không thực_hiện hợp_nhất có trách_nhiệm như thế_nào theo quy_định ? Các Tổng công_ty thực_hiện hợp_nhất nêu tại Điều_1 Quyết_định này có trách_nhiệm chuyển_giao nguyên_trạng toàn_bộ tài_sản , tài_chính , lao_động , đất_đai , dự_án đang triển_khai , các quyền , nghĩa_vụ và lợi_ích hợp_pháp khác sang Tổng công_ty Cảng hàng_không Việt_Nam . Trong thời_gian chưa chuyển_giao , Chủ_tịch Hội_đồng thành_viên , Tổng giám_đốc và các cá_nhân có liên_quan của 03 Tổng công_ty thực_hiện hợp_nhất chịu trách_nhiệm quản_lý toàn_bộ tài_sản , tiền vốn của Tổng công_ty , không để hư_hỏng , hao_hụt , thất_thoát .
  • Loss: MatryoshkaLoss with these parameters:
    {
        "loss": "MultipleNegativesRankingLoss",
        "matryoshka_dims": [
            256,
            128,
            64
        ],
        "matryoshka_weights": [
            1,
            1,
            1
        ],
        "n_dims_per_step": -1
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 4,450 evaluation samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 7 tokens
    • mean: 20.75 tokens
    • max: 46 tokens
    • min: 10 tokens
    • mean: 155.2 tokens
    • max: 256 tokens
  • Samples:
    anchor positive
    " Người_lớn ( trên 16 tuổi ) " được hiểu là “ Người_lớn và trẻ_em trên 16 tuổi ” " Khi triển_khai “ Hướng_dẫn quản_lý tại nhà đối_với người mắc COVID - 19 ” , đề_nghị hướng_dẫn , làm rõ một_số nội_dung như sau : . Mục 3 “ Người_lớn ( trên 16 tuổ ” : đề_nghị hướng_dẫn là “ Người_lớn và trẻ_em trên 16 tuổi ” . "
    03 Quy_chuẩn kỹ_thuật quốc_gia được ban_hành tại Thông_tư 04 là Quy_chuẩn nào ? Ban_hành kèm theo Thông_tư này 03 Quy_chuẩn kỹ_thuật quốc_gia sau : Quy_chuẩn kỹ_thuật quốc_gia về bộ trục bánh_xe của đầu_máy , toa_xe Số_hiệu : QCVN 110 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về bộ móc_nối , đỡ đấm của đầu_máy , toa_xe Số_hiệu : QCVN 111 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về van hãm sử_dụng trên đầu_máy , toa_xe Số_hiệu : QCVN 112 : 2023/BGTVT.
    03 Tổng công_ty Cảng hàng_không thực_hiện hợp_nhất có trách_nhiệm như thế_nào theo quy_định ? Các Tổng công_ty thực_hiện hợp_nhất nêu tại Điều_1 Quyết_định này có trách_nhiệm chuyển_giao nguyên_trạng toàn_bộ tài_sản , tài_chính , lao_động , đất_đai , dự_án đang triển_khai , các quyền , nghĩa_vụ và lợi_ích hợp_pháp khác sang Tổng công_ty Cảng hàng_không Việt_Nam . Trong thời_gian chưa chuyển_giao , Chủ_tịch Hội_đồng thành_viên , Tổng giám_đốc và các cá_nhân có liên_quan của 03 Tổng công_ty thực_hiện hợp_nhất chịu trách_nhiệm quản_lý toàn_bộ tài_sản , tiền vốn của Tổng công_ty , không để hư_hỏng , hao_hụt , thất_thoát .
  • Loss: MatryoshkaLoss with these parameters:
    {
        "loss": "MultipleNegativesRankingLoss",
        "matryoshka_dims": [
            256,
            128,
            64
        ],
        "matryoshka_weights": [
            1,
            1,
            1
        ],
        "n_dims_per_step": -1
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • gradient_accumulation_steps: 8
  • learning_rate: 2e-05
  • weight_decay: 0.01
  • max_grad_norm: 0.1
  • max_steps: 1200
  • lr_scheduler_type: cosine
  • warmup_ratio: 0.15
  • fp16: True
  • load_best_model_at_end: True
  • optim: adamw_torch_fused
  • gradient_checkpointing: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 8
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.01
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 0.1
  • num_train_epochs: 3.0
  • max_steps: 1200
  • lr_scheduler_type: cosine
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.15
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: True
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss Validation Loss dim_256_cosine_ndcg@10 dim_128_cosine_ndcg@10 dim_64_cosine_ndcg@10
0.5047 400 0.4797 0.3000 0.5544 0.5504 0.5393
1.0090 800 0.4274 0.2888 0.5583 0.5534 0.5415
1.5136 1200 0.3211 0.2089 0.562 0.5592 0.5444
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.10.14
  • Sentence Transformers: 3.3.0
  • Transformers: 4.45.1
  • PyTorch: 2.4.0
  • Accelerate: 0.34.2
  • Datasets: 3.0.1
  • Tokenizers: 0.20.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MatryoshkaLoss

@misc{kusupati2024matryoshka,
    title={Matryoshka Representation Learning},
    author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
    year={2024},
    eprint={2205.13147},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}