Upload from huggingface_hub
Browse files- .gitattributes +1 -0
- 1_Pooling/config.json +10 -0
- README.md +728 -0
- config.json +27 -0
- config_sentence_transformers.json +14 -0
- model.safetensors +3 -0
- modules.json +20 -0
- sentence_bert_config.json +4 -0
- sentencepiece.bpe.model +3 -0
- special_tokens_map.json +51 -0
- tokenizer.json +3 -0
- tokenizer_config.json +56 -0
.gitattributes
CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
36 |
+
tokenizer.json filter=lfs diff=lfs merge=lfs -text
|
1_Pooling/config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"word_embedding_dimension": 1024,
|
3 |
+
"pooling_mode_cls_token": false,
|
4 |
+
"pooling_mode_mean_tokens": true,
|
5 |
+
"pooling_mode_max_tokens": false,
|
6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
+
"pooling_mode_weightedmean_tokens": false,
|
8 |
+
"pooling_mode_lasttoken": false,
|
9 |
+
"include_prompt": true
|
10 |
+
}
|
README.md
ADDED
@@ -0,0 +1,728 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
tags:
|
3 |
+
- sentence-transformers
|
4 |
+
- sentence-similarity
|
5 |
+
- feature-extraction
|
6 |
+
- dense
|
7 |
+
- generated_from_trainer
|
8 |
+
- dataset_size:2864
|
9 |
+
- loss:MultipleNegativesRankingLoss
|
10 |
+
base_model: intfloat/multilingual-e5-large-instruct
|
11 |
+
widget:
|
12 |
+
- source_sentence: 'Instruct: Với một truy vấn về luật Việt Nam, truy xuất các đoạn
|
13 |
+
văn liên quan có chứa câu trả lời cho truy vấn đó.
|
14 |
+
|
15 |
+
Query: Trách nhiệm của Bộ Xây dựng trong hỗ trợ nhà ở cho hộ nghèo, hộ cận nghèo
|
16 |
+
trên địa bàn các huyện nghèo 2021-2025?'
|
17 |
+
sentences:
|
18 |
+
- '1. Cơ quan nhà nước thực hiện đầu tư xây dựng hạ tầng kỹ thuật hoặc thuê dịch
|
19 |
+
vụ từ nhà cung cấp bên ngoài để bảo đảm cho hoạt động cung cấp thông tin và dịch
|
20 |
+
vụ công trực tuyến hiệu quả và tiết kiệm chi phí.
|
21 |
+
|
22 |
+
|
23 |
+
2. Cơ quan nhà nước có trách nhiệm trang bị đầy đủ trang thiết bị cần thiết phục
|
24 |
+
vụ cho việc thu thập, xử lý và cập nhật thông tin cho các kênh cung cấp thông
|
25 |
+
tin và dịch vụ công trực tuyến trên môi trường mạng, bảo đảm khai thác hiệu quả
|
26 |
+
hạ tầng công nghệ hiện có, ứng dụng các công nghệ hiện đại, ưu tiên ứng dụng công
|
27 |
+
nghệ điện toán đám mây.'
|
28 |
+
- "1. Trách nhiệm của Bộ Xây dựng\t\ta) Tổng hợp kết quả thực hiện của các địa phương\
|
29 |
+
\ gửi Bộ Lao động - Thương binh và Xã hội để tổng hợp báo cáo Chính phủ, Thủ tướng\
|
30 |
+
\ Chính phủ theo quy định;\t\tb) Đề xuất nguồn vốn và phương án phân bổ kế hoạch\
|
31 |
+
\ vốn ngân sách trung ương giai đoạn 2021-2025 và hàng năm thuộc lĩnh vực quản\
|
32 |
+
\ lý gửi Bộ Lao động - Thương binh và Xã hội tổng hợp vào kế hoạch chung theo\
|
33 |
+
\ quy định;\t\tc) Lập kế hoạch vốn ngân sách trung ương giai đoạn 2021-2025 và\
|
34 |
+
\ hàng năm để triển khai các hoạt động phục vụ công tác chỉ đạo, điều hành, hướng\
|
35 |
+
\ dẫn thực hiện Chương trình gửi Bộ Lao động - Thương binh và Xã hội tổng hợp\
|
36 |
+
\ theo quy định;\t\td) Chủ trì, phối hợp các bộ, ngành, cơ quan trung ương hướng\
|
37 |
+
\ dẫn các tỉnh có huyện nghèo được cấp có thẩm quyền phê duyệt lập Đề án và tổ\
|
38 |
+
\ chức thực hiện hỗ trợ nhà ở đối với hộ nghèo, hộ cận nghèo trên địa bàn các\
|
39 |
+
\ huyện nghèo thuộc Chương trình mục tiêu quốc gia giảm nghèo bền vững giai đoạn\
|
40 |
+
\ 2021 - 2025 tại địa phương;\t\tđ) Chủ trì, phối hợp các bộ, ngành, cơ quan trung\
|
41 |
+
\ ương kiểm tra, giám sát, đôn đốc các tỉnh có huyện nghèo được cấp có thẩm quyền\
|
42 |
+
\ phê duyệt thực hiện chính sách hỗ trợ nhà ở cho hộ nghèo, hộ cận nghèo theo\
|
43 |
+
\ đúng mục tiêu và yêu cầu."
|
44 |
+
- '1. Trường hợp ủy quyền có thù lao, bên ủy quyền có quyền đơn phương chấm dứt
|
45 |
+
thực hiện hợp đồng bất cứ lúc nào, nhưng phải trả thù lao cho bên được ủy quyền
|
46 |
+
tương ứng với công việc mà bên được ủy quyền đã thực hiện và bồi thường thiệt
|
47 |
+
hại; nếu ủy quyền không có thù lao thì bên ủy quyền có thể chấm dứt thực hiện
|
48 |
+
hợp đồng bất cứ lúc nào, nhưng phải báo trước cho bên được ủy quyền một thời gian
|
49 |
+
hợp lý.Bên ủy quyền phải báo bằng văn bản cho người thứ ba biết về việc bên ủy
|
50 |
+
quyền chấm dứt thực hiện hợp đồng; nếu không báo thì hợp đồng với người thứ ba
|
51 |
+
vẫn có hiệu lực, trừ trường hợp người thứ ba biết hoặc phải biết về việc hợp đồng
|
52 |
+
ủy quyền đã bị chấm dứt.
|
53 |
+
|
54 |
+
|
55 |
+
2. Trường hợp ủy quyền không có thù lao, bên được ủy quyền có quyền đơn phương
|
56 |
+
chấm dứt thực hiện hợp đồng bất cứ lúc nào, nhưng phải báo trước cho bên ủy quyền
|
57 |
+
biết một thời gian hợp lý; nếu ủy quyền có thù lao thì bên được ủy quyền có quyền
|
58 |
+
đơn phương chấm dứt thực hiện hợp đồng bất cứ lúc nào và phải bồi thường thiệt
|
59 |
+
hại cho bên ủy quyền, nếu có.'
|
60 |
+
- source_sentence: 'Instruct: Với một truy vấn về luật Việt Nam, truy xuất các đoạn
|
61 |
+
văn liên quan có chứa câu trả lời cho truy vấn đó.
|
62 |
+
|
63 |
+
Query: Các trường hợp nào kiểm toán viên hành nghề bị đình chỉ hành nghề kiểm
|
64 |
+
toán?'
|
65 |
+
sentences:
|
66 |
+
- "1. Việc niêm phong chìa khóa dự phòng cửa kho tiền được các thành viên giữ chìa\
|
67 |
+
\ khóa và cán bộ kiểm soát chứng kiến, lập biên bản, cùng ký tên trên niêm phong.\
|
68 |
+
\ Các mã số để sử dụng hàng ngày và thay đổi thường xuyên quy định tại Khoản 2\
|
69 |
+
\ Điều 28 Thông tư này được từng thành viên ghi lại, niêm phong trong phong bì\
|
70 |
+
\ riêng cùng với chìa định vị dự phòng, chính là chìa khóa dự phòng của cửa kho\
|
71 |
+
\ tiền có khóa mã số. Hộp chìa khóa dự phòng được gửi vào kho tiền Ngân hàng Nhà\
|
72 |
+
\ nước chi nhánh, tổ chức tín dụng, chi nhánh ngân hàng nước ngoài khác, chi nhánh\
|
73 |
+
\ khác cùng hệ thống tổ chức tín dụng hay Kho bạc Nhà nước ngay trong ngày. Đơn\
|
74 |
+
\ vị nhận gửi có trách nhiệm bảo quản an toàn, nguyên vẹn niêm phong hộp chìa\
|
75 |
+
\ khóa dự phòng trong kho tiền của mình. \n\n2. Kho tiền Trung ương gửi chìa khóa\
|
76 |
+
\ dự phòng của cửa kho tiền vào kho tiền Ngân hàng Nhà nước chi nhánh gần nhất.\
|
77 |
+
\ Sở Giao dịch, Ngân hàng Nhà nước chi nhánh gửi chìa khóa dự phòng vào kho tiền\
|
78 |
+
\ Trung ương trên địa bàn - (nếu có) hay kho tiền Kho bạc Nhà nước tỉnh, thành\
|
79 |
+
\ phố.\n\n3. Hộp bảo quản chìa khóa dự phòng của cửa kho tiền có 2 ổ khóa, Giám\
|
80 |
+
\ đốc và thủ kho tiền mỗi người quản lý một ổ; chìa khóa hộp này được bảo quản\
|
81 |
+
\ như chìa khóa đang dùng của cửa kho tiền."
|
82 |
+
- "1. Người sử dụng thiết bị cân kiểm tra tải trọng xe\t\ta) Là thanh tra viên,\
|
83 |
+
\ công chức thanh tra, công chức thuộc các cơ quan thực hiện chức năng thanh tra\
|
84 |
+
\ đường bộ; nhân viên thuộc các cơ quan quản lý đường bộ và các tổ chức được giao\
|
85 |
+
\ khai thác, bảo trì kết cấu hạ tầng giao thông đường bộ. Trường hợp nhân viên\
|
86 |
+
\ thuộc các cơ quan quản lý đường bộ và các tổ chức được giao khai thác, bảo trì\
|
87 |
+
\ kết cấu hạ tầng giao thông đường bộ không là công chức, viên chức thì phải được\
|
88 |
+
\ ký hợp đồng lao động không xác định thời hạn theo quy định của pháp luật về\
|
89 |
+
\ lao động;\t\tb) Hiểu biết các tiêu chuẩn, quy chuẩn kỹ thuật, quy định, quy\
|
90 |
+
\ trình, nghiệp vụ liên quan đến kiểm tra tải trọng xe, các quy định của pháp\
|
91 |
+
\ luật về bảo vệ kết cấu hạ tầng giao thông đường bộ, trật tự an toàn giao thông,\
|
92 |
+
\ xử phạt vi phạm hành chính, quy trình vận hành và bảo trì thiết bị; sử dụng\
|
93 |
+
\ thành thạo thiết bị cân kiểm tra tải trọng xe;\t\tc) Có trình độ B về tin học\
|
94 |
+
\ trở lên đối với người sử dụng hệ thống máy tính điều khiển hệ thống thiết bị\
|
95 |
+
\ cân kiểm tra tải trọng xe.\n\n2. Người sử dụng thiết bị ghi hình\t\ta) Đáp ứng\
|
96 |
+
\ yêu cầu quy định tại điểm a khoản 1 Điều này;\t\tb) Hiểu biết các quy định của\
|
97 |
+
\ pháp luật về bảo vệ kết cấu hạ tầng giao thông đường bộ, trật tự an toàn giao\
|
98 |
+
\ thông, xử phạt vi phạm hành chính trong lĩnh vực giao thông đường bộ.\n\n3.\
|
99 |
+
\ Người sử dụng phương tiện, thiết bị kỹ thuật nghiệp vụ phải được tập huấn về\
|
100 |
+
\ quy trình, thao tác sử dụng, bảo quản phương tiện, thiết bị kỹ thuật nghiệp\
|
101 |
+
\ vụ và các quy định của pháp luật về xử phạt vi phạm hành chính trong lĩnh vực\
|
102 |
+
\ đường bộ có liên quan.\n\n4. Khi thực hiện nhiệm vụ, người sử dụng phương tiện,\
|
103 |
+
\ thiết bị kỹ thuật nghiệp vụ phải mặc trang phục của cơ quan, đơn vị; đeo thẻ\
|
104 |
+
\ tên, chức danh của cơ quan, đơn vị quản lý phương tiện, thiết bị kỹ thuật nghiệp\
|
105 |
+
\ vụ.\n\n5. Trách nhiệm của người sử dụng phương tiện, thiết bị kỹ thuật nghiệp\
|
106 |
+
\ vụ\t\ta) Quản lý và sử dụng phương tiện, thiết bị kỹ thuật nghiệp vụ đúng quy\
|
107 |
+
\ trình, quy định của pháp luật;\t\tb) Sử dụng kết quả thu được từ phương tiện,\
|
108 |
+
\ thiết bị kỹ thuật nghiệp vụ đúng mục đích theo quy định của pháp luật và chịu\
|
109 |
+
\ trách nhiệm trước pháp luật về kết quả thu được từ phương tiện, thiết bị kỹ\
|
110 |
+
\ thuật nghiệp vụ."
|
111 |
+
- "1. Giấy chứng nhận đăng ký hành nghề kiểm toán được cấp lại trong các trường\
|
112 |
+
\ hợp sau:\t\ta) Giấy chứng nhận đăng ký hành nghề kiểm toán hết thời hạn;\t\t\
|
113 |
+
b) Giấy chứng nhận đăng ký hành nghề kiểm toán bị mất;\t\tc) Giấy chứng nhận đăng\
|
114 |
+
\ ký hành nghề kiểm toán bị hỏng.\n2. Trường hợp Giấy chứng nhận đăng ký hành\
|
115 |
+
\ nghề ki���m toán hết thời hạn, nếu kiểm toán viên hành nghề muốn tiếp tục hành\
|
116 |
+
\ nghề kiểm toán thì nộp hồ sơ đề nghị cấp lại Giấy chứng nhận đăng ký hành nghề\
|
117 |
+
\ kiểm toán. Thời hạn nộp hồ sơ đề nghị cấp lại chậm nhất là 60 ngày trước ngày\
|
118 |
+
\ hết hạn của Giấy chứng nhận đăng ký hành nghề kiểm toán.\n3. Hồ sơ đề nghị cấp\
|
119 |
+
\ lại Giấy chứng nhận đăng ký hành nghề kiểm toán đối với trường hợp Giấy chứng\
|
120 |
+
\ nhận đăng ký hành nghề kiểm toán hết thời hạn bao gồm:\t\ta) Đơn đề nghị cấp\
|
121 |
+
\ lại Giấy chứng nhận đăng ký hành nghề kiểm toán theo mẫu quy định tại Phụ lục\
|
122 |
+
\ số 02/ĐKHN ban hành kèm theo Thông tư này;b) 02 ảnh màu 3x4cm được chụp trên\
|
123 |
+
\ nền trắng trong thời hạn không quá sáu (06) tháng tính đến ngày nộp hồ sơ đăng\
|
124 |
+
\ ký hành nghề kiểm toán;\t\tc) Các tài liệu quy định tại khoản 2, khoản 4, khoản\
|
125 |
+
\ 8, khoản 9 Điều 4 Thông tư này nếu có thay đổi so với lần đăng ký hành nghề\
|
126 |
+
\ gần nhất.\n4. Hồ sơ đề nghị cấp lại Giấy chứng nhận đăng ký hành nghề kiểm toán\
|
127 |
+
\ đối với trường hợp Giấy chứng nhận đăng ký hành nghề kiểm toán bị mất, hỏng\
|
128 |
+
\ bao gồm:\t\ta) Đơn đề nghị cấp lại Giấy chứng nhận đăng ký hành nghề kiểm toán\
|
129 |
+
\ theo mẫu quy định tại Phụ lục số 02/ĐKHN ban hành kèm theo Thông tư này;b) 02\
|
130 |
+
\ ảnh màu 3x4cm được chụp trên nền trắng trong thời hạn không quá sáu (06) tháng\
|
131 |
+
\ tính đến ngày nộp hồ sơ đăng ký hành nghề kiểm toán;\t\tc) Giấy chứng nhận đăng\
|
132 |
+
\ ký hành nghề kiểm toán cũ đối với trường hợp Giấy chứng nhận đăng ký hành nghề\
|
133 |
+
\ kiểm toán bị hỏng.\n5. Bộ Tài chính xem xét, cấp lại Giấy chứng nhận đăng ký\
|
134 |
+
\ hành nghề kiểm toán cho kiểm toán viên hành nghề trong thời hạn 15 ngày kể từ\
|
135 |
+
\ ngày nhận được hồ sơ hợp lệ và kiểm toán viên hành nghề đảm bảo đủ điều kiện,\
|
136 |
+
\ nộp đủ lệ phí và đúng trình tự quy định tại Điều 5 Thông tư này. Trường hợp\
|
137 |
+
\ từ chối, Bộ Tài chính trả lời bằng văn bản và nêu rõ lý do."
|
138 |
+
- source_sentence: 'Instruct: Với một truy vấn về luật Việt Nam, truy xuất các đoạn
|
139 |
+
văn liên quan có chứa câu trả lời cho truy vấn đó.
|
140 |
+
|
141 |
+
Query: Các đơn vị nào giúp việc Giám đốc Học viện Chính trị quốc gia Hồ Chí Minh?'
|
142 |
+
sentences:
|
143 |
+
- "lập biên bản nhưng chưa ra quyết định xử phạt; b) Trường hợp một cá nhân, tổ\
|
144 |
+
\ chức thực hiện nhiều hành vi vi phạm hành chính khác nhau trong cùng một vụ\
|
145 |
+
\ vi phạm, thì người có thẩm quyền lập một biên bản vi phạm hành chính, trong\
|
146 |
+
\ đó ghi rõ từng hành vi vi phạm; c) Trường hợp nhiều cá nhân, tổ chức cùng thực\
|
147 |
+
\ hiện một hành vi vi phạm hành chính trong cùng một vụ vi phạm, thì người có\
|
148 |
+
\ thẩm quyền có thể lập một hoặc nhiều biên bản vi phạm hành chính đối với từng\
|
149 |
+
\ cá nhân, tổ chức vi phạm. Trường hợp giá trị tang vật, phương tiện vi phạm hành\
|
150 |
+
\ chính khác nhau, thì người có thẩm quyền phải ghi rõ giá trị tang vật, phương\
|
151 |
+
\ tiện vi phạm hành chính của từng cá nhân, tổ chức vi phạm; d) Trường hợp nhiều\
|
152 |
+
\ cá nhân, tổ chức thực hiện nhiều hành vi vi phạm hành chính khác nhau trong\
|
153 |
+
\ cùng một vụ vi phạm, thì người có thẩm quyền có thể lập một hoặc nhiều biên\
|
154 |
+
\ bản vi phạm hành chính, trong đó ghi rõ từng hành vi vi phạm của từng cá nhân,\
|
155 |
+
\ tổ chức; đ) Trường hợp cá nhân, tổ chức vi phạm hành chính nhiều lần, thì người\
|
156 |
+
\ có thẩm quyền lập một biên bản vi phạm hành chính, trong đó ghi rõ từng hành\
|
157 |
+
\ vi vi phạm và từng lần vi phạm.\n\n4. Biên bản vi phạm hành chính phải bao gồm\
|
158 |
+
\ các nội dung cơ bản sau đây:\t\ta) Ngày, tháng, năm, địa điểm lập biên bản;\t\
|
159 |
+
\tb) Họ và tên, chức vụ người lập biên bản; \t\tc) Thông tin về cá nhân, tổ chức\
|
160 |
+
\ vi phạm và cơ quan, tổ chức, cá nhân có liên quan;\t\td) Giờ, ngày, tháng, năm,\
|
161 |
+
\ địa điểm xảy ra vi phạm; \t\tđ) Mô tả cụ thể, đầy đủ vụ việc, hành vi vi phạm;\
|
162 |
+
\ \t\te) Biện pháp ngăn chặn và bảo đảm xử lý vi phạm hành chính; \t\tg) Lời khai\
|
163 |
+
\ của người vi phạm hoặc đại diện tổ chức vi phạm (đại diện theo pháp luật hoặc\
|
164 |
+
\ đại diện theo ủy quyền); \t\th) Lời khai của người chứng kiến, người bị thiệt\
|
165 |
+
\ hại hoặc đại diện tổ chức bị thiệt hại (nếu có); ý kiến của cha mẹ hoặc của\
|
166 |
+
\ người giám hộ trong trường hợp người chưa thành niên vi phạm hành chính (nếu\
|
167 |
+
\ có);\t\ti) Quyền và thời hạn giải trình về vi phạm hành chính của cá nhân, tổ\
|
168 |
+
\ chức vi phạm, cơ quan của người có thẩm quyền tiếp nhận giải trình; trường hợp\
|
169 |
+
\ cá nhân, tổ chức không yêu cầu giải trình, thì phải ghi rõ ý kiến vào biên bản;\
|
170 |
+
\ \t\tk) Thời gian, địa điểm người vi phạm hoặc đại diện tổ chức vi phạm phải\
|
171 |
+
\ có mặt để giải quyết vụ việc;\t\tl) Họ và tên người nhận, thời gian nhận biên\
|
172 |
+
\ bản trong trường hợp biên bản được giao trực tiếp."
|
173 |
+
- "1. Việc đăng văn bản hợp nhất trên Cổng thông tin điện tử chính thức của các\
|
174 |
+
\ cơ quan nhà nước được thực hiện như sau:\t\ta) Vụ Pháp chế có trách nhiệm đăng\
|
175 |
+
\ tải lên Cổng thông tin điện tử của Bộ ngay sau khi văn bản hợp nhất được ký\
|
176 |
+
\ xác thực;\t\tb) Văn phòng Bộ có trách nhiệm gửi văn bản hợp nhất cho Văn phòng\
|
177 |
+
\ Chính phủ trong thời hạn 02 ngày làm việc, kể từ ngày ký xác thực, để đưa lên\
|
178 |
+
\ Cổng thông tin điện tử Chính phủ trong trường hợp văn bản sửa đổi, bổ sung do\
|
179 |
+
\ Chính phủ, Thủ tướng Chính phủ ban hành.\n\n2. Văn phòng Bộ có trách nhiệm gửi\
|
180 |
+
\ văn bản hợp nhất cho cơ quan Công báo để thực hiện việc đăng Công báo sau 02\
|
181 |
+
\ ngày làm việc, kể từ ngày Bộ trưởng ký xác thực văn bản hợp nhất."
|
182 |
+
- '1. Vụ Tổ chức - Cán bộ;
|
183 |
+
|
184 |
+
|
185 |
+
2. Vụ Quản lý đào tạo;
|
186 |
+
|
187 |
+
|
188 |
+
3. Vụ Quản lý khoa học;
|
189 |
+
|
190 |
+
|
191 |
+
4. Vụ Các trường chính trị;
|
192 |
+
|
193 |
+
|
194 |
+
5. Vụ Hợp tác quốc tế;
|
195 |
+
|
196 |
+
|
197 |
+
6. Vụ Kế hoạch - Tài chính;
|
198 |
+
|
199 |
+
|
200 |
+
7. Ban Thanh tra;
|
201 |
+
|
202 |
+
|
203 |
+
8. Văn phòng Học viện;
|
204 |
+
|
205 |
+
|
206 |
+
9. Văn phòng Đảng - Đoàn thể;
|
207 |
+
|
208 |
+
|
209 |
+
10. Trung tâm Khảo thí và Đảm bảo chất lượng đào tạo;
|
210 |
+
|
211 |
+
|
212 |
+
11. Học viện Chính trị khu vực I (đặt tại thành phố Hà Nội);
|
213 |
+
|
214 |
+
|
215 |
+
12. Học viện Chính trị khu vực II (đặt tại thành phố Hồ Chí Minh);
|
216 |
+
|
217 |
+
|
218 |
+
13. Học viện Chính trị khu vực III (đặt tại thành phố Đà Nẵng);
|
219 |
+
|
220 |
+
|
221 |
+
14. Học viện Chính trị khu vực IV (đặt tại thành phố Cần Thơ);
|
222 |
+
|
223 |
+
|
224 |
+
15. Học viện Báo chí và Tuyên truyền (đặt tại thành phố Hà Nội);
|
225 |
+
|
226 |
+
|
227 |
+
16. Viện Triết học;
|
228 |
+
|
229 |
+
|
230 |
+
17. Viện Kinh tế chính trị học;
|
231 |
+
|
232 |
+
|
233 |
+
18. Viện Kinh tế;
|
234 |
+
|
235 |
+
|
236 |
+
19. Viện Chủ nghĩa xã hội khoa học;
|
237 |
+
|
238 |
+
|
239 |
+
20. Viện Hồ Chí Minh và các lãnh tụ của Đảng;
|
240 |
+
|
241 |
+
|
242 |
+
21. Viện Lịch sử Đảng;
|
243 |
+
|
244 |
+
|
245 |
+
22. Viện Xây dựng Đảng;
|
246 |
+
|
247 |
+
|
248 |
+
23. Viện Chính trị học;
|
249 |
+
|
250 |
+
|
251 |
+
24. Viện Nhà nước và Pháp luật;
|
252 |
+
|
253 |
+
|
254 |
+
25. Viện Văn hóa và Phát triển;
|
255 |
+
|
256 |
+
|
257 |
+
26. Viện Quan hệ quốc tế;
|
258 |
+
|
259 |
+
|
260 |
+
27. Viện Nghiên cứu quyền con người;
|
261 |
+
|
262 |
+
|
263 |
+
28. Viện Xã hội học;
|
264 |
+
|
265 |
+
|
266 |
+
29. Viện Nghiên cứu tôn giáo, tín ngưỡng;
|
267 |
+
|
268 |
+
|
269 |
+
30. Viện Lãnh đạo học và Chính sách công;
|
270 |
+
|
271 |
+
|
272 |
+
31. Viện Đào tạo, Bồi dưỡng cán bộ lãnh đạo, quản lý;
|
273 |
+
|
274 |
+
|
275 |
+
32. Viện Thông tin khoa học;
|
276 |
+
|
277 |
+
|
278 |
+
33. Tạp chí Lý luận chính trị;
|
279 |
+
|
280 |
+
|
281 |
+
34. Nhà xuất bản Lý luận chính trị.Tại Điều này, các đơn vị quy định từ Khoản
|
282 |
+
1 đến Khoản 10 là các đơn vị tham mưu giúp việc Giám đốc Học viện, được thành
|
283 |
+
lập phòng; các đơn vị quy định từ Khoản 11 đến Khoản 34 là các đơn vị sự nghiệp.Học
|
284 |
+
viện Chính trị quốc gia Hồ Chí Minh phối hợp với Ban Tổ chức Trung ương và các
|
285 |
+
cơ quan chức năng khác trình Bộ Chính trị, Ban Bí thư và Chính phủ quyết định
|
286 |
+
việc thay đổi cơ cấu tổ chức của Học viện.'
|
287 |
+
- source_sentence: 'Instruct: Với một truy vấn về luật Việt Nam, truy xuất các đoạn
|
288 |
+
văn liên quan có chứa câu trả lời cho truy vấn đó.
|
289 |
+
|
290 |
+
Query: Không cho thành viên trong gia đình định đoạt tài sản thuộc sở hữu chung
|
291 |
+
có bị xử phạt hành chính về bình đẳng giới không?'
|
292 |
+
sentences:
|
293 |
+
- "1. Mẫu phiếu thao tác quy định tại Phụ lục 2 ban hành kèm theo Thông tư này.\n\
|
294 |
+
\n2. Phiếu thao tác phải rõ ràng, không được sửa chữa tẩy xóa và thể hiện rõ phiếu\
|
295 |
+
\ được viết cho sơ đồ kết dây nào. Trước khi tiến hành thao tác, người thao tác\
|
296 |
+
\ phải kiểm tra sự tương ứng của sơ đồ kết dây thực tế với sơ đồ trong phiếu thao\
|
297 |
+
\ tác. Nếu sơ đồ trong phiếu thao tác không đúng với sơ đồ kết dây thực tế phải\
|
298 |
+
\ viết lại phiếu thao tác khác phù hợp với sơ đồ kết dây thực tế theo quy định\
|
299 |
+
\ tại Điều 8 Thông tư này.Mọi sự thay đổi nội dung thao tác trong phiếu thao tác\
|
300 |
+
\ để phù hợp với sơ đồ kết dây thực tế phải được sự đồng ý của người duyệt phiếu\
|
301 |
+
\ và phải ghi vào mục “Các sự kiện bất thường trong thao tác” của phiếu thao tác\
|
302 |
+
\ và sổ nhật ký vận hành.\n\n3. Các phiếu thao tác lập ra phải được đánh số. Những\
|
303 |
+
\ phiếu thao tác đã thực hiện xong phải được lưu trữ ít nhất 03 tháng. Phiếu thao\
|
304 |
+
\ tác phải được lưu lại trong hồ sơ điều tra trong trường hợp thao tác có xảy\
|
305 |
+
\ ra sự cố hoặc tai nạn.\n\n4. Các đơn vị được phép ban hành phiếu thao tác mẫu\
|
306 |
+
\ được lập và phê duyệt trước đối với một số thao tác theo sơ đồ kết dây cơ bản,\
|
307 |
+
\ bao gồm các thao tác sau:\t\ta) Thao tác tách hoặc đưa vào vận hành thanh cái;\t\
|
308 |
+
\tb) Thao tác dùng máy cắt vòng thay cho máy cắt đang vận hành và ngược lại;\t\
|
309 |
+
\tc) Thao tác tách ra hoặc đưa vào vận hành máy biến áp;\t\td) Thao tác tách hoặc\
|
310 |
+
\ đưa vào vận hành các thiết bị bù;\t\tđ) Thao tác tách hoặc đưa vào vận hành\
|
311 |
+
\ đường dây.Phiếu thao tác mẫu được viết và duyệt theo quy định tại Điều 7 Thông\
|
312 |
+
\ tư này. Trước khi tiến hành thao tác theo phiếu thao tác mẫu, người thao tác\
|
313 |
+
\ phải kiểm tra sự phù hợp của sơ đồ kết dây thực tế với sơ đồ trong phiếu thao\
|
314 |
+
\ tác mẫu."
|
315 |
+
- "1. Kể từ ngày giao nhận\r\ncon nuôi, giữa cha mẹ nuôi và con nuôi có đầy đủ các\
|
316 |
+
\ quyền, nghĩa vụ của cha mẹ\r\nvà con; giữa con nuôi và các thành viên khác của\
|
317 |
+
\ gia đình cha mẹ nuôi cũng có\r\ncác quyền, nghĩa vụ đối với nhau theo quy định\
|
318 |
+
\ của pháp luật về hôn nhân và gia\r\nđình, pháp luật dân sự và các quy định khác\
|
319 |
+
\ của pháp luật có liên quan. \n\n2. Theo yêu cầu của\r\ncha mẹ nuôi, cơ quan\
|
320 |
+
\ nhà nước có thẩm quyền quyết định việc thay đổi họ, tên của\r\ncon nuôi. Việc\
|
321 |
+
\ thay đổi họ, tên\r\ncủa con nuôi từ đủ 09 tuổi trở lên phải được sự đồng ý của\
|
322 |
+
\ người đó. \n\n3. Dân tộc của con\r\nnuôi là trẻ em bị bỏ rơi được xác định theo\
|
323 |
+
\ dân tộc của cha nuôi, mẹ nuôi. \n\n4.\r\nTrừ trường hợp giữa cha mẹ đẻ và cha\
|
324 |
+
\ mẹ nuôi có thỏa thuận khác, kể từ ngày\r\ngiao nhận con nuôi, cha mẹ đẻ không\
|
325 |
+
\ còn quyền, nghĩa vụ chăm sóc, nuôi dưỡng, cấp\r\ndưỡng, đại diện theo pháp luật,\
|
326 |
+
\ bồi thường thiệt hại, quản lý, định đoạt tài sản\r\nriêng đối với con đã cho\
|
327 |
+
\ làm con nuôi. "
|
328 |
+
- "1. Phạt tiền từ 3.000.000 đồng đến 5.000.000 đồng đối với một trong các hành\
|
329 |
+
\ vi sau đây:\t\ta) Cản trở hoặc không cho thành viên trong gia đình thực hiện\
|
330 |
+
\ các hoạt động tạo thu nhập hoặc đáp ứng các nhu cầu khác của gia đình vì lý\
|
331 |
+
\ do giới tính;\t\tb) Đối xử bất bình đẳng giữa các thành viên trong gia đình\
|
332 |
+
\ vì lý do giới tính.\n\n2. Phạt tiền từ 5.000.000 đồng đến 7.000.000 đồng đối\
|
333 |
+
\ với một trong các hành vi sau đây:\t\ta) Đe dọa dùng vũ lực hoặc uy hiếp tinh\
|
334 |
+
\ thần nhằm cản trở thành viên trong gia đình có đủ điều kiện theo quy định của\
|
335 |
+
\ pháp luật tham gia định đoạt tài sản thuộc sở hữu chung của hộ gia đình vì lý\
|
336 |
+
\ do giới tính;b) Áp đặt việc thực hiện lao động gia đình, sử dụng biện pháp tránh\
|
337 |
+
\ thai, triệt sản như là trách nhiệm của thành viên trong gia đình thuộc một giới\
|
338 |
+
\ nhất định.\n\n3. Phạt tiền từ 7.000.000 đồng đến 10.000.000 đồng đối với hành\
|
339 |
+
\ vi dùng vũ lực nhằm cản trở thành viên trong gia đình có đủ điều kiện theo quy\
|
340 |
+
\ định của pháp luật tham gia định đoạt tài sản thuộc sở hữu chung của hộ gia\
|
341 |
+
\ đình vì lý do giới tính.\n\n4. Hình thức xử phạt bổ sung:Tịch thu tang vật,\
|
342 |
+
\ phương tiện vi phạm hành chính đối với hành vi quy định tại khoản 3 Điều này.\n\
|
343 |
+
\n5. Biện pháp khắc phục hậu quả:\t\ta) Buộc xin lỗi công khai người bị xâm phạm\
|
344 |
+
\ đối với hành vi quy định tại khoản 1, 2 và 3 Điều này (trừ trường hợp người\
|
345 |
+
\ bị xâm phạm có đơn không yêu cầu);\t\tb) Buộc chịu mọi chi phí khám bệnh, chữa\
|
346 |
+
\ bệnh hợp lý đối với hành vi quy định tại khoản 2 và khoản 3 Điều này trong trường\
|
347 |
+
\ hợp gây thiệt hại về sức khỏe, tinh thần cho người bị xâm phạm;\t\tc) Buộc khôi\
|
348 |
+
\ phục quyền lợi hợp pháp của người bị xâm phạm đối với hành vi quy định tại khoản\
|
349 |
+
\ 1, điểm a khoản 2 và khoản 3 Điều này."
|
350 |
+
- source_sentence: 'Instruct: Với một truy vấn về luật Việt Nam, truy xuất các đoạn
|
351 |
+
văn liên quan có chứa câu trả lời cho truy vấn đó.
|
352 |
+
|
353 |
+
Query: Tự ý mở liveshow ca nhạc biểu diễn tại nhà bị phạt bao nhiêu tiền?'
|
354 |
+
sentences:
|
355 |
+
- "1. Phạt tiền từ 5.000.000 đồng đến 10.000.000 đồng đối với một trong các hành\
|
356 |
+
\ vi sau đây:\t\ta) Kê khai không trung thực trong hồ sơ đề nghị chấp thuận tổ\
|
357 |
+
\ chức biểu diễn nghệ thuật, tổ chức cuộc thi, liên hoan các loại hình nghệ thuật\
|
358 |
+
\ biểu diễn;\t\tb) Thực hiện không đúng thông báo với cơ quan nhà nước có thẩm\
|
359 |
+
\ quyền theo quy định tổ chức biểu diễn nghệ thuật, tổ chức cuộc thi, liên hoan\
|
360 |
+
\ các loại hình nghệ thuật biểu diễn phục vụ nhiệm vụ chính trị; phục vụ nội bộ\
|
361 |
+
\ cơ quan và tổ chức; \t\tc) Thực hiện không đúng thông báo với cơ quan nhà nước\
|
362 |
+
\ có thẩm quyền theo quy định tổ chức biểu diễn nghệ thuật phục vụ tại các cơ\
|
363 |
+
\ sở kinh doanh dịch vụ du lịch, vui chơi, giải trí, nhà hàng không bán vé xem\
|
364 |
+
\ biểu diễn nghệ thuật.\n2. Phạt tiền từ 10.000.000 đồng đến 15.000.000 đồng đối\
|
365 |
+
\ với một trong các hành vi sau đây:\t\ta) Tổ chức biểu diễn nghệ thuật, tổ chức\
|
366 |
+
\ cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn không đúng nội dung ghi\
|
367 |
+
\ trong văn bản chấp thuận; \t\tb) Tẩy xóa, sửa chữa hoặc bổ sung làm thay đổi\
|
368 |
+
\ nội dung trong văn bản chấp thuận tổ chức biểu diễn nghệ thuật, tổ chức cuộc\
|
369 |
+
\ thi, liên hoan các loại hình nghệ thuật;\t\tc) Không thông báo với cơ quan nhà\
|
370 |
+
\ nước có thẩm quyền theo quy định tổ chức biểu diễn nghệ thuật, tổ chức cuộc\
|
371 |
+
\ thi, liên hoan các loại hình nghệ thuật biểu diễn phục vụ nhiệm vụ chính trị;\
|
372 |
+
\ phục vụ nội bộ cơ quan và tổ chức; \t\td) Không thông báo với cơ quan nhà nước\
|
373 |
+
\ có thẩm quyền theo quy định tổ chức biểu diễn nghệ thuật phục vụ tại các cơ\
|
374 |
+
\ sở kinh doanh dịch vụ du lịch, vui chơi, giải trí, nhà hàng không bán vé xem\
|
375 |
+
\ biểu diễn nghệ thuật.\n3. Phạt tiền từ 15.000.000 đồng đến 20.000.000 đồng đối\
|
376 |
+
\ với một trong các hành vi sau đây:\t\ta) Không thu hồi danh hiệu, giải thưởng\
|
377 |
+
\ cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn khi đã có văn bản yêu\
|
378 |
+
\ cầu thu hồi của cơ quan nhà nước có thẩm quyền;\t\tb) Không công bố công khai\
|
379 |
+
\ trên các phương tiện thông tin đại chúng về việc thu hồi danh hiệu, giải thưởng\
|
380 |
+
\ cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn;\t\tc) Sử dụng danh hiệu,\
|
381 |
+
\ giải thưởng cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn sau khi bị\
|
382 |
+
\ thu hồi hoặc có quyết định hủy kết quả cuộc thi, liên hoan các loại hình nghệ\
|
383 |
+
\ thuật biểu diễn."
|
384 |
+
- "1. Quyền của đơn vị quản lý, vận hành: \t\ta) Được thanh toán đúng và đủ các\
|
385 |
+
\ chi phí theo quy định trong hợp đồng; \t\tb) Đề nghị cơ quan nhà nước có thẩm\
|
386 |
+
\ quyền xem xét sửa đổi, bổ sung các quy chuẩn kỹ thuật, tiêu chuẩn có liên quan\
|
387 |
+
\ đến chiếu sáng công cộng đô thị; \t\tc) Được quyền tham gia ý kiến vào việc\
|
388 |
+
\ lập quy hoạch chiếu sáng đô thị trên địa bàn được giao quản lý; tham gia nghiên\
|
389 |
+
\ cứu khoa học; thực hiện các dịch vụ về tư vấn, thiết kế, xây dựng chiếu sáng\
|
390 |
+
\ đô thị; nghiên cứu ứng dụng công nghệ mới trong chiếu sáng công cộng, trong\
|
391 |
+
\ quản lý, vận hành hệ thống chiếu sáng công cộng đô thị. \n\n2. Trách nhiệm\
|
392 |
+
\ của đơn vị quản lý, vận hành: \t\ta) Đảm bảo thực hiện đúng nhiệm vụ; các quy\
|
393 |
+
\ định về quản lý, vận hành đã cam kết trong h���p đồng; \t\tb) Báo cáo định kỳ\
|
394 |
+
\ tới chính quyền đô thị và cơ quan chuyên môn về quản lý, vận hành hệ thống chiếu\
|
395 |
+
\ sáng công cộng đô thị do mình được giao; \t\tc) Tổ chức triển khai thực hiện\
|
396 |
+
\ kế hoạch đầu tư phát triển chiếu sáng công cộng đô thị đã được phê duyệt; \t\
|
397 |
+
\td) Quản lý tài sản được đầu tư từ nguồn vốn ngân sách nhà nước theo hợp đồng\
|
398 |
+
\ ký kết với chính quyền đô thị; \t\tđ) Bảo vệ hệ thống chiếu sáng công cộng\
|
399 |
+
\ đô thị trên địa bàn được giao quản lý."
|
400 |
+
- "Có năng lực ứng dụng công nghệ\r\nthông tin đáp ứng yêu cầu trong việc thực hiện\
|
401 |
+
\ các nhiệm vụ theo yêu cầu vị trí\r\nviệc làm của giáo viên giáo dục nghề nghiệp\
|
402 |
+
\ dạy trình độ trung cấp."
|
403 |
+
pipeline_tag: sentence-similarity
|
404 |
+
library_name: sentence-transformers
|
405 |
+
---
|
406 |
+
|
407 |
+
# SentenceTransformer based on intfloat/multilingual-e5-large-instruct
|
408 |
+
|
409 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-large-instruct](https://huggingface.co/intfloat/multilingual-e5-large-instruct). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
410 |
+
|
411 |
+
## Model Details
|
412 |
+
|
413 |
+
### Model Description
|
414 |
+
- **Model Type:** Sentence Transformer
|
415 |
+
- **Base model:** [intfloat/multilingual-e5-large-instruct](https://huggingface.co/intfloat/multilingual-e5-large-instruct) <!-- at revision 274baa43b0e13e37fafa6428dbc7938e62e5c439 -->
|
416 |
+
- **Maximum Sequence Length:** 512 tokens
|
417 |
+
- **Output Dimensionality:** 1024 dimensions
|
418 |
+
- **Similarity Function:** Cosine Similarity
|
419 |
+
<!-- - **Training Dataset:** Unknown -->
|
420 |
+
<!-- - **Language:** Unknown -->
|
421 |
+
<!-- - **License:** Unknown -->
|
422 |
+
|
423 |
+
### Model Sources
|
424 |
+
|
425 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
426 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
427 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
428 |
+
|
429 |
+
### Full Model Architecture
|
430 |
+
|
431 |
+
```
|
432 |
+
SentenceTransformer(
|
433 |
+
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
|
434 |
+
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
435 |
+
(2): Normalize()
|
436 |
+
)
|
437 |
+
```
|
438 |
+
|
439 |
+
## Usage
|
440 |
+
|
441 |
+
### Direct Usage (Sentence Transformers)
|
442 |
+
|
443 |
+
First install the Sentence Transformers library:
|
444 |
+
|
445 |
+
```bash
|
446 |
+
pip install -U sentence-transformers
|
447 |
+
```
|
448 |
+
|
449 |
+
Then you can load this model and run inference.
|
450 |
+
```python
|
451 |
+
from sentence_transformers import SentenceTransformer
|
452 |
+
|
453 |
+
# Download from the 🤗 Hub
|
454 |
+
model = SentenceTransformer("sentence_transformers_model_id")
|
455 |
+
# Run inference
|
456 |
+
sentences = [
|
457 |
+
'Instruct: Với một truy vấn về luật Việt Nam, truy xuất các đoạn văn liên quan có chứa câu trả lời cho truy vấn đó.\nQuery: Tự ý mở liveshow ca nhạc biểu diễn tại nhà bị phạt bao nhiêu tiền?',
|
458 |
+
'1. Phạt tiền từ 5.000.000 đồng đến 10.000.000 đồng đối với một trong các hành vi sau đây:\t\ta) Kê khai không trung thực trong hồ sơ đề nghị chấp thuận tổ chức biểu diễn nghệ thuật, tổ chức cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn;\t\tb) Thực hiện không đúng thông báo với cơ quan nhà nước có thẩm quyền theo quy định tổ chức biểu diễn nghệ thuật, tổ chức cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn phục vụ nhiệm vụ chính trị; phục vụ nội bộ cơ quan và tổ chức; \t\tc) Thực hiện không đúng thông báo với cơ quan nhà nước có thẩm quyền theo quy định tổ chức biểu diễn nghệ thuật phục vụ tại các cơ sở kinh doanh dịch vụ du lịch, vui chơi, giải trí, nhà hàng không bán vé xem biểu diễn nghệ thuật.\n2. Phạt tiền từ 10.000.000 đồng đến 15.000.000 đồng đối với một trong các hành vi sau đây:\t\ta) Tổ chức biểu diễn nghệ thuật, tổ chức cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn không đúng nội dung ghi trong văn bản chấp thuận; \t\tb) Tẩy xóa, sửa chữa hoặc bổ sung làm thay đổi nội dung trong văn bản chấp thuận tổ chức biểu diễn nghệ thuật, tổ chức cuộc thi, liên hoan các loại hình nghệ thuật;\t\tc) Không thông báo với cơ quan nhà nước có thẩm quyền theo quy định tổ chức biểu diễn nghệ thuật, tổ chức cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn phục vụ nhiệm vụ chính trị; phục vụ nội bộ cơ quan và tổ chức; \t\td) Không thông báo với cơ quan nhà nước có thẩm quyền theo quy định tổ chức biểu diễn nghệ thuật phục vụ tại các cơ sở kinh doanh dịch vụ du lịch, vui chơi, giải trí, nhà hàng không bán vé xem biểu diễn nghệ thuật.\n3. Phạt tiền từ 15.000.000 đồng đến 20.000.000 đồng đối với một trong các hành vi sau đây:\t\ta) Không thu hồi danh hiệu, giải thưởng cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn khi đã có văn bản yêu cầu thu hồi của cơ quan nhà nước có thẩm quyền;\t\tb) Không công bố công khai trên các phương tiện thông tin đại chúng về việc thu hồi danh hiệu, giải thưởng cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn;\t\tc) Sử dụng danh hiệu, giải thưởng cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn sau khi bị thu hồi hoặc có quyết định hủy kết quả cuộc thi, liên hoan các loại hình nghệ thuật biểu diễn.',
|
459 |
+
'1. Quyền của đơn vị quản lý, vận hành: \t\ta) Được thanh toán đúng và đủ các chi phí theo quy định trong hợp đồng; \t\tb) Đề nghị cơ quan nhà nước có thẩm quyền xem xét sửa đổi, bổ sung các quy chuẩn kỹ thuật, tiêu chuẩn có liên quan đến chiếu sáng công cộng đô thị; \t\tc) Được quyền tham gia ý kiến vào việc lập quy hoạch chiếu sáng đô thị trên địa bàn được giao quản lý; tham gia nghiên cứu khoa học; thực hiện các dịch vụ về tư vấn, thiết kế, xây dựng chiếu sáng đô thị; nghiên cứu ứng dụng công nghệ mới trong chiếu sáng công cộng, trong quản lý, vận hành hệ thống chiếu sáng công cộng đô thị. \n\n2. Trách nhiệm của đơn vị quản lý, vận hành: \t\ta) Đảm bảo thực hiện đúng nhiệm vụ; các quy định về quản lý, vận hành đã cam kết trong hợp đồng; \t\tb) Báo cáo định kỳ tới chính quyền đô thị và cơ quan chuyên môn về quản lý, vận hành hệ thống chiếu sáng công cộng đô thị do mình được giao; \t\tc) Tổ chức triển khai thực hiện kế hoạch đầu tư phát triển chiếu sáng công cộng đô thị đã được phê duyệt; \t\td) Quản lý tài sản được đầu tư từ nguồn vốn ngân sách nhà nước theo hợp đồng ký kết với chính quyền đô thị; \t\tđ) Bảo vệ hệ thống chiếu sáng công cộng đô thị trên địa bàn được giao quản lý.',
|
460 |
+
]
|
461 |
+
embeddings = model.encode(sentences)
|
462 |
+
print(embeddings.shape)
|
463 |
+
# [3, 1024]
|
464 |
+
|
465 |
+
# Get the similarity scores for the embeddings
|
466 |
+
similarities = model.similarity(embeddings, embeddings)
|
467 |
+
print(similarities)
|
468 |
+
# tensor([[1.0000, 0.7233, 0.1076],
|
469 |
+
# [0.7233, 1.0000, 0.1383],
|
470 |
+
# [0.1076, 0.1383, 1.0000]])
|
471 |
+
```
|
472 |
+
|
473 |
+
<!--
|
474 |
+
### Direct Usage (Transformers)
|
475 |
+
|
476 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
477 |
+
|
478 |
+
</details>
|
479 |
+
-->
|
480 |
+
|
481 |
+
<!--
|
482 |
+
### Downstream Usage (Sentence Transformers)
|
483 |
+
|
484 |
+
You can finetune this model on your own dataset.
|
485 |
+
|
486 |
+
<details><summary>Click to expand</summary>
|
487 |
+
|
488 |
+
</details>
|
489 |
+
-->
|
490 |
+
|
491 |
+
<!--
|
492 |
+
### Out-of-Scope Use
|
493 |
+
|
494 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
495 |
+
-->
|
496 |
+
|
497 |
+
<!--
|
498 |
+
## Bias, Risks and Limitations
|
499 |
+
|
500 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
501 |
+
-->
|
502 |
+
|
503 |
+
<!--
|
504 |
+
### Recommendations
|
505 |
+
|
506 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
507 |
+
-->
|
508 |
+
|
509 |
+
## Training Details
|
510 |
+
|
511 |
+
### Training Dataset
|
512 |
+
|
513 |
+
#### Unnamed Dataset
|
514 |
+
|
515 |
+
* Size: 2,864 training samples
|
516 |
+
* Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
|
517 |
+
* Approximate statistics based on the first 1000 samples:
|
518 |
+
| | sentence_0 | sentence_1 | label |
|
519 |
+
|:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:--------------------------------------------------------------|
|
520 |
+
| type | string | string | float |
|
521 |
+
| details | <ul><li>min: 41 tokens</li><li>mean: 55.63 tokens</li><li>max: 87 tokens</li></ul> | <ul><li>min: 21 tokens</li><li>mean: 301.62 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 1.0</li><li>mean: 1.0</li><li>max: 1.0</li></ul> |
|
522 |
+
* Samples:
|
523 |
+
| sentence_0 | sentence_1 | label |
|
524 |
+
|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------|
|
525 |
+
| <code>Instruct: Với một truy vấn về luật Việt Nam, truy xuất các đoạn văn liên quan có chứa câu trả lời cho truy vấn đó.<br>Query: Quy định về bồi thường thiệt hại do hành vi dẫn nước mưa qua nhà hàng xóm gây ra ra sao?</code> | <code>1. Phạt tiền từ 2.000.000 đồng đến 3.000.000 đồng đối với một trong những hành vi sau đây: a) Trộm cắp tài sản, xâm nhập vào khu vực nhà ở, kho bãi hoặc địa điểm khác thuộc quản lý của người khác nhằm mục đích trộm cắp, chiếm đoạt tài sản; b) Công nhiên chiếm đoạt tài sản; c) Dùng thủ đoạn gian dối hoặc bỏ trốn để chiếm đoạt tài sản hoặc đến thời điểm trả lại tài sản do vay, mượn, thuê tài sản của người khác hoặc nhận được tài sản của người khác bằng hình thức hợp đồng, mặc dù có điều kiện, khả năng nhưng cố tình không trả; d) Không trả lại tài sản cho người khác do vay, mượn, thuê tài sản của người khác hoặc nhận được tài sản của người khác bằng hình thức hợp đồng nhưng sử dụng tài sản đó vào mục đích bất hợp pháp dẫn đến không có khả năng trả lại tài sản; đ) Thiếu trách nhiệm gây thiệt hại đến tài sản của Nhà nước, cơ quan, tổ chức, doanh nghiệp.<br><br>2. Phạt tiền từ 3.000.000 đồng đến 5.000.000 đồng đối với một trong những hành vi sau đây: a) Hủy hoại hoặc cố ý làm hư hỏng tài sản...</code> | <code>1.0</code> |
|
526 |
+
| <code>Instruct: Với một truy vấn về luật Việt Nam, truy xuất các đoạn văn liên quan có chứa câu trả lời cho truy vấn đó.<br>Query: Tôi muốn tìm hiểu một công chứng viên hướng dẫn tối đa bao nhiêu người tập sự hành nghề công chứng, công chứng viên hướng dẫn nhiều người tập sự có bị xử phạt không?</code> | <code>1. Phạt tiền từ 1.000.000 đồng đến 3.000.000 đồng đối với một trong các hành vi sau: a) Không đánh s�� thứ tự từng trang đối với văn bản công chứng có từ 02 trang trở lên; b) Công chứng hợp đồng, giao dịch trong trường hợp phiếu yêu cầu công chứng không đầy đủ nội dung theo quy định; c) Không mang theo thẻ công chứng viên khi hành nghề; d) Tham gia không đầy đủ nghĩa vụ bồi dưỡng nghiệp vụ công chứng hằng năm theo quy định.<br>2. Phạt tiền từ 3.000.000 đồng đến 7.000.000 đồng đối với một trong các hành vi sau: a) Công chứng ngoài trụ sở của tổ chức hành nghề công chứng không đúng quy định; b) Công chứng không đúng thời hạn quy định; c) Sửa lỗi kỹ thuật văn bản công chứng không đúng quy định; d) Sách nhiễu, gây khó khăn cho người yêu cầu công chứng; đ) Từ chối yêu cầu công chứng mà không có lý do chính đáng; e) Không dùng tiếng nói hoặc chữ viết là tiếng Việt; g) Không tham gia tổ chức xã hội - nghề nghiệp của công chứng viên; h) Hướng dẫn nhiều hơn 02 người tập sự tại cùng một ...</code> | <code>1.0</code> |
|
527 |
+
| <code>Instruct: Với một truy vấn về luật Việt Nam, truy xuất các đoạn văn liên quan có chứa câu trả lời cho truy vấn đó.<br>Query: Trách nhiệm của người nhận bảo lãnh Chính phủ ra sao?</code> | <code>1. Người cho vay (người nhận bảo lãnh) có trách nhiệm hợp tác chặt chẽ với Bộ Tài chính trong quá trình đàm phán Thư bảo lãnh.<br><br>2. Người nhận bảo lãnh có trách nhiệm hợp tác với Bộ Tài chính trong quá trình thực hiện khoản vay được Chính phủ bảo lãnh và trong thời gian Thư bảo lãnh có hiệu lực: a) Gửi cho Bộ Tài chính bản sao chi tiết thông báo từng khoản rút vốn, lãi suất biến động (nếu có), yêu cầu trả nợ cùng thời điểm gửi cho đối tượng được bảo lãnh; b) Gửi thông báo cho Bộ Tài chính về tình hình rút vốn, trả nợ và dự án của đối tượng được bảo lãnh ngay khi phát hiện bất kỳ vấn đề bất thường nào xảy ra; c) Gửi cho Bộ Tài chính các thông báo khác theo quy định của Thỏa thuận vay được Chính phủ bảo lãnh.<br><br>3. Người nhận bảo lãnh có trách nhiệm chia sẻ các thông tin cần thiết cho Bộ Tài chính về đối tượng được bảo lãnh, dự án và khoản vay được Chính phủ bảo lãnh, các báo cáo kiểm tra, giám sát trong phạm vi cho phép của mình để đảm bảo tiền vay được sử dụng đúng mục đích, đối tượng ...</code> | <code>1.0</code> |
|
528 |
+
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
529 |
+
```json
|
530 |
+
{
|
531 |
+
"scale": 20.0,
|
532 |
+
"similarity_fct": "cos_sim"
|
533 |
+
}
|
534 |
+
```
|
535 |
+
|
536 |
+
### Training Hyperparameters
|
537 |
+
#### Non-Default Hyperparameters
|
538 |
+
|
539 |
+
- `per_device_train_batch_size`: 36
|
540 |
+
- `per_device_eval_batch_size`: 36
|
541 |
+
- `num_train_epochs`: 20
|
542 |
+
- `fp16`: True
|
543 |
+
- `multi_dataset_batch_sampler`: round_robin
|
544 |
+
|
545 |
+
#### All Hyperparameters
|
546 |
+
<details><summary>Click to expand</summary>
|
547 |
+
|
548 |
+
- `overwrite_output_dir`: False
|
549 |
+
- `do_predict`: False
|
550 |
+
- `eval_strategy`: no
|
551 |
+
- `prediction_loss_only`: True
|
552 |
+
- `per_device_train_batch_size`: 36
|
553 |
+
- `per_device_eval_batch_size`: 36
|
554 |
+
- `per_gpu_train_batch_size`: None
|
555 |
+
- `per_gpu_eval_batch_size`: None
|
556 |
+
- `gradient_accumulation_steps`: 1
|
557 |
+
- `eval_accumulation_steps`: None
|
558 |
+
- `torch_empty_cache_steps`: None
|
559 |
+
- `learning_rate`: 5e-05
|
560 |
+
- `weight_decay`: 0.0
|
561 |
+
- `adam_beta1`: 0.9
|
562 |
+
- `adam_beta2`: 0.999
|
563 |
+
- `adam_epsilon`: 1e-08
|
564 |
+
- `max_grad_norm`: 1
|
565 |
+
- `num_train_epochs`: 20
|
566 |
+
- `max_steps`: -1
|
567 |
+
- `lr_scheduler_type`: linear
|
568 |
+
- `lr_scheduler_kwargs`: {}
|
569 |
+
- `warmup_ratio`: 0.0
|
570 |
+
- `warmup_steps`: 0
|
571 |
+
- `log_level`: passive
|
572 |
+
- `log_level_replica`: warning
|
573 |
+
- `log_on_each_node`: True
|
574 |
+
- `logging_nan_inf_filter`: True
|
575 |
+
- `save_safetensors`: True
|
576 |
+
- `save_on_each_node`: False
|
577 |
+
- `save_only_model`: False
|
578 |
+
- `restore_callback_states_from_checkpoint`: False
|
579 |
+
- `no_cuda`: False
|
580 |
+
- `use_cpu`: False
|
581 |
+
- `use_mps_device`: False
|
582 |
+
- `seed`: 42
|
583 |
+
- `data_seed`: None
|
584 |
+
- `jit_mode_eval`: False
|
585 |
+
- `use_ipex`: False
|
586 |
+
- `bf16`: False
|
587 |
+
- `fp16`: True
|
588 |
+
- `fp16_opt_level`: O1
|
589 |
+
- `half_precision_backend`: auto
|
590 |
+
- `bf16_full_eval`: False
|
591 |
+
- `fp16_full_eval`: False
|
592 |
+
- `tf32`: None
|
593 |
+
- `local_rank`: 0
|
594 |
+
- `ddp_backend`: None
|
595 |
+
- `tpu_num_cores`: None
|
596 |
+
- `tpu_metrics_debug`: False
|
597 |
+
- `debug`: []
|
598 |
+
- `dataloader_drop_last`: False
|
599 |
+
- `dataloader_num_workers`: 0
|
600 |
+
- `dataloader_prefetch_factor`: None
|
601 |
+
- `past_index`: -1
|
602 |
+
- `disable_tqdm`: False
|
603 |
+
- `remove_unused_columns`: True
|
604 |
+
- `label_names`: None
|
605 |
+
- `load_best_model_at_end`: False
|
606 |
+
- `ignore_data_skip`: False
|
607 |
+
- `fsdp`: []
|
608 |
+
- `fsdp_min_num_params`: 0
|
609 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
610 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
611 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
612 |
+
- `deepspeed`: None
|
613 |
+
- `label_smoothing_factor`: 0.0
|
614 |
+
- `optim`: adamw_torch
|
615 |
+
- `optim_args`: None
|
616 |
+
- `adafactor`: False
|
617 |
+
- `group_by_length`: False
|
618 |
+
- `length_column_name`: length
|
619 |
+
- `ddp_find_unused_parameters`: None
|
620 |
+
- `ddp_bucket_cap_mb`: None
|
621 |
+
- `ddp_broadcast_buffers`: False
|
622 |
+
- `dataloader_pin_memory`: True
|
623 |
+
- `dataloader_persistent_workers`: False
|
624 |
+
- `skip_memory_metrics`: True
|
625 |
+
- `use_legacy_prediction_loop`: False
|
626 |
+
- `push_to_hub`: False
|
627 |
+
- `resume_from_checkpoint`: None
|
628 |
+
- `hub_model_id`: None
|
629 |
+
- `hub_strategy`: every_save
|
630 |
+
- `hub_private_repo`: None
|
631 |
+
- `hub_always_push`: False
|
632 |
+
- `hub_revision`: None
|
633 |
+
- `gradient_checkpointing`: False
|
634 |
+
- `gradient_checkpointing_kwargs`: None
|
635 |
+
- `include_inputs_for_metrics`: False
|
636 |
+
- `include_for_metrics`: []
|
637 |
+
- `eval_do_concat_batches`: True
|
638 |
+
- `fp16_backend`: auto
|
639 |
+
- `push_to_hub_model_id`: None
|
640 |
+
- `push_to_hub_organization`: None
|
641 |
+
- `mp_parameters`:
|
642 |
+
- `auto_find_batch_size`: False
|
643 |
+
- `full_determinism`: False
|
644 |
+
- `torchdynamo`: None
|
645 |
+
- `ray_scope`: last
|
646 |
+
- `ddp_timeout`: 1800
|
647 |
+
- `torch_compile`: False
|
648 |
+
- `torch_compile_backend`: None
|
649 |
+
- `torch_compile_mode`: None
|
650 |
+
- `include_tokens_per_second`: False
|
651 |
+
- `include_num_input_tokens_seen`: False
|
652 |
+
- `neftune_noise_alpha`: None
|
653 |
+
- `optim_target_modules`: None
|
654 |
+
- `batch_eval_metrics`: False
|
655 |
+
- `eval_on_start`: False
|
656 |
+
- `use_liger_kernel`: False
|
657 |
+
- `liger_kernel_config`: None
|
658 |
+
- `eval_use_gather_object`: False
|
659 |
+
- `average_tokens_across_devices`: False
|
660 |
+
- `prompts`: None
|
661 |
+
- `batch_sampler`: batch_sampler
|
662 |
+
- `multi_dataset_batch_sampler`: round_robin
|
663 |
+
- `router_mapping`: {}
|
664 |
+
- `learning_rate_mapping`: {}
|
665 |
+
|
666 |
+
</details>
|
667 |
+
|
668 |
+
### Training Logs
|
669 |
+
| Epoch | Step | Training Loss |
|
670 |
+
|:-----:|:----:|:-------------:|
|
671 |
+
| 12.5 | 500 | 0.1151 |
|
672 |
+
|
673 |
+
|
674 |
+
### Framework Versions
|
675 |
+
- Python: 3.10.12
|
676 |
+
- Sentence Transformers: 5.0.0
|
677 |
+
- Transformers: 4.54.0
|
678 |
+
- PyTorch: 2.7.1+cu126
|
679 |
+
- Accelerate: 1.9.0
|
680 |
+
- Datasets: 4.0.0
|
681 |
+
- Tokenizers: 0.21.2
|
682 |
+
|
683 |
+
## Citation
|
684 |
+
|
685 |
+
### BibTeX
|
686 |
+
|
687 |
+
#### Sentence Transformers
|
688 |
+
```bibtex
|
689 |
+
@inproceedings{reimers-2019-sentence-bert,
|
690 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
691 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
692 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
693 |
+
month = "11",
|
694 |
+
year = "2019",
|
695 |
+
publisher = "Association for Computational Linguistics",
|
696 |
+
url = "https://arxiv.org/abs/1908.10084",
|
697 |
+
}
|
698 |
+
```
|
699 |
+
|
700 |
+
#### MultipleNegativesRankingLoss
|
701 |
+
```bibtex
|
702 |
+
@misc{henderson2017efficient,
|
703 |
+
title={Efficient Natural Language Response Suggestion for Smart Reply},
|
704 |
+
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
|
705 |
+
year={2017},
|
706 |
+
eprint={1705.00652},
|
707 |
+
archivePrefix={arXiv},
|
708 |
+
primaryClass={cs.CL}
|
709 |
+
}
|
710 |
+
```
|
711 |
+
|
712 |
+
<!--
|
713 |
+
## Glossary
|
714 |
+
|
715 |
+
*Clearly define terms in order to be accessible across audiences.*
|
716 |
+
-->
|
717 |
+
|
718 |
+
<!--
|
719 |
+
## Model Card Authors
|
720 |
+
|
721 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
722 |
+
-->
|
723 |
+
|
724 |
+
<!--
|
725 |
+
## Model Card Contact
|
726 |
+
|
727 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
728 |
+
-->
|
config.json
ADDED
@@ -0,0 +1,27 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"architectures": [
|
3 |
+
"XLMRobertaModel"
|
4 |
+
],
|
5 |
+
"attention_probs_dropout_prob": 0.1,
|
6 |
+
"bos_token_id": 0,
|
7 |
+
"classifier_dropout": null,
|
8 |
+
"eos_token_id": 2,
|
9 |
+
"hidden_act": "gelu",
|
10 |
+
"hidden_dropout_prob": 0.1,
|
11 |
+
"hidden_size": 1024,
|
12 |
+
"initializer_range": 0.02,
|
13 |
+
"intermediate_size": 4096,
|
14 |
+
"layer_norm_eps": 1e-05,
|
15 |
+
"max_position_embeddings": 514,
|
16 |
+
"model_type": "xlm-roberta",
|
17 |
+
"num_attention_heads": 16,
|
18 |
+
"num_hidden_layers": 24,
|
19 |
+
"output_past": true,
|
20 |
+
"pad_token_id": 1,
|
21 |
+
"position_embedding_type": "absolute",
|
22 |
+
"torch_dtype": "float32",
|
23 |
+
"transformers_version": "4.54.0",
|
24 |
+
"type_vocab_size": 1,
|
25 |
+
"use_cache": true,
|
26 |
+
"vocab_size": 250002
|
27 |
+
}
|
config_sentence_transformers.json
ADDED
@@ -0,0 +1,14 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"__version__": {
|
3 |
+
"sentence_transformers": "5.0.0",
|
4 |
+
"transformers": "4.54.0",
|
5 |
+
"pytorch": "2.7.1+cu126"
|
6 |
+
},
|
7 |
+
"model_type": "SentenceTransformer",
|
8 |
+
"prompts": {
|
9 |
+
"query": "",
|
10 |
+
"document": ""
|
11 |
+
},
|
12 |
+
"default_prompt_name": null,
|
13 |
+
"similarity_fn_name": "cosine"
|
14 |
+
}
|
model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:30f5414ce618952c1e4992654831b2d2201664c8887985842df727d1b46152cc
|
3 |
+
size 2239607176
|
modules.json
ADDED
@@ -0,0 +1,20 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"idx": 0,
|
4 |
+
"name": "0",
|
5 |
+
"path": "",
|
6 |
+
"type": "sentence_transformers.models.Transformer"
|
7 |
+
},
|
8 |
+
{
|
9 |
+
"idx": 1,
|
10 |
+
"name": "1",
|
11 |
+
"path": "1_Pooling",
|
12 |
+
"type": "sentence_transformers.models.Pooling"
|
13 |
+
},
|
14 |
+
{
|
15 |
+
"idx": 2,
|
16 |
+
"name": "2",
|
17 |
+
"path": "2_Normalize",
|
18 |
+
"type": "sentence_transformers.models.Normalize"
|
19 |
+
}
|
20 |
+
]
|
sentence_bert_config.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"max_seq_length": 512,
|
3 |
+
"do_lower_case": false
|
4 |
+
}
|
sentencepiece.bpe.model
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
|
3 |
+
size 5069051
|
special_tokens_map.json
ADDED
@@ -0,0 +1,51 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"bos_token": {
|
3 |
+
"content": "<s>",
|
4 |
+
"lstrip": false,
|
5 |
+
"normalized": false,
|
6 |
+
"rstrip": false,
|
7 |
+
"single_word": false
|
8 |
+
},
|
9 |
+
"cls_token": {
|
10 |
+
"content": "<s>",
|
11 |
+
"lstrip": false,
|
12 |
+
"normalized": false,
|
13 |
+
"rstrip": false,
|
14 |
+
"single_word": false
|
15 |
+
},
|
16 |
+
"eos_token": {
|
17 |
+
"content": "</s>",
|
18 |
+
"lstrip": false,
|
19 |
+
"normalized": false,
|
20 |
+
"rstrip": false,
|
21 |
+
"single_word": false
|
22 |
+
},
|
23 |
+
"mask_token": {
|
24 |
+
"content": "<mask>",
|
25 |
+
"lstrip": true,
|
26 |
+
"normalized": false,
|
27 |
+
"rstrip": false,
|
28 |
+
"single_word": false
|
29 |
+
},
|
30 |
+
"pad_token": {
|
31 |
+
"content": "<pad>",
|
32 |
+
"lstrip": false,
|
33 |
+
"normalized": false,
|
34 |
+
"rstrip": false,
|
35 |
+
"single_word": false
|
36 |
+
},
|
37 |
+
"sep_token": {
|
38 |
+
"content": "</s>",
|
39 |
+
"lstrip": false,
|
40 |
+
"normalized": false,
|
41 |
+
"rstrip": false,
|
42 |
+
"single_word": false
|
43 |
+
},
|
44 |
+
"unk_token": {
|
45 |
+
"content": "<unk>",
|
46 |
+
"lstrip": false,
|
47 |
+
"normalized": false,
|
48 |
+
"rstrip": false,
|
49 |
+
"single_word": false
|
50 |
+
}
|
51 |
+
}
|
tokenizer.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
|
3 |
+
size 17082987
|
tokenizer_config.json
ADDED
@@ -0,0 +1,56 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"added_tokens_decoder": {
|
3 |
+
"0": {
|
4 |
+
"content": "<s>",
|
5 |
+
"lstrip": false,
|
6 |
+
"normalized": false,
|
7 |
+
"rstrip": false,
|
8 |
+
"single_word": false,
|
9 |
+
"special": true
|
10 |
+
},
|
11 |
+
"1": {
|
12 |
+
"content": "<pad>",
|
13 |
+
"lstrip": false,
|
14 |
+
"normalized": false,
|
15 |
+
"rstrip": false,
|
16 |
+
"single_word": false,
|
17 |
+
"special": true
|
18 |
+
},
|
19 |
+
"2": {
|
20 |
+
"content": "</s>",
|
21 |
+
"lstrip": false,
|
22 |
+
"normalized": false,
|
23 |
+
"rstrip": false,
|
24 |
+
"single_word": false,
|
25 |
+
"special": true
|
26 |
+
},
|
27 |
+
"3": {
|
28 |
+
"content": "<unk>",
|
29 |
+
"lstrip": false,
|
30 |
+
"normalized": false,
|
31 |
+
"rstrip": false,
|
32 |
+
"single_word": false,
|
33 |
+
"special": true
|
34 |
+
},
|
35 |
+
"250001": {
|
36 |
+
"content": "<mask>",
|
37 |
+
"lstrip": true,
|
38 |
+
"normalized": false,
|
39 |
+
"rstrip": false,
|
40 |
+
"single_word": false,
|
41 |
+
"special": true
|
42 |
+
}
|
43 |
+
},
|
44 |
+
"additional_special_tokens": [],
|
45 |
+
"bos_token": "<s>",
|
46 |
+
"clean_up_tokenization_spaces": true,
|
47 |
+
"cls_token": "<s>",
|
48 |
+
"eos_token": "</s>",
|
49 |
+
"extra_special_tokens": {},
|
50 |
+
"mask_token": "<mask>",
|
51 |
+
"model_max_length": 512,
|
52 |
+
"pad_token": "<pad>",
|
53 |
+
"sep_token": "</s>",
|
54 |
+
"tokenizer_class": "XLMRobertaTokenizer",
|
55 |
+
"unk_token": "<unk>"
|
56 |
+
}
|