diegolacomba commited on
Commit
316b267
·
verified ·
1 Parent(s): 509867e

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,885 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:79908
8
+ - loss:CachedMultipleNegativesRankingLoss
9
+ base_model: intfloat/multilingual-e5-base
10
+ widget:
11
+ - source_sentence: 'query: ¿Qué fechas son relevantes para la presentación y el ingreso
12
+ de las retenciones practicadas en diferentes momentos del año fiscal?}**'
13
+ sentences:
14
+ - 'passage: (…).”.
15
+
16
+ En cuanto a las obligaciones formales del retenedor y del obligado a ingresar
17
+ a cuenta, estas se recogen en el artículo 108 del RIRPF, que en relación con la
18
+ presentación de declaraciones establece lo siguiente:
19
+
20
+ 1. “El sujeto obligado a retener y practicar ingresos a cuenta deberá presentar,
21
+ en los primeros veinte días naturales de los meses de abril, julio, octubre y
22
+ enero, declaración de las cantidades retenidas y de los ingresos a cuenta que
23
+ correspondan por el trimestre natural inmediato anterior, e ingresar su importe
24
+ en el Tesoro Público.
25
+
26
+ No obstante, la declaración e ingreso a que se refiere el párrafo anterior se
27
+ efectuará en los veinte primeros días naturales de cada mes, en relación con las
28
+ cantidades retenidas y los ingresos a cuenta que correspondan por el mes inmediato
29
+ anterior, cuando se trate de retenedores u obligados en los que concurran las
30
+ circunstancias a que se refieren los números 1.º y 2.º del apartado 3 del artículo
31
+ 71 del Reglamento del Impuesto sobre el Valor Añadido, aprobado por el Real Decreto
32
+ 1624/1992, de 29 de diciembre.
33
+
34
+ (…)
35
+
36
+ 2. El retenedor u obligado a ingresar a cuenta deberá presentar en los primeros
37
+ veinte días naturales del mes de enero una declaración anual de las retenciones
38
+ e ingresos a cuenta efectuados. No obstante, en el caso de que esta declaración
39
+ se presente en soporte directamente legible por ordenador o haya sido generado
40
+ mediante la utilización, exclusivamente, de los correspondientes módulos de impresión
41
+ desarrollados, a estos efectos, por la Administración tributaria, el plazo de
42
+ presentación será el comprendido entre el 1 de enero y el 31 de enero del año
43
+ siguiente al del que corresponde dicha declaración.
44
+
45
+ (…).”.
46
+
47
+ Por su parte, el artículo 78.1 del RIRPF dispone que “con carácter general, la
48
+ obligación de retener nacerá en el momento en que se satisfagan o abonen las rentas
49
+ correspondientes”.'
50
+ - 'passage: Descripción de hechos: La mercantil consultante dedicada a la producción
51
+ de energía eléctrica va a adquirir plantas fotovoltaicas en funcionamiento directamente
52
+ o vía ampliación de capital.
53
+
54
+
55
+ Cuestión planteada: Sujeción al Impuesto sobre el Valor Añadido de las operaciones.'
56
+ - 'passage: Descripción de hechos: La consultante es una asociación internacional
57
+ sin ánimo de lucro belga que va a organizar una feria farmacéutica donde las empresas
58
+ asistentes podrán exponer y promover la venta de sus productos.El evento incluye
59
+ una conferencia de carácter médico o científico con el objeto de atraer a más
60
+ visitantes a quien las empresas farmacéuticas presentaran sus productos.
61
+
62
+
63
+ Cuestión planteada: Tipo impositivo aplicable a los servicios prestados por la
64
+ entidad consultante a efectos del Impuesto sobre el Valor Añadido.'
65
+ - source_sentence: 'query: ¿Cómo puedo corregir una factura cuando se realiza la devolución
66
+ de productos o envases en una compra posterior?'
67
+ sentences:
68
+ - 'passage: Descripción de hechos: El Banco de España es una entidad de derecho
69
+ público que realiza una serie de funciones o actividades derivadas de la fabricación
70
+ y distribución de billetes de euro.
71
+
72
+ Los billetes de euro son fabricados mediante un sistema de producción descentralizado
73
+ (pool) que implica que distintos Bancos Centrales contribuirán conjuntamente a
74
+ la satisfacción de las necesidades de billetes euro de los Estados miembros que
75
+ han adoptado dicha moneda, compartiendo dicha función. No obstante, cada Banco
76
+ Central no se va a responsabilizar de la producción del total de las denominaciones
77
+ de euro, sino que se limitará a uno o dos de dichas denominaciones. Del total
78
+ de los billetes producidos, una parte se destinará a ser moneda de curso legal
79
+ en el Estado correspondiente a dicho Banco Central, mientras que el resto se distribuirá
80
+ a los demás Bancos Centrales para que éstos los pongan en circulación en sus respectivos
81
+ Estados.
82
+
83
+ En el sistema de intercambio de billetes entre Bancos Centrales no se va satisfacer
84
+ cantidad alguna, ya que está previsto que el importe de los intercambios de billetes
85
+ (en términos de coste de fabricación) sea equivalente.
86
+
87
+ En el marco de este sistema de fabricación, el Banco de España ha firmado un acuerdo
88
+ de cooperación con el Banco de Italia para garantizar que estos Bancos Centrales
89
+ puedan producir las cuotas asignadas por el Banco Central Europeo. De esta forma
90
+ cualquiera de los Bancos Centrales podrá aceptar pedidos del otro Banco Central
91
+ firmante para cubrir sus necesidades.
92
+
93
+
94
+ Cuestión planteada: Si el acuerdo de colaboración entre los dos Bancos Centrales
95
+ supone una actividad económica en el Impuesto sobre el Valor Añadido y si debe
96
+ emitir factura por la entrega de billetes de euro consecuencia de dicho acuerdo.'
97
+ - 'passage: No obstante, cuando la modificación de la base imponible sea consecuencia
98
+ de la devolución de mercancías o de envases y embalajes que se realicen con ocasión
99
+ de un posterior suministro que tenga el mismo destinatario y por la operación
100
+ en la que se entregaron se hubiese expedido factura, no será necesaria la expedición
101
+ de una factura rectificativa, sino que se podrá practicar la rectificación en
102
+ la factura que se expida por dicho suministro, restando el importe de las mercancías
103
+ o de los envases y embalajes devueltos del importe de dicha operación posterior.
104
+ La rectificación se podrá realizar de este modo siempre que el tipo impositivo
105
+ aplicable a todas las operaciones sea el mismo, con independencia de que su resultado
106
+ sea positivo o negativo.
107
+
108
+ 3. La expedición de la factura rectificativa deberá efectuarse tan pronto como
109
+ el obligado a expedirla tenga constancia de las circunstancias que, conforme a
110
+ los apartados anteriores, obligan a su expedición, siempre que no hubiesen transcurrido
111
+ cuatro años a partir del momento en que se devengó el Impuesto o, en su caso,
112
+ se produjeron las circunstancias a que se refiere el artículo 80 de la Ley del
113
+ Impuesto.
114
+
115
+ 4. La rectificación se realizará mediante la emisión de una nueva factura en la
116
+ que se haga constar los datos identificativos de la factura rectificada. Se podrá
117
+ efectuar la rectificación de varias facturas en un único documento de rectificación,
118
+ siempre que se identifiquen todas las facturas rectificadas. No obstante, cuando
119
+ la modificación de la base imponible tenga su origen en la concesión de descuentos
120
+ o bonificaciones por volumen de operaciones, así como en los demás casos en que
121
+ así se autorice por el Departamento de Gestión Tributaria de la Agencia Estatal
122
+ de Administración Tributaria, no será necesaria la identificación de las facturas,
123
+ bastando la determinación del período a que se refieren.
124
+
125
+ El Departamento de Gestión Tributaria de la Agencia Estatal de Administración
126
+ Tributaria podrá autorizar otros procedimientos de rectificación de facturas,
127
+ previa solicitud de los interesados, cuando quede justificado por las prácticas
128
+ comerciales o administrativas del sector de actividad de que se trate.
129
+
130
+ 5. La factura rectificativa deberá cumplir los requisitos que se establecen en
131
+ los artículos 6 ó 7, según proceda.'
132
+ - 'passage: 2º. Cuando el destinatario no sea un empresario o profesional actuando
133
+ como tal, siempre que los servicios se presten por un empresario o profesional
134
+ y la sede de su actividad económica o establecimiento permanente desde el que
135
+ los preste o, en su defecto, el lugar de su domicilio o residencia habitual, se
136
+ encuentre en el territorio de aplicación del Impuesto.”.
137
+
138
+ Por lo que se refiere a las reglas especiales, el artículo 70 de la Ley del Impuesto
139
+ establece en su apartado Uno.7º:
140
+
141
+ “Artículo 70. Lugar de realización de las prestaciones de servicios. Reglas especiales.
142
+
143
+ Uno. Se entenderán prestados en el territorio de aplicación del Impuesto los siguientes
144
+ servicios:
145
+
146
+ (…)
147
+
148
+ 7º. Los que se enuncian a continuación, cuando se presten materialmente en dicho
149
+ territorio y su destinatario no sea un empresario o profesional actuando como
150
+ tal:
151
+
152
+ (…)
153
+
154
+ c) Los servicios relacionados con manifestaciones culturales, artísticas, deportivas,
155
+ científicas, educativas, recreativas, juegos de azar o similares, como las ferias
156
+ y exposiciones, incluyendo los servicios de organización de los mismos y los demás
157
+ servicios accesorios a los anteriores.”.
158
+
159
+ De conformidad con los artículos expuestos anteriormente, los servicios relacionados
160
+ con la realización de un test genético, objeto de consulta, se entenderán realizados
161
+ en el territorio de aplicación del Impuesto cuando el destinatario sea un empresario
162
+ o profesional establecido en dicho territorio, o cuando el destinatario no sea
163
+ empresario o profesional y se presten materialmente en el mismo.
164
+
165
+ Por lo tanto, en el caso objeto de consulta, el servicio de realización de un
166
+ test genético se entiende prestado en todo caso en el territorio de aplicación
167
+ del Impuesto, sede del prestador del servicio, dado que los destinatarios son
168
+ particulares, quedando por tanto sujeto al Impuesto sobre el Valor Añadido.
169
+
170
+ 4.- Lo que comunico a Vd. con efectos vinculantes, conforme a lo dispuesto en
171
+ el apartado 1 del artículo 89 de la Ley 58/2003, de 17 de diciembre, General Tributaria.'
172
+ - source_sentence: 'query: ¿Qué criterios deben cumplirse para que una operación de
173
+ transferencia de participaciones esté exenta de ciertos impuestos?'
174
+ sentences:
175
+ - 'passage: En el supuesto planteado, el activo de la entidad B, cuyas participaciones
176
+ se transmiten, está integrado en más del 50% por inmuebles afectos a actividades
177
+ económicas, el arrendamiento de los mismos; además la entidad consultante no adquiriría
178
+ participaciones de la entidad B que no tuviera ya antes de la operación de manera
179
+ indirecta, a través de su participación del 100% en la sociedad A, por lo que
180
+ debe entenderse que no concurrirían los requisitos exigidos en al apartado 2 del
181
+ artículo 314 del Texto Refundido de la LMV para conformar el presupuesto de hecho
182
+ previsto en ninguno de los tres incisos –a), b) c)– de dicho apartado.
183
+
184
+ Por lo tanto, conforme a la información proporcionada por la entidad consultante
185
+ y sin tener en cuenta otras circunstancias no mencionadas y que pudieran tener
186
+ relevancia en la calificación de la operación objeto de consulta, en principio,
187
+ no será de aplicación la excepción a la exención prevista en el apartado 2 del
188
+ artículo 314 del Texto Refundido de la LMV en los supuestos planteados y, en consecuencia,
189
+ la transmisión de valores en cuestión quedará exenta del Impuesto del Impuesto
190
+ sobre el Valor Añadido o del Impuesto sobre Transmisiones Patrimoniales y Actos
191
+ Jurídicos Documentados, al que está sujeta.
192
+
193
+ Lo que comunico a Vd. con efectos vinculantes, conforme a lo dispuesto en el apartado
194
+ 1 del artículo 89 de la Ley 58/2003, de 17 de diciembre, General Tributaria.'
195
+ - 'passage: Asimismo, según doctrina reiterada de esta Dirección General, a efectos
196
+ de la exención prevista en el artículo 20.Uno.9º de la Ley 37/1992, tendrán la
197
+ consideración de centros educativos aquellas unidades económicas integradas por
198
+ un conjunto de medios materiales y humanos ordenados con carácter de permanencia
199
+ con la finalidad de prestar de manera continuada servicios de enseñanza.
200
+
201
+ A tales efectos, no es preciso que el centro educativo disponga de un local determinado
202
+ en el que se realice materialmente la actividad la enseñanza, siendo suficiente
203
+ con que cuente con un conjunto ordenado de medios materiales y humanos destinados
204
+ a la prestación del servicio de enseñanza.
205
+
206
+ b) Un requisito objetivo. Como ha señalado el Tribunal de Justicia, la enseñanza
207
+ es aquella actividad que supone la transmisión de conocimientos y de competencias
208
+ entre un profesor y los estudiantes, acompañada, además, de un conjunto de otros
209
+ elementos que incluyen los correspondientes a las relaciones que se establecen
210
+ entre profesores y estudiantes y los que componen el marco organizativo del centro
211
+ en el que se imparte la formación, siempre y cuando dichas actividades no revistan
212
+ un carácter meramente recreativo.
213
+
214
+ La exención no será aplicable, a los servicios de enseñanza que versen sobre materias
215
+ no incluidas en alguno de los planes de estudios de cualquiera de los niveles
216
+ o grados del sistema educativo español.
217
+
218
+ La competencia para determinar si las materias que son objeto de enseñanza por
219
+ un determinado centro educativo se encuentran o no incluidas en algún plan de
220
+ estudios del sistema educativo a efectos de la aplicación de la mencionada exención,
221
+ corresponde al Ministerio de Educación, Cultura y Deporte, o la Comunidad Autónoma
222
+ correspondiente.
223
+
224
+ De acuerdo con los antecedentes obrantes en este Centro Directivo, la enseñanza
225
+ de materias como violín, piano, guitarra, canto, coral, banda, viento y madera,
226
+ percusión, viento metal, danza española, sevillanas, música y movimiento, lenguaje
227
+ musical, pintura y manualidades, teatro y expresión, técnico de luz y sonido,
228
+ se encuentran en los planes de estudios del sistema educativo español. Por tanto,
229
+ los citados servicios educativos han de considerarse sujetos y exentos del Impuesto
230
+ sobre el Valor Añadido.'
231
+ - 'passage: Descripción de hechos: El consultante ha adquirido de su promotor una
232
+ vivienda que desde su construcción ha estado ofrecida en arrendamiento con opción
233
+ de compra sin que los arrendatarios ejercieran dicha opción.
234
+
235
+
236
+ Cuestión planteada: Tributación de la adquisición de la vivienda por el consultante
237
+ en el ámbito del Impuesto sobre el Valor Añadido.'
238
+ - source_sentence: 'query: ¿Cuál es la incidencia del Impuesto sobre el Valor Añadido
239
+ cuando un ayuntamiento recibe bienes en pago de una deuda?'
240
+ sentences:
241
+ - 'passage: Descripción de hechos: Operaciones realizadas por las Comunidades de
242
+ Regantes.
243
+
244
+
245
+ Cuestión planteada: Sujeción al IVA. Deducibilidad de las cuotas soportadas.'
246
+ - 'passage: Descripción de hechos: El consultante es un Ayuntamiento que va a recibir
247
+ de una empresa municipal parcelas urbanizadas en pago de una deuda que tiene contraída
248
+ con dicho Ayuntamiento por los pagos que el mismo ha realizado en su nombre por
249
+ gastos corrientes de la sociedad tales como nóminas o préstamos.
250
+
251
+
252
+ Cuestión planteada: Tributación de la operación a efectos del Impuesto sobre el
253
+ Valor Añadido.'
254
+ - 'passage: Descripción de hechos: El Ayuntamiento consultante gestiona una piscina
255
+ y un complejo deportivo municipal mediante el cobro de un precio público.
256
+
257
+
258
+ Cuestión planteada: - Sujeción y, en su caso, exención de la operación en el ámbito
259
+ del IVA.'
260
+ - source_sentence: 'query: ¿En qué casos las actividades hípicas se consideran prestaciones
261
+ independientes que no están sujetas al impuesto en territorio español?'
262
+ sentences:
263
+ - 'passage: La consultante es la titular de la plataforma donde se desarrolla los
264
+ juegos en línea y es la creadora de las soluciones de juego generadas por números
265
+ aleatorios si bien es importante destacar que su actividad se limita a proporcionar
266
+ a los operadores de juego los medios tecnológicos para que estos operen en la
267
+ actividad de juego en línea de forma que no tiene responsabilidad alguna frente
268
+ a los usuarios/jugadores ni las apuestas efectuados por los mismos.
269
+
270
+ La entidad consultante, en definitiva, no tiene como interlocutor al usuario/jugador
271
+ sino al operador del juego en línea que contrata sus servicios tecnológicos y/o
272
+ de software. Los usuarios/jugadores realizan la apuesta a través de la propia
273
+ web del operador de juego el cual se servirá del software o medios tecnológicos
274
+ proporcionados por la consultante.
275
+
276
+ Del escrito de consulta parece deducirse que la consultante se estaría planteando
277
+ la grabación en sus estudios y la retransmisión de los eventos de juego en vivo
278
+ a dos entidades del mismo grupo (denominados servicios de distribución cinematográfica
279
+ y de videos), las cuales serían las que prestarían los servicios de casino en
280
+ vivo a los operadores de juego o bien a prestar directamente dichos servicios
281
+ a los citados operadores.
282
+
283
+ De acuerdo con lo anterior, los servicios objeto de consulta se entienden realizados
284
+ en el territorio de aplicación del Impuesto y estarán sujetos al Impuesto sobre
285
+ el Valor Añadido cuando el destinatario del servicio sea un empresario o profesional
286
+ actuando como tal y tenga en dicho ámbito espacial la sede de actividad económica
287
+ o cuente en el mismo con un establecimiento permanente o, en su defecto, su residencia
288
+ o domicilio habitual siempre que los servicios en cuestión tengan por destinatarios
289
+ a esa sede, establecimiento o domicilio.
290
+
291
+ En consecuencia con todo lo anterior, los servicios prestados por la consultante
292
+ en el primer escenario descrito a las otras dos entidades del grupo (servicios
293
+ de distribución cinematográfica y de video), establecidas en otros Estados Miembros,
294
+ no estarán sujetas al Impuesto sobre el Valor Añadido.
295
+
296
+ De acuerdo con las reglas armonizadas sobre el lugar de realización será, en su
297
+ caso, los Estados Miembro en los que estén establecidas dichas entidades el lugar
298
+ en que se deban entender localizadas las prestaciones de servicios objeto de consulta.'
299
+ - 'passage: Contestación completa: 1.- De acuerdo con lo establecido en el artículo
300
+ 4, apartado uno de la Ley 37/1992, de 28 de diciembre, del Impuesto sobre el Valor
301
+ Añadido (BOE de 29 de diciembre), están sujetas al citado tributo las entregas
302
+ de bienes y prestaciones de servicios realizadas en el ámbito espacial del Impuesto
303
+ por empresarios o profesionales, a título oneroso con carácter habitual u ocasional,
304
+ en el desarrollo de su actividad empresarial o profesional.
305
+
306
+ Por otro lado, el artículo 5, apartado uno, letra a) de la citada Ley, declara
307
+ que a efectos de la misma, se reputarán empresarios o profesionales las personas
308
+ o entidades que realicen las actividades empresariales o profesionales definidas
309
+ en el apartado siguiente de este artículo.
310
+
311
+ Según el apartado dos de dicho artículo 5 "son actividades empresariales o profesionales
312
+ las que impliquen la ordenación por cuenta propia de factores de producción materiales
313
+ y humanos o de uno de ellos, con la finalidad de intervenir en la producción o
314
+ distribución de bienes o servicios.
315
+
316
+ En particular, tienen esta consideración las actividades extractivas, de fabricación,
317
+ comercio y prestación de servicios, incluidas las de artesanía, agrícolas, forestales,
318
+ ganaderas, pesqueras, de construcción, mineras y el ejercicio de profesiones liberales
319
+ y artísticas.".
320
+
321
+ De acuerdo con el artículo 11 de la Ley 37/1992:
322
+
323
+ “Uno. A los efectos del Impuesto sobre el Valor Añadido, se entenderá por prestación
324
+ de servicios toda operación sujeta al citado tributo que, de acuerdo con esta
325
+ Ley, no tenga la consideración de entrega, adquisición intracomunitaria o importación
326
+ de bienes.
327
+
328
+ Dos. En particular, se considerarán prestaciones de servicios:
329
+
330
+ 1. º El ejercicio independiente de una profesión, arte u oficio.
331
+
332
+ (…).”.
333
+
334
+ 2.- Por su parte, el artículo 90, apartado uno de la Ley 37/1992, dispone que
335
+ el Impuesto se exigirá al tipo del 21 por ciento, salvo lo dispuesto en el artículo
336
+ siguiente.
337
+
338
+ El artículo 91, apartado uno.2, número 7º de la Ley del Impuesto, dispone que
339
+ se aplicará el tipo reducido del 10 por ciento a:'
340
+ - 'passage: Dicha regla también sería de aplicación a las actividades hípicas si
341
+ tuviesen la consideración de prestaciones accesorias a las de alojamiento, en
342
+ los términos expuestos en el apartado anterior de la presente contestación.
343
+
344
+ Por el contrario, si los servicios de actividades hípicas prestadas a quien tiene
345
+ la condición de empresario o profesional a efectos del Impuesto, tuvieran la consideración
346
+ de prestaciones independientes de los servicios de alojamiento en los términos
347
+ expuestos en el apartado anterior de la presente contestación, los mismos no se
348
+ entenderían realizados en el territorio de aplicación del Impuesto, en virtud
349
+ de lo dispuesto en el artículo 69.Uno.1º de la Ley del Impuesto, transcrito anteriormente,
350
+ y, por lo tanto, no se encontrarán sujetos al Impuesto sobre el Valor Añadido.
351
+
352
+ 4.- Por otra parte, se informa de que, en relación con las dudas suscitadas sobre
353
+ el lugar de realización de los hechos imponibles, entrega de bienes y prestaciones
354
+ de servicios, la Agencia Estatal de Administración Tributaria ha incorporado en
355
+ los portales del Impuesto sobre el Valor Añadido (IVA) y Suministro Inmediato
356
+ de Información del IVA (SII) un nuevo servicio de ayuda e información al contribuyente
357
+ denominado “Localizador”, creado para resolver las principales dudas planteadas
358
+ cuando el empresario o profesional realiza este tipo de operaciones con clientes
359
+ o proveedores no establecidos en el territorio de aplicación del Impuesto.
360
+
361
+ En concreto, esta herramienta permite conocer el lugar de realización de las entregas
362
+ de bienes, distinguiendo entre entregas interiores, intracomunitarias y con destino
363
+ a terceros países.
364
+
365
+ En concreto, puede obtenerse información sobre donde se localiza la entrega de
366
+ un bien, si está sujeta o exenta del Impuesto sobre el Valor Añadido, quién debe
367
+ declarar el Impuesto devengado en la operación o cómo se declara en caso de no
368
+ estar sujeta o exenta en el territorio de aplicación del impuesto español; también
369
+ indicará si en la factura se debe o no repercutir dicho impuesto.'
370
+ pipeline_tag: sentence-similarity
371
+ library_name: sentence-transformers
372
+ metrics:
373
+ - cosine_accuracy@1
374
+ - cosine_accuracy@3
375
+ - cosine_accuracy@5
376
+ - cosine_accuracy@10
377
+ - cosine_precision@1
378
+ - cosine_precision@3
379
+ - cosine_precision@5
380
+ - cosine_precision@10
381
+ - cosine_recall@1
382
+ - cosine_recall@3
383
+ - cosine_recall@5
384
+ - cosine_recall@10
385
+ - cosine_ndcg@10
386
+ - cosine_mrr@10
387
+ - cosine_map@100
388
+ model-index:
389
+ - name: SentenceTransformer based on intfloat/multilingual-e5-base
390
+ results:
391
+ - task:
392
+ type: information-retrieval
393
+ name: Information Retrieval
394
+ dataset:
395
+ name: InformationRetrievalEvaluator
396
+ type: InformationRetrievalEvaluator
397
+ metrics:
398
+ - type: cosine_accuracy@1
399
+ value: 0.15661004869937048
400
+ name: Cosine Accuracy@1
401
+ - type: cosine_accuracy@3
402
+ value: 0.2550184107376173
403
+ name: Cosine Accuracy@3
404
+ - type: cosine_accuracy@5
405
+ value: 0.3124480342083383
406
+ name: Cosine Accuracy@5
407
+ - type: cosine_accuracy@10
408
+ value: 0.39202993229599714
409
+ name: Cosine Accuracy@10
410
+ - type: cosine_precision@1
411
+ value: 0.15661004869937048
412
+ name: Cosine Precision@1
413
+ - type: cosine_precision@3
414
+ value: 0.0850061369125391
415
+ name: Cosine Precision@3
416
+ - type: cosine_precision@5
417
+ value: 0.06248960684166765
418
+ name: Cosine Precision@5
419
+ - type: cosine_precision@10
420
+ value: 0.03920299322959972
421
+ name: Cosine Precision@10
422
+ - type: cosine_recall@1
423
+ value: 0.15661004869937048
424
+ name: Cosine Recall@1
425
+ - type: cosine_recall@3
426
+ value: 0.2550184107376173
427
+ name: Cosine Recall@3
428
+ - type: cosine_recall@5
429
+ value: 0.3124480342083383
430
+ name: Cosine Recall@5
431
+ - type: cosine_recall@10
432
+ value: 0.39202993229599714
433
+ name: Cosine Recall@10
434
+ - type: cosine_ndcg@10
435
+ value: 0.26297302684726426
436
+ name: Cosine Ndcg@10
437
+ - type: cosine_mrr@10
438
+ value: 0.22306046225751733
439
+ name: Cosine Mrr@10
440
+ - type: cosine_map@100
441
+ value: 0.23387197808644317
442
+ name: Cosine Map@100
443
+ - type: cosine_accuracy@1
444
+ value: 0.3319871718731441
445
+ name: Cosine Accuracy@1
446
+ - type: cosine_accuracy@3
447
+ value: 0.4964960209050956
448
+ name: Cosine Accuracy@3
449
+ - type: cosine_accuracy@5
450
+ value: 0.5702577503266422
451
+ name: Cosine Accuracy@5
452
+ - type: cosine_accuracy@10
453
+ value: 0.6671219859840836
454
+ name: Cosine Accuracy@10
455
+ - type: cosine_precision@1
456
+ value: 0.3319871718731441
457
+ name: Cosine Precision@1
458
+ - type: cosine_precision@3
459
+ value: 0.16549867363503187
460
+ name: Cosine Precision@3
461
+ - type: cosine_precision@5
462
+ value: 0.11405155006532841
463
+ name: Cosine Precision@5
464
+ - type: cosine_precision@10
465
+ value: 0.06671219859840836
466
+ name: Cosine Precision@10
467
+ - type: cosine_recall@1
468
+ value: 0.3319871718731441
469
+ name: Cosine Recall@1
470
+ - type: cosine_recall@3
471
+ value: 0.4964960209050956
472
+ name: Cosine Recall@3
473
+ - type: cosine_recall@5
474
+ value: 0.5702577503266422
475
+ name: Cosine Recall@5
476
+ - type: cosine_recall@10
477
+ value: 0.6671219859840836
478
+ name: Cosine Recall@10
479
+ - type: cosine_ndcg@10
480
+ value: 0.48953409752100663
481
+ name: Cosine Ndcg@10
482
+ - type: cosine_mrr@10
483
+ value: 0.43386128692280884
484
+ name: Cosine Mrr@10
485
+ - type: cosine_map@100
486
+ value: 0.44413992509148276
487
+ name: Cosine Map@100
488
+ ---
489
+
490
+ # SentenceTransformer based on intfloat/multilingual-e5-base
491
+
492
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
493
+
494
+ ## Model Details
495
+
496
+ ### Model Description
497
+ - **Model Type:** Sentence Transformer
498
+ - **Base model:** [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) <!-- at revision 835193815a3936a24a0ee7dc9e3d48c1fbb19c55 -->
499
+ - **Maximum Sequence Length:** 512 tokens
500
+ - **Output Dimensionality:** 768 dimensions
501
+ - **Similarity Function:** Cosine Similarity
502
+ <!-- - **Training Dataset:** Unknown -->
503
+ <!-- - **Language:** Unknown -->
504
+ <!-- - **License:** Unknown -->
505
+
506
+ ### Model Sources
507
+
508
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
509
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
510
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
511
+
512
+ ### Full Model Architecture
513
+
514
+ ```
515
+ SentenceTransformer(
516
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
517
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
518
+ (2): Normalize()
519
+ )
520
+ ```
521
+
522
+ ## Usage
523
+
524
+ ### Direct Usage (Sentence Transformers)
525
+
526
+ First install the Sentence Transformers library:
527
+
528
+ ```bash
529
+ pip install -U sentence-transformers
530
+ ```
531
+
532
+ Then you can load this model and run inference.
533
+ ```python
534
+ from sentence_transformers import SentenceTransformer
535
+
536
+ # Download from the 🤗 Hub
537
+ model = SentenceTransformer("diegolacomba/multilingual-e5-base-legal-cmnrl-1")
538
+ # Run inference
539
+ sentences = [
540
+ 'query: ¿En qué casos las actividades hípicas se consideran prestaciones independientes que no están sujetas al impuesto en territorio español?',
541
+ 'passage: Dicha regla también sería de aplicación a las actividades hípicas si tuviesen la consideración de prestaciones accesorias a las de alojamiento, en los términos expuestos en el apartado anterior de la presente contestación.\nPor el contrario, si los servicios de actividades hípicas prestadas a quien tiene la condición de empresario o profesional a efectos del Impuesto, tuvieran la consideración de prestaciones independientes de los servicios de alojamiento en los términos expuestos en el apartado anterior de la presente contestación, los mismos no se entenderían realizados en el territorio de aplicación del Impuesto, en virtud de lo dispuesto en el artículo 69.Uno.1º de la Ley del Impuesto, transcrito anteriormente, y, por lo tanto, no se encontrarán sujetos al Impuesto sobre el Valor Añadido.\n4.- Por otra parte, se informa de que, en relación con las dudas suscitadas sobre el lugar de realización de los hechos imponibles, entrega de bienes y prestaciones de servicios, la Agencia Estatal de Administración Tributaria ha incorporado en los portales del Impuesto sobre el Valor Añadido (IVA) y Suministro Inmediato de Información del IVA (SII) un nuevo servicio de ayuda e información al contribuyente denominado “Localizador”, creado para resolver las principales dudas planteadas cuando el empresario o profesional realiza este tipo de operaciones con clientes o proveedores no establecidos en el territorio de aplicación del Impuesto.\nEn concreto, esta herramienta permite conocer el lugar de realización de las entregas de bienes, distinguiendo entre entregas interiores, intracomunitarias y con destino a terceros países.\nEn concreto, puede obtenerse información sobre donde se localiza la entrega de un bien, si está sujeta o exenta del Impuesto sobre el Valor Añadido, quién debe declarar el Impuesto devengado en la operación o cómo se declara en caso de no estar sujeta o exenta en el territorio de aplicación del impuesto español; también indicará si en la factura se debe o no repercutir dicho impuesto.',
542
+ 'passage: La consultante es la titular de la plataforma donde se desarrolla los juegos en línea y es la creadora de las soluciones de juego generadas por números aleatorios si bien es importante destacar que su actividad se limita a proporcionar a los operadores de juego los medios tecnológicos para que estos operen en la actividad de juego en línea de forma que no tiene responsabilidad alguna frente a los usuarios/jugadores ni las apuestas efectuados por los mismos.\nLa entidad consultante, en definitiva, no tiene como interlocutor al usuario/jugador sino al operador del juego en línea que contrata sus servicios tecnológicos y/o de software. Los usuarios/jugadores realizan la apuesta a través de la propia web del operador de juego el cual se servirá del software o medios tecnológicos proporcionados por la consultante.\nDel escrito de consulta parece deducirse que la consultante se estaría planteando la grabación en sus estudios y la retransmisión de los eventos de juego en vivo a dos entidades del mismo grupo (denominados servicios de distribución cinematográfica y de videos), las cuales serían las que prestarían los servicios de casino en vivo a los operadores de juego o bien a prestar directamente dichos servicios a los citados operadores.\nDe acuerdo con lo anterior, los servicios objeto de consulta se entienden realizados en el territorio de aplicación del Impuesto y estarán sujetos al Impuesto sobre el Valor Añadido cuando el destinatario del servicio sea un empresario o profesional actuando como tal y tenga en dicho ámbito espacial la sede de actividad económica o cuente en el mismo con un establecimiento permanente o, en su defecto, su residencia o domicilio habitual siempre que los servicios en cuestión tengan por destinatarios a esa sede, establecimiento o domicilio.\nEn consecuencia con todo lo anterior, los servicios prestados por la consultante en el primer escenario descrito a las otras dos entidades del grupo (servicios de distribución cinematográfica y de video), establecidas en otros Estados Miembros, no estarán sujetas al Impuesto sobre el Valor Añadido.\nDe acuerdo con las reglas armonizadas sobre el lugar de realización será, en su caso, los Estados Miembro en los que estén establecidas dichas entidades el lugar en que se deban entender localizadas las prestaciones de servicios objeto de consulta.',
543
+ ]
544
+ embeddings = model.encode(sentences)
545
+ print(embeddings.shape)
546
+ # [3, 768]
547
+
548
+ # Get the similarity scores for the embeddings
549
+ similarities = model.similarity(embeddings, embeddings)
550
+ print(similarities.shape)
551
+ # [3, 3]
552
+ ```
553
+
554
+ <!--
555
+ ### Direct Usage (Transformers)
556
+
557
+ <details><summary>Click to see the direct usage in Transformers</summary>
558
+
559
+ </details>
560
+ -->
561
+
562
+ <!--
563
+ ### Downstream Usage (Sentence Transformers)
564
+
565
+ You can finetune this model on your own dataset.
566
+
567
+ <details><summary>Click to expand</summary>
568
+
569
+ </details>
570
+ -->
571
+
572
+ <!--
573
+ ### Out-of-Scope Use
574
+
575
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
576
+ -->
577
+
578
+ ## Evaluation
579
+
580
+ ### Metrics
581
+
582
+ #### Information Retrieval
583
+
584
+ * Dataset: `InformationRetrievalEvaluator`
585
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
586
+
587
+ | Metric | Value |
588
+ |:--------------------|:----------|
589
+ | cosine_accuracy@1 | 0.1566 |
590
+ | cosine_accuracy@3 | 0.255 |
591
+ | cosine_accuracy@5 | 0.3124 |
592
+ | cosine_accuracy@10 | 0.392 |
593
+ | cosine_precision@1 | 0.1566 |
594
+ | cosine_precision@3 | 0.085 |
595
+ | cosine_precision@5 | 0.0625 |
596
+ | cosine_precision@10 | 0.0392 |
597
+ | cosine_recall@1 | 0.1566 |
598
+ | cosine_recall@3 | 0.255 |
599
+ | cosine_recall@5 | 0.3124 |
600
+ | cosine_recall@10 | 0.392 |
601
+ | **cosine_ndcg@10** | **0.263** |
602
+ | cosine_mrr@10 | 0.2231 |
603
+ | cosine_map@100 | 0.2339 |
604
+
605
+ #### Information Retrieval
606
+
607
+ * Dataset: `InformationRetrievalEvaluator`
608
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
609
+
610
+ | Metric | Value |
611
+ |:--------------------|:-----------|
612
+ | cosine_accuracy@1 | 0.332 |
613
+ | cosine_accuracy@3 | 0.4965 |
614
+ | cosine_accuracy@5 | 0.5703 |
615
+ | cosine_accuracy@10 | 0.6671 |
616
+ | cosine_precision@1 | 0.332 |
617
+ | cosine_precision@3 | 0.1655 |
618
+ | cosine_precision@5 | 0.1141 |
619
+ | cosine_precision@10 | 0.0667 |
620
+ | cosine_recall@1 | 0.332 |
621
+ | cosine_recall@3 | 0.4965 |
622
+ | cosine_recall@5 | 0.5703 |
623
+ | cosine_recall@10 | 0.6671 |
624
+ | **cosine_ndcg@10** | **0.4895** |
625
+ | cosine_mrr@10 | 0.4339 |
626
+ | cosine_map@100 | 0.4441 |
627
+
628
+ <!--
629
+ ## Bias, Risks and Limitations
630
+
631
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
632
+ -->
633
+
634
+ <!--
635
+ ### Recommendations
636
+
637
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
638
+ -->
639
+
640
+ ## Training Details
641
+
642
+ ### Training Dataset
643
+
644
+ #### Unnamed Dataset
645
+
646
+ * Size: 79,908 training samples
647
+ * Columns: <code>anchor</code> and <code>positive</code>
648
+ * Approximate statistics based on the first 1000 samples:
649
+ | | anchor | positive |
650
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
651
+ | type | string | string |
652
+ | details | <ul><li>min: 19 tokens</li><li>mean: 30.77 tokens</li><li>max: 48 tokens</li></ul> | <ul><li>min: 17 tokens</li><li>mean: 342.89 tokens</li><li>max: 502 tokens</li></ul> |
653
+ * Samples:
654
+ | anchor | positive |
655
+ |:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
656
+ | <code>query: ¿Cómo se determina si una persona con discapacidad califica para beneficios fiscales en la compra de ciertos dispositivos médicos según la normativa vigente?</code> | <code>passage: 3.- Por otro lado, el artículo 91, apartado dos.1, número 5º de la citada Ley 37/1992, establece que se aplicará el tipo impositivo del 4 por ciento a las entregas, adquisiciones intracomunitarias e importaciones de prótesis, ortesis e implantes internos para personas con discapacidad.<br>A tal efecto, el último párrafo del número 4º del mencionado artículo 91, apartado dos.1 de dicha Ley, declara lo siguiente:<br>"A efectos de este apartado dos, se considerarán personas con discapacidad aquellas con un grado de discapacidad igual o superior al 33 por ciento. El grado de discapacidad deberá acreditarse mediante certificación o resolución expedida por el Instituto de Mayores y Servicios Sociales o el órgano competente de la comunidad autónoma.".<br>En relación con la aplicación del tipo impositivo del 4 por ciento en las entregas de gafas graduadas a personas con una discapacidad igual o superior al 33 por ciento, es criterio de este Centro directivo, entre otras, en la contestación vin...</code> |
657
+ | <code>query: ¿Qué aspectos deben considerarse al evaluar la caución establecida en la legislación del IVA?</code> | <code>passage: Descripción de hechos: La sociedad consultante con sede en el Reino Unido tiene como actividad el desarrollo de soluciones de software para empresas. La consultante dispone de una sucursal en el territorio español de aplicación del Impuesto. La sucursal no lleva a cabo actividades de venta, ni realiza entregas de bienes ni prestaciones de servicios en España. La sociedad consultante solicita devolución del impuesto soportado por el procedimiento de los artículos 119 y 119 bis de la Ley del Impuesto.<br><br>Cuestión planteada: Determinación del importe y naturaleza de la caución contemplada en el artículo 119 bis de la Ley del Impuesto sobre el Valor Añadido.</code> |
658
+ | <code>query: ¿Cómo afecta una redistribución de participaciones en una comunidad de bienes a la tributación de actos jurídicos?</code> | <code>passage: Si la Comunidad Autónoma no hubiese aprobado el tipo a que se refiere el párrafo anterior, se aplicará el 0,50 por 100, en cuanto a tales actos o contratos.”.<br>De acuerdo con el artículo 2.1 transcrito, para determinar la tributación correspondiente al supuesto planteado, debe analizarse en primer lugar la naturaleza jurídica de la operación que se pretende realizar. De la aplicación de los anteriores preceptos a los hechos expuestos se deriva claramente que la operación que se pretende llevar acabo no supone una disolución de la comunidad de bienes- que claramente se mantiene en los tres inmuebles que van a continuar en común- produciéndose, en todo caso, lo a veces se denomina una “disolución parcial”, pero que realmente no es una disolución o, en cualquier caso, no lo es a efectos del Impuesto sobre Transmisiones Patrimoniales y Actos Jurídicos Documentados. La operación que van a realizar consiste en una redistribución de las participaciones de los comuneros que antes osten...</code> |
659
+ * Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
660
+ ```json
661
+ {
662
+ "scale": 20.0,
663
+ "similarity_fct": "cos_sim",
664
+ "mini_batch_size": 32
665
+ }
666
+ ```
667
+
668
+ ### Training Hyperparameters
669
+ #### Non-Default Hyperparameters
670
+
671
+ - `eval_strategy`: steps
672
+ - `per_device_train_batch_size`: 128
673
+ - `per_device_eval_batch_size`: 32
674
+ - `gradient_accumulation_steps`: 4
675
+ - `learning_rate`: 3e-05
676
+ - `num_train_epochs`: 12
677
+ - `lr_scheduler_type`: cosine
678
+ - `warmup_ratio`: 0.1
679
+ - `fp16`: True
680
+ - `tf32`: True
681
+ - `load_best_model_at_end`: True
682
+ - `optim`: adamw_torch_fused
683
+ - `batch_sampler`: no_duplicates
684
+
685
+ #### All Hyperparameters
686
+ <details><summary>Click to expand</summary>
687
+
688
+ - `overwrite_output_dir`: False
689
+ - `do_predict`: False
690
+ - `eval_strategy`: steps
691
+ - `prediction_loss_only`: True
692
+ - `per_device_train_batch_size`: 128
693
+ - `per_device_eval_batch_size`: 32
694
+ - `per_gpu_train_batch_size`: None
695
+ - `per_gpu_eval_batch_size`: None
696
+ - `gradient_accumulation_steps`: 4
697
+ - `eval_accumulation_steps`: None
698
+ - `torch_empty_cache_steps`: None
699
+ - `learning_rate`: 3e-05
700
+ - `weight_decay`: 0.0
701
+ - `adam_beta1`: 0.9
702
+ - `adam_beta2`: 0.999
703
+ - `adam_epsilon`: 1e-08
704
+ - `max_grad_norm`: 1.0
705
+ - `num_train_epochs`: 12
706
+ - `max_steps`: -1
707
+ - `lr_scheduler_type`: cosine
708
+ - `lr_scheduler_kwargs`: {}
709
+ - `warmup_ratio`: 0.1
710
+ - `warmup_steps`: 0
711
+ - `log_level`: passive
712
+ - `log_level_replica`: warning
713
+ - `log_on_each_node`: True
714
+ - `logging_nan_inf_filter`: True
715
+ - `save_safetensors`: True
716
+ - `save_on_each_node`: False
717
+ - `save_only_model`: False
718
+ - `restore_callback_states_from_checkpoint`: False
719
+ - `no_cuda`: False
720
+ - `use_cpu`: False
721
+ - `use_mps_device`: False
722
+ - `seed`: 42
723
+ - `data_seed`: None
724
+ - `jit_mode_eval`: False
725
+ - `use_ipex`: False
726
+ - `bf16`: False
727
+ - `fp16`: True
728
+ - `fp16_opt_level`: O1
729
+ - `half_precision_backend`: auto
730
+ - `bf16_full_eval`: False
731
+ - `fp16_full_eval`: False
732
+ - `tf32`: True
733
+ - `local_rank`: 0
734
+ - `ddp_backend`: None
735
+ - `tpu_num_cores`: None
736
+ - `tpu_metrics_debug`: False
737
+ - `debug`: []
738
+ - `dataloader_drop_last`: False
739
+ - `dataloader_num_workers`: 0
740
+ - `dataloader_prefetch_factor`: None
741
+ - `past_index`: -1
742
+ - `disable_tqdm`: False
743
+ - `remove_unused_columns`: True
744
+ - `label_names`: None
745
+ - `load_best_model_at_end`: True
746
+ - `ignore_data_skip`: False
747
+ - `fsdp`: []
748
+ - `fsdp_min_num_params`: 0
749
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
750
+ - `fsdp_transformer_layer_cls_to_wrap`: None
751
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
752
+ - `deepspeed`: None
753
+ - `label_smoothing_factor`: 0.0
754
+ - `optim`: adamw_torch_fused
755
+ - `optim_args`: None
756
+ - `adafactor`: False
757
+ - `group_by_length`: False
758
+ - `length_column_name`: length
759
+ - `ddp_find_unused_parameters`: None
760
+ - `ddp_bucket_cap_mb`: None
761
+ - `ddp_broadcast_buffers`: False
762
+ - `dataloader_pin_memory`: True
763
+ - `dataloader_persistent_workers`: False
764
+ - `skip_memory_metrics`: True
765
+ - `use_legacy_prediction_loop`: False
766
+ - `push_to_hub`: False
767
+ - `resume_from_checkpoint`: None
768
+ - `hub_model_id`: None
769
+ - `hub_strategy`: every_save
770
+ - `hub_private_repo`: None
771
+ - `hub_always_push`: False
772
+ - `gradient_checkpointing`: False
773
+ - `gradient_checkpointing_kwargs`: None
774
+ - `include_inputs_for_metrics`: False
775
+ - `include_for_metrics`: []
776
+ - `eval_do_concat_batches`: True
777
+ - `fp16_backend`: auto
778
+ - `push_to_hub_model_id`: None
779
+ - `push_to_hub_organization`: None
780
+ - `mp_parameters`:
781
+ - `auto_find_batch_size`: False
782
+ - `full_determinism`: False
783
+ - `torchdynamo`: None
784
+ - `ray_scope`: last
785
+ - `ddp_timeout`: 1800
786
+ - `torch_compile`: False
787
+ - `torch_compile_backend`: None
788
+ - `torch_compile_mode`: None
789
+ - `include_tokens_per_second`: False
790
+ - `include_num_input_tokens_seen`: False
791
+ - `neftune_noise_alpha`: None
792
+ - `optim_target_modules`: None
793
+ - `batch_eval_metrics`: False
794
+ - `eval_on_start`: False
795
+ - `use_liger_kernel`: False
796
+ - `eval_use_gather_object`: False
797
+ - `average_tokens_across_devices`: False
798
+ - `prompts`: None
799
+ - `batch_sampler`: no_duplicates
800
+ - `multi_dataset_batch_sampler`: proportional
801
+
802
+ </details>
803
+
804
+ ### Training Logs
805
+ | Epoch | Step | Training Loss | InformationRetrievalEvaluator_cosine_ndcg@10 |
806
+ |:-----------:|:--------:|:-------------:|:--------------------------------------------:|
807
+ | -1 | -1 | - | 0.2630 |
808
+ | None | 0 | - | 0.2630 |
809
+ | 0.64 | 100 | 7.1037 | 0.3984 |
810
+ | 1.2752 | 200 | 1.5958 | 0.4382 |
811
+ | 1.9152 | 300 | 1.3041 | 0.4555 |
812
+ | 2.5504 | 400 | 1.0579 | 0.4634 |
813
+ | 3.1856 | 500 | 0.9941 | 0.4669 |
814
+ | 3.8256 | 600 | 0.9095 | 0.4727 |
815
+ | 4.4608 | 700 | 0.8385 | 0.4758 |
816
+ | 5.096 | 800 | 0.7846 | 0.4771 |
817
+ | 5.736 | 900 | 0.7202 | 0.4823 |
818
+ | 6.3712 | 1000 | 0.7087 | 0.4814 |
819
+ | 7.0064 | 1100 | 0.6613 | 0.4859 |
820
+ | 7.6464 | 1200 | 0.6189 | 0.4854 |
821
+ | 8.2816 | 1300 | 0.6109 | 0.4869 |
822
+ | 8.9216 | 1400 | 0.5978 | 0.4893 |
823
+ | 9.5568 | 1500 | 0.576 | 0.4875 |
824
+ | 10.192 | 1600 | 0.5572 | 0.4887 |
825
+ | 10.832 | 1700 | 0.5497 | 0.4894 |
826
+ | **11.4672** | **1800** | **0.5496** | **0.4895** |
827
+ | 12.0 | 1884 | - | 0.4895 |
828
+
829
+ * The bold row denotes the saved checkpoint.
830
+
831
+ ### Framework Versions
832
+ - Python: 3.11.13
833
+ - Sentence Transformers: 4.1.0
834
+ - Transformers: 4.52.4
835
+ - PyTorch: 2.6.0+cu124
836
+ - Accelerate: 1.7.0
837
+ - Datasets: 2.14.4
838
+ - Tokenizers: 0.21.1
839
+
840
+ ## Citation
841
+
842
+ ### BibTeX
843
+
844
+ #### Sentence Transformers
845
+ ```bibtex
846
+ @inproceedings{reimers-2019-sentence-bert,
847
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
848
+ author = "Reimers, Nils and Gurevych, Iryna",
849
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
850
+ month = "11",
851
+ year = "2019",
852
+ publisher = "Association for Computational Linguistics",
853
+ url = "https://arxiv.org/abs/1908.10084",
854
+ }
855
+ ```
856
+
857
+ #### CachedMultipleNegativesRankingLoss
858
+ ```bibtex
859
+ @misc{gao2021scaling,
860
+ title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
861
+ author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
862
+ year={2021},
863
+ eprint={2101.06983},
864
+ archivePrefix={arXiv},
865
+ primaryClass={cs.LG}
866
+ }
867
+ ```
868
+
869
+ <!--
870
+ ## Glossary
871
+
872
+ *Clearly define terms in order to be accessible across audiences.*
873
+ -->
874
+
875
+ <!--
876
+ ## Model Card Authors
877
+
878
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
879
+ -->
880
+
881
+ <!--
882
+ ## Model Card Contact
883
+
884
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
885
+ -->
config.json ADDED
@@ -0,0 +1,27 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "XLMRobertaModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "bos_token_id": 0,
7
+ "classifier_dropout": null,
8
+ "eos_token_id": 2,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 768,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 3072,
14
+ "layer_norm_eps": 1e-05,
15
+ "max_position_embeddings": 514,
16
+ "model_type": "xlm-roberta",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 12,
19
+ "output_past": true,
20
+ "pad_token_id": 1,
21
+ "position_embedding_type": "absolute",
22
+ "torch_dtype": "float32",
23
+ "transformers_version": "4.52.4",
24
+ "type_vocab_size": 1,
25
+ "use_cache": true,
26
+ "vocab_size": 250002
27
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "4.1.0",
4
+ "transformers": "4.52.4",
5
+ "pytorch": "2.6.0+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:507cf2c01c814307e5ef73d084f5de3c9d767bff2008b1b478438f7e58d82814
3
+ size 1112197096
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,55 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "extra_special_tokens": {},
49
+ "mask_token": "<mask>",
50
+ "model_max_length": 512,
51
+ "pad_token": "<pad>",
52
+ "sep_token": "</s>",
53
+ "tokenizer_class": "XLMRobertaTokenizer",
54
+ "unk_token": "<unk>"
55
+ }