SentenceTransformer based on intfloat/multilingual-e5-base
This is a sentence-transformers model finetuned from intfloat/multilingual-e5-base. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: intfloat/multilingual-e5-base
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("diegolacomba/multilingual-e5-base-legal-cmnrl-1")
# Run inference
sentences = [
'query: ¿En qué casos las actividades hípicas se consideran prestaciones independientes que no están sujetas al impuesto en territorio español?',
'passage: Dicha regla también sería de aplicación a las actividades hípicas si tuviesen la consideración de prestaciones accesorias a las de alojamiento, en los términos expuestos en el apartado anterior de la presente contestación.\nPor el contrario, si los servicios de actividades hípicas prestadas a quien tiene la condición de empresario o profesional a efectos del Impuesto, tuvieran la consideración de prestaciones independientes de los servicios de alojamiento en los términos expuestos en el apartado anterior de la presente contestación, los mismos no se entenderían realizados en el territorio de aplicación del Impuesto, en virtud de lo dispuesto en el artículo 69.Uno.1º de la Ley del Impuesto, transcrito anteriormente, y, por lo tanto, no se encontrarán sujetos al Impuesto sobre el Valor Añadido.\n4.- Por otra parte, se informa de que, en relación con las dudas suscitadas sobre el lugar de realización de los hechos imponibles, entrega de bienes y prestaciones de servicios, la Agencia Estatal de Administración Tributaria ha incorporado en los portales del Impuesto sobre el Valor Añadido (IVA) y Suministro Inmediato de Información del IVA (SII) un nuevo servicio de ayuda e información al contribuyente denominado “Localizador”, creado para resolver las principales dudas planteadas cuando el empresario o profesional realiza este tipo de operaciones con clientes o proveedores no establecidos en el territorio de aplicación del Impuesto.\nEn concreto, esta herramienta permite conocer el lugar de realización de las entregas de bienes, distinguiendo entre entregas interiores, intracomunitarias y con destino a terceros países.\nEn concreto, puede obtenerse información sobre donde se localiza la entrega de un bien, si está sujeta o exenta del Impuesto sobre el Valor Añadido, quién debe declarar el Impuesto devengado en la operación o cómo se declara en caso de no estar sujeta o exenta en el territorio de aplicación del impuesto español; también indicará si en la factura se debe o no repercutir dicho impuesto.',
'passage: La consultante es la titular de la plataforma donde se desarrolla los juegos en línea y es la creadora de las soluciones de juego generadas por números aleatorios si bien es importante destacar que su actividad se limita a proporcionar a los operadores de juego los medios tecnológicos para que estos operen en la actividad de juego en línea de forma que no tiene responsabilidad alguna frente a los usuarios/jugadores ni las apuestas efectuados por los mismos.\nLa entidad consultante, en definitiva, no tiene como interlocutor al usuario/jugador sino al operador del juego en línea que contrata sus servicios tecnológicos y/o de software. Los usuarios/jugadores realizan la apuesta a través de la propia web del operador de juego el cual se servirá del software o medios tecnológicos proporcionados por la consultante.\nDel escrito de consulta parece deducirse que la consultante se estaría planteando la grabación en sus estudios y la retransmisión de los eventos de juego en vivo a dos entidades del mismo grupo (denominados servicios de distribución cinematográfica y de videos), las cuales serían las que prestarían los servicios de casino en vivo a los operadores de juego o bien a prestar directamente dichos servicios a los citados operadores.\nDe acuerdo con lo anterior, los servicios objeto de consulta se entienden realizados en el territorio de aplicación del Impuesto y estarán sujetos al Impuesto sobre el Valor Añadido cuando el destinatario del servicio sea un empresario o profesional actuando como tal y tenga en dicho ámbito espacial la sede de actividad económica o cuente en el mismo con un establecimiento permanente o, en su defecto, su residencia o domicilio habitual siempre que los servicios en cuestión tengan por destinatarios a esa sede, establecimiento o domicilio.\nEn consecuencia con todo lo anterior, los servicios prestados por la consultante en el primer escenario descrito a las otras dos entidades del grupo (servicios de distribución cinematográfica y de video), establecidas en otros Estados Miembros, no estarán sujetas al Impuesto sobre el Valor Añadido.\nDe acuerdo con las reglas armonizadas sobre el lugar de realización será, en su caso, los Estados Miembro en los que estén establecidas dichas entidades el lugar en que se deban entender localizadas las prestaciones de servicios objeto de consulta.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Information Retrieval
- Dataset:
InformationRetrievalEvaluator
- Evaluated with
InformationRetrievalEvaluator
Metric | Value |
---|---|
cosine_accuracy@1 | 0.1566 |
cosine_accuracy@3 | 0.255 |
cosine_accuracy@5 | 0.3124 |
cosine_accuracy@10 | 0.392 |
cosine_precision@1 | 0.1566 |
cosine_precision@3 | 0.085 |
cosine_precision@5 | 0.0625 |
cosine_precision@10 | 0.0392 |
cosine_recall@1 | 0.1566 |
cosine_recall@3 | 0.255 |
cosine_recall@5 | 0.3124 |
cosine_recall@10 | 0.392 |
cosine_ndcg@10 | 0.263 |
cosine_mrr@10 | 0.2231 |
cosine_map@100 | 0.2339 |
Information Retrieval
- Dataset:
InformationRetrievalEvaluator
- Evaluated with
InformationRetrievalEvaluator
Metric | Value |
---|---|
cosine_accuracy@1 | 0.332 |
cosine_accuracy@3 | 0.4965 |
cosine_accuracy@5 | 0.5703 |
cosine_accuracy@10 | 0.6671 |
cosine_precision@1 | 0.332 |
cosine_precision@3 | 0.1655 |
cosine_precision@5 | 0.1141 |
cosine_precision@10 | 0.0667 |
cosine_recall@1 | 0.332 |
cosine_recall@3 | 0.4965 |
cosine_recall@5 | 0.5703 |
cosine_recall@10 | 0.6671 |
cosine_ndcg@10 | 0.4895 |
cosine_mrr@10 | 0.4339 |
cosine_map@100 | 0.4441 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 79,908 training samples
- Columns:
anchor
andpositive
- Approximate statistics based on the first 1000 samples:
anchor positive type string string details - min: 19 tokens
- mean: 30.77 tokens
- max: 48 tokens
- min: 17 tokens
- mean: 342.89 tokens
- max: 502 tokens
- Samples:
anchor positive query: ¿Cómo se determina si una persona con discapacidad califica para beneficios fiscales en la compra de ciertos dispositivos médicos según la normativa vigente?
passage: 3.- Por otro lado, el artículo 91, apartado dos.1, número 5º de la citada Ley 37/1992, establece que se aplicará el tipo impositivo del 4 por ciento a las entregas, adquisiciones intracomunitarias e importaciones de prótesis, ortesis e implantes internos para personas con discapacidad.
A tal efecto, el último párrafo del número 4º del mencionado artículo 91, apartado dos.1 de dicha Ley, declara lo siguiente:
"A efectos de este apartado dos, se considerarán personas con discapacidad aquellas con un grado de discapacidad igual o superior al 33 por ciento. El grado de discapacidad deberá acreditarse mediante certificación o resolución expedida por el Instituto de Mayores y Servicios Sociales o el órgano competente de la comunidad autónoma.".
En relación con la aplicación del tipo impositivo del 4 por ciento en las entregas de gafas graduadas a personas con una discapacidad igual o superior al 33 por ciento, es criterio de este Centro directivo, entre otras, en la contestación vin...query: ¿Qué aspectos deben considerarse al evaluar la caución establecida en la legislación del IVA?
passage: Descripción de hechos: La sociedad consultante con sede en el Reino Unido tiene como actividad el desarrollo de soluciones de software para empresas. La consultante dispone de una sucursal en el territorio español de aplicación del Impuesto. La sucursal no lleva a cabo actividades de venta, ni realiza entregas de bienes ni prestaciones de servicios en España. La sociedad consultante solicita devolución del impuesto soportado por el procedimiento de los artículos 119 y 119 bis de la Ley del Impuesto.
Cuestión planteada: Determinación del importe y naturaleza de la caución contemplada en el artículo 119 bis de la Ley del Impuesto sobre el Valor Añadido.query: ¿Cómo afecta una redistribución de participaciones en una comunidad de bienes a la tributación de actos jurídicos?
passage: Si la Comunidad Autónoma no hubiese aprobado el tipo a que se refiere el párrafo anterior, se aplicará el 0,50 por 100, en cuanto a tales actos o contratos.”.
De acuerdo con el artículo 2.1 transcrito, para determinar la tributación correspondiente al supuesto planteado, debe analizarse en primer lugar la naturaleza jurídica de la operación que se pretende realizar. De la aplicación de los anteriores preceptos a los hechos expuestos se deriva claramente que la operación que se pretende llevar acabo no supone una disolución de la comunidad de bienes- que claramente se mantiene en los tres inmuebles que van a continuar en común- produciéndose, en todo caso, lo a veces se denomina una “disolución parcial”, pero que realmente no es una disolución o, en cualquier caso, no lo es a efectos del Impuesto sobre Transmisiones Patrimoniales y Actos Jurídicos Documentados. La operación que van a realizar consiste en una redistribución de las participaciones de los comuneros que antes osten... - Loss:
CachedMultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim", "mini_batch_size": 32 }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: stepsper_device_train_batch_size
: 128per_device_eval_batch_size
: 32gradient_accumulation_steps
: 4learning_rate
: 3e-05num_train_epochs
: 12lr_scheduler_type
: cosinewarmup_ratio
: 0.1fp16
: Truetf32
: Trueload_best_model_at_end
: Trueoptim
: adamw_torch_fusedbatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 128per_device_eval_batch_size
: 32per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 4eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 3e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 12max_steps
: -1lr_scheduler_type
: cosinelr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Truelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Trueignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torch_fusedoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Epoch | Step | Training Loss | InformationRetrievalEvaluator_cosine_ndcg@10 |
---|---|---|---|
-1 | -1 | - | 0.2630 |
None | 0 | - | 0.2630 |
0.64 | 100 | 7.1037 | 0.3984 |
1.2752 | 200 | 1.5958 | 0.4382 |
1.9152 | 300 | 1.3041 | 0.4555 |
2.5504 | 400 | 1.0579 | 0.4634 |
3.1856 | 500 | 0.9941 | 0.4669 |
3.8256 | 600 | 0.9095 | 0.4727 |
4.4608 | 700 | 0.8385 | 0.4758 |
5.096 | 800 | 0.7846 | 0.4771 |
5.736 | 900 | 0.7202 | 0.4823 |
6.3712 | 1000 | 0.7087 | 0.4814 |
7.0064 | 1100 | 0.6613 | 0.4859 |
7.6464 | 1200 | 0.6189 | 0.4854 |
8.2816 | 1300 | 0.6109 | 0.4869 |
8.9216 | 1400 | 0.5978 | 0.4893 |
9.5568 | 1500 | 0.576 | 0.4875 |
10.192 | 1600 | 0.5572 | 0.4887 |
10.832 | 1700 | 0.5497 | 0.4894 |
11.4672 | 1800 | 0.5496 | 0.4895 |
12.0 | 1884 | - | 0.4895 |
- The bold row denotes the saved checkpoint.
Framework Versions
- Python: 3.11.13
- Sentence Transformers: 4.1.0
- Transformers: 4.52.4
- PyTorch: 2.6.0+cu124
- Accelerate: 1.7.0
- Datasets: 2.14.4
- Tokenizers: 0.21.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
CachedMultipleNegativesRankingLoss
@misc{gao2021scaling,
title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
year={2021},
eprint={2101.06983},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
- Downloads last month
- 7
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support
Model tree for diegolacomba/multilingual-e5-base-legal-cmnrl-1
Base model
intfloat/multilingual-e5-baseEvaluation results
- Cosine Accuracy@1 on InformationRetrievalEvaluatorself-reported0.157
- Cosine Accuracy@3 on InformationRetrievalEvaluatorself-reported0.255
- Cosine Accuracy@5 on InformationRetrievalEvaluatorself-reported0.312
- Cosine Accuracy@10 on InformationRetrievalEvaluatorself-reported0.392
- Cosine Precision@1 on InformationRetrievalEvaluatorself-reported0.157
- Cosine Precision@3 on InformationRetrievalEvaluatorself-reported0.085
- Cosine Precision@5 on InformationRetrievalEvaluatorself-reported0.062
- Cosine Precision@10 on InformationRetrievalEvaluatorself-reported0.039
- Cosine Recall@1 on InformationRetrievalEvaluatorself-reported0.157
- Cosine Recall@3 on InformationRetrievalEvaluatorself-reported0.255