Qwen3-Embedding-Scandi-0.6B

Fine-tuned version of Qwen/Qwen3-Embedding-0.6B for Scandinavian text embeddings (Danish, Norwegian, Swedish).

Model Summary

Base model: Qwen/Qwen3-Embedding-0.6B
Architecture: Transformer-based embedding model (0.6B parameters)
Fine-tuning: LoRA + Swift, merged into base weights
Task: Sentence and document embeddings for retrieval, clustering, and semantic similarity
Languages: 🇩🇰 Danish, 🇸🇪 Swedish, 🇳🇴 Norwegian

This model is intended for representation learning tasks such as:

Not recommended for text generation.

Dataset: DDSC/nordic-embedding-training-data Scandinavian corpora (mixed Danish, Norwegian, Swedish texts)
Training framework: Swift with LoRA adapters
Loss function: InfoNCE

Limited to Scandinavian languages (other languages may work poorly).
Embeddings are sensitive to domain shift (best results on text similar to training data).
As with all language models, embeddings may encode societal biases present in the training data.

Safetensors

Model size

596M params

Tensor type

F32

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support