Tucano2

Polygl0t 's Collections

Tucano2

LilMoo

LilTii

ViTucano-v1 (Portuguese)

Tucano (Portuguese)

TeenyTinyLlama (Portuguese)

updated about 15 hours ago

An open suite of large language models (LLMs) with 0.5-3.7 billion parameters, designed to address the gap in open-source development for Portuguese.

Upvote

Tucano 2 Cool: Better Open Source LLMs for Portuguese

Paper • 2603.03543 • Published 8 days ago • 6
Running on Zero

Tucano2Cool Chat Demo

🦜

Tucano 2 is the coolest open source Portuguese LLM!
Polygl0t/Tucano2-0.6B-Base

Text Generation • 0.7B • Updated 7 days ago • 25

Note 🧱 Base version of Tucano2 0.6B. Use as a foundation for post-training.
Polygl0t/Tucano2-qwen-0.5B-Base

Text Generation • 0.5B • Updated 7 days ago • 27

Note 🧱 Base version of Tucano2 0.5B. Use as a foundation for post-training.
Polygl0t/Tucano2-qwen-0.5B-Instruct

Text Generation • 0.5B • Updated 7 days ago • 70 • 1

Note 💬 Instruct version of Tucano2 0.5B. Suited for chat applications.
Polygl0t/Tucano2-qwen-0.5B-Think

Text Generation • 0.5B • Updated 7 days ago • 56

Note 🤔 Think version of Tucano2 0.5B. Suited for reasoning tasks.
Polygl0t/Tucano2-qwen-1.5B-Base

Text Generation • 2B • Updated 7 days ago • 313

Note 🧱 Base version of Tucano2 1.5B. Use as a foundation for post-training.
Polygl0t/Tucano2-qwen-1.5B-Instruct

Text Generation • 2B • Updated 7 days ago • 326 • 1

Note 💬 Instruct version of Tucano2 1.5B. Suited for chat applications.
Polygl0t/Tucano2-qwen-1.5B-Think

Text Generation • 2B • Updated 7 days ago • 25

Note 🤔 Think version of Tucano2 1.5B. Suited for reasoning tasks.
Polygl0t/Tucano2-qwen-3.7B-Base

Text Generation • 4B • Updated 7 days ago • 20

Note 🧱 Base version of Tucano2 3.7B. Use as a foundation for post-training.
Polygl0t/Tucano2-qwen-3.7B-Instruct

Text Generation • 4B • Updated 7 days ago • 55 • 1

Note 💬 Instruct version of Tucano2 3.7B. Suited for chat applications.
Polygl0t/Tucano2-qwen-3.7B-Think

Text Generation • 4B • Updated 7 days ago • 40

Note 🤔 Think version of Tucano2 3.7B. Suited for reasoning tasks.
Polygl0t/gigaverbo-v2

Viewer • Updated 7 days ago • 375M • 112

Note 📚 Pretraining dataset.
Polygl0t/gigaverbo-v2-synth

Viewer • Updated 7 days ago • 11.2M • 66

Note 📚 Synthetic dataset.
Polygl0t/gigaverbo-v2-sft

Viewer • Updated 7 days ago • 4.09M • 96 • 1

Note 📚 Supervised fine-tuning dataset.
Polygl0t/gigaverbo-v2-preferences

Viewer • Updated 7 days ago • 28.4k • 49

Note 📚 Preference dataset.
Polygl0t/GigaVerbo-v2-ablation-EDU-Synth-1.5B

Text Generation • 2B • Updated 7 days ago • 16

Note 🔬 Ablation Experiment (Edu+Synth)
Polygl0t/GigaVerbo-v2-ablation-EDU-1.5B

Text Generation • 2B • Updated 7 days ago • 14

Note 🔬 Ablation Experiment (Edu)
Polygl0t/GigaVerbo-v2-ablation-Synth-1.5B

Text Generation • 2B • Updated 7 days ago • 13

Note 🔬 Ablation Experiment (Synth)
Polygl0t/GigaVerbo-v2-ablation-NonEDU-1.5B

Text Generation • 2B • Updated 7 days ago • 13

Note 🔬 Ablation Experiment (NonEdu)
Polygl0t/portuguese-edu-qwen-annotations

Viewer • Updated 7 days ago • 700k • 5

Note 📚 Annotations to train classifiers/filters (Educational).
Polygl0t/portuguese-toxicity-qwen-annotations

Viewer • Updated 7 days ago • 700k • 7

Note 📚 Annotations to train classifiers/filters (Toxicity).
Polygl0t/portuguese-instruct-quality-qwen-annotations

Viewer • Updated 7 days ago • 500k • 3

Note 📚 Annotations to train classifiers/filters (Instructions).
Polygl0t/portuguese-bertimbau-edu-classifier

Text Classification • 0.1B • Updated 7 days ago • 14

Note 🎯 Quality Filter (Educational)
Polygl0t/portuguese-bertimbau-large-edu-classifier

Text Classification • 0.3B • Updated 7 days ago • 14

Note 🎯 Quality Filter (Educational)
Polygl0t/portuguese-bertimbau-toxicity-classifier

Text Classification • 0.1B • Updated 7 days ago • 15

Note 🎯 Quality Filter (Toxicity)
Polygl0t/portuguese-bertabaporu-large-toxicity-classifier

Text Classification • 0.4B • Updated 7 days ago • 14

Note 🎯 Quality Filter (Toxicity)
Polygl0t/portuguese-qwen3-4b-instruct-quality-classifier

Text Classification • 4B • Updated 7 days ago • 21

Note 🎯 Quality Filter (Instructions)
Polygl0t/portuguese-qwen3-4b-instruct-quality-judge

Text Generation • 4B • Updated 7 days ago • 19

Note 🎯 Quality Filter (Instructions)
Polygl0t/tokenizers

Viewer • Updated 7 days ago • 8.98M • 15

Note 📚 Data used to train the Tucano2 tokenizer.
Polygl0t/gsm8k-pt

Viewer • Updated 28 days ago • 8.76k • 15

Note 🏆 An evaluation for mathematical reasoning in Portuguese.
Polygl0t/IFEval-PT

Viewer • Updated 28 days ago • 300 • 14

Note 🏆 An evaluation for instruction following in Portuguese.
Polygl0t/portuguese-eval-logs-olmo2-smollm3

Viewer • Updated 7 days ago • 203 • 24

Note 🔬 Evaluation suite experiments.

Upvote

Tucano2

Tucano2Cool Chat Demo