1 16 56

MC

Dreamer312

Dreamer

AI & ML interests

NLP, CV, LLM, AGENT, RL

Recent Activity

commented on a paper 10 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

commented on a paper 18 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

commented on a paper 23 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

View all activity

Organizations

None yet

Dreamer312's activity

commented a paper 10 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 28 days ago • 19 •

commented a paper 18 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 28 days ago • 19 •

commented 2 papers 23 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 28 days ago • 19 •

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 28 days ago • 19 •

upvoted a paper 24 days ago

Scaling Law for Quantization-Aware Training

Paper • 2505.14302 • Published 26 days ago • 73

upvoted a collection 24 days ago

Llama 4

Collection

Meta's new Llama 4 multimodal models, Scout & Maverick. Includes Dynamic GGUFs, 16-bit & Dynamic 4-bit uploads. Run & fine-tune them with Unsloth! • 15 items • Updated 16 days ago • 46

liked 2 models 24 days ago

unsloth/Llama-4-Maverick-17B-128E-Instruct-GGUF

Image-Text-to-Text • Updated 17 days ago • 49.7k • 25

meta-llama/Llama-4-Maverick-17B-128E-Instruct

Image-Text-to-Text • Updated 23 days ago • 54.4k • • 346

commented a paper 26 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 28 days ago • 19 •

authored 2 papers 26 days ago

Hydra-SGG: Hybrid Relation Assignment for One-stage Scene Graph Generation

Paper • 2409.10262 • Published Sep 16, 2024 • 1

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 28 days ago • 19

commented a paper 26 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 28 days ago • 19 •

upvoted a paper 26 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 28 days ago • 19

upvoted a paper 28 days ago

Hydra-SGG: Hybrid Relation Assignment for One-stage Scene Graph Generation

Paper • 2409.10262 • Published Sep 16, 2024 • 1

upvoted an article about 1 month ago

Article

Mixture of Experts Explained

and 5 others •

Dec 11, 2023

• 681

upvoted a collection about 1 month ago

Qwen3

Collection

40 items • Updated 25 days ago • 756

liked a model about 1 month ago

Qwen/Qwen3-32B

Text Generation • Updated 25 days ago • 770k • • 390

updated a model about 1 month ago

Dreamer312/Qwen-2.5-1.5B-Simple-RL

Updated May 9 • 8

published 2 models about 1 month ago

Dreamer312/Qwen-2.5-1.5B-Simple-RL

Updated May 9 • 8

Dreamer312/Qwen-2.5-7B-Simple-RL

Updated May 7