Edit Models filters

Apps

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

19

Full-text search

Active filters: RLinf

RLinf/RLinf-math-1.5B

Reinforcement Learning • 2B • Updated Sep 1 • 5 • 1

RLinf/RLinf-math-7B

Text Generation • 8B • Updated 7 days ago • 14 • 3

mradermacher/RLinf-math-1.5B-GGUF

2B • Updated Aug 27 • 180

mradermacher/RLinf-math-7B-GGUF

Reinforcement Learning • 8B • Updated 5 days ago • 286 • 1

mradermacher/RLinf-math-1.5B-i1-GGUF

2B • Updated Aug 28 • 155

mradermacher/RLinf-math-7B-i1-GGUF

Reinforcement Learning • 8B • Updated 5 days ago • 868 • 1

RLinf/RLinf-OpenVLAOFT-GRPO-LIBERO-object

Reinforcement Learning • 8B • Updated 8 days ago • 33

RLinf/RLinf-OpenVLA-GRPO-ManiSkill3-25ood

Reinforcement Learning • 8B • Updated 7 days ago • 15

RLinf/RLinf-OpenVLAOFT-GRPO-ManiSkill3-25ood

Reinforcement Learning • 8B • Updated 7 days ago • 18

RLinf/RLinf-OpenVLAOFT-GRPO-LIBERO-goal

Reinforcement Learning • 8B • Updated 8 days ago • 14

RLinf/RLinf-OpenVLAOFT-GRPO-LIBERO-spatial

Reinforcement Learning • 8B • Updated 8 days ago • 24

RLinf/RLinf-OpenVLAOFT-GRPO-LIBERO-long

Reinforcement Learning • 8B • Updated 8 days ago • 21

RLinf/RLinf-OpenVLA-PPO-ManiSkill3-25ood

Reinforcement Learning • 8B • Updated 7 days ago • 15

RLinf/RLinf-OpenVLAOFT-PPO-ManiSkill3-25ood

Reinforcement Learning • 8B • Updated 7 days ago • 22

RLinf/RLinf-OpenVLAOFT-ManiSkill-Base-Lora

Reinforcement Learning • Updated Sep 6

RLinf/RLinf-OpenVLAOFT-GRPO-LIBERO-90

Reinforcement Learning • 8B • Updated 8 days ago • 8

RLinf/RLinf-OpenVLAOFT-LIBERO-130-Base-Lora

Reinforcement Learning • 8B • Updated 8 days ago • 11

RLinf/RLinf-OpenVLAOFT-LIBERO-130

Reinforcement Learning • 8B • Updated 8 days ago • 8

RLinf/RLinf-OpenVLAOFT-LIBERO-90-Base-Lora

Reinforcement Learning • 8B • Updated 8 days ago • 9