siyeng feng's picture

685 239

siyeng feng

siyengfeng

·

AI & ML interests

None yet

Recent Activity

liked a model 4 days ago

SWE-bench/SWE-agent-LM-32B

liked a model 5 days ago

XiaomiMiMo/MiMo-7B-RL

liked a model 5 days ago

microsoft/Phi-4-reasoning-plus

View all activity

Organizations

None yet

siyengfeng's activity

liked a model 4 days ago

SWE-bench/SWE-agent-LM-32B

Text Generation • Updated 4 days ago • 732 • 40

liked 2 models 5 days ago

XiaomiMiMo/MiMo-7B-RL

Text Generation • Updated 7 days ago • 5.98k • 245

microsoft/Phi-4-reasoning-plus

Text Generation • Updated 4 days ago • 11.9k • 242

upvoted 5 papers 7 days ago

Skill Discovery for Software Scripting Automation via Offline Simulations with LLMs

Paper • 2504.20406 • Published 13 days ago • 6

AdaR1: From Long-CoT to Hybrid-CoT via Bi-Level Adaptive Reasoning Optimization

Paper • 2504.21659 • Published 12 days ago • 11

LLMs for Engineering: Teaching Models to Design High Powered Rockets

Paper • 2504.19394 • Published 14 days ago • 13

Self-Generated In-Context Examples Improve LLM Agents for Sequential Decision-Making Tasks

Paper • 2505.00234 • Published 11 days ago • 22

DeepCritic: Deliberate Critique with Large Language Models

Paper • 2505.00662 • Published 10 days ago • 48

upvoted a paper 10 days ago

WebThinker: Empowering Large Reasoning Models with Deep Research Capability

Paper • 2504.21776 • Published 12 days ago • 44

liked a model 11 days ago

microsoft/Phi-4-reasoning

Text Generation • Updated 4 days ago • 7.23k • 167

liked a model 12 days ago

THUDM/SWE-Dev-32B

Text Generation • Updated 12 days ago • 74 • 22

liked a dataset 12 days ago

THUDM/SWE-Dev-train

Viewer • Updated 8 days ago • 20.1k • 406 • 4

liked 2 models 12 days ago

deepseek-ai/DeepSeek-Prover-V2-671B

Text Generation • Updated 12 days ago • 7.64k • • 752

Qwen/Qwen3-235B-A22B

Text Generation • Updated 11 days ago • 91.3k • • 770

liked 4 models 13 days ago

Skywork/Skywork-R1V2-38B

Image-Text-to-Text • Updated 15 days ago • 12.2k • 116

Qwen/Qwen3-235B-A22B-FP8

Text Generation • Updated 12 days ago • 31.9k • • 66

nvidia/AceMath-RL-Nemotron-7B

Text Generation • Updated 18 days ago • 13.9k • • 21

nvidia/Nemotron-H-47B-Base-8K

Text Generation • Updated 19 days ago • 1.34k • 18

liked a model 14 days ago

tngtech/DeepSeek-R1T-Chimera

Text Generation • Updated 7 days ago • 3.36k • 220

upvoted a collection 14 days ago

OpenMathReasoning

Models and datasets from "AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with OpenMathReasoning dataset" • 7 items • Updated 2 days ago • 36