17 21 9

Songyang Zhang

zsytony

AI & ML interests

None yet

Recent Activity

new activity 2 days ago

ScienceOne-AI/S1-Base-671B:Cannot be demployed with SGLang

upvoted a paper 4 days ago

Sculptor: Empowering LLMs with Cognitive Agency via Active Context Management

upvoted a paper 10 days ago

CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward

View all activity

Organizations

New activity in ScienceOne-AI/S1-Base-671B 2 days ago

Cannot be demployed with SGLang

#2 opened 2 days ago by

zsytony

upvoted a paper 4 days ago

Sculptor: Empowering LLMs with Cognitive Agency via Active Context Management

Paper • 2508.04664 • Published 9 days ago • 10

upvoted a paper 10 days ago

CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward

Paper • 2508.03686 • Published 10 days ago • 32

commented a paper 10 days ago

CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward

Paper • 2508.03686 • Published 10 days ago • 32 •

authored 2 papers about 1 month ago

CompassJudger-2: Towards Generalist Judge Model via Verifiable Rewards

Paper • 2507.09104 • Published Jul 12 • 17

Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination

Paper • 2507.10532 • Published Jul 14 • 85

upvoted a paper about 1 month ago

Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination

Paper • 2507.10532 • Published Jul 14 • 85

commented a paper about 1 month ago

Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination

Paper • 2507.10532 • Published Jul 14 • 85 •

upvoted a paper about 1 month ago

CompassJudger-2: Towards Generalist Judge Model via Verifiable Rewards

Paper • 2507.09104 • Published Jul 12 • 17

commented a paper about 1 month ago

CompassJudger-2: Towards Generalist Judge Model via Verifiable Rewards

Paper • 2507.09104 • Published Jul 12 • 17 •

upvoted a collection about 1 month ago

CompassVerifier

Collection

CompassVerifier: A Unified and Robust Verifier for Large Language Models • 5 items • Updated 9 days ago • 4

updated a model about 1 month ago

opencompass/CompassJudger-2-7B-Instruct

Text Ranking • 8B • Updated 25 days ago • 229 • 2

published a model about 1 month ago

opencompass/CompassJudger-2-7B-Instruct

Text Ranking • 8B • Updated 25 days ago • 229 • 2

updated a model about 1 month ago

opencompass/CompassJudger-2-32B-Instruct

Text Ranking • 33B • Updated 25 days ago • 90 • 2

published a model about 1 month ago

opencompass/CompassJudger-2-32B-Instruct

Text Ranking • 33B • Updated 25 days ago • 90 • 2

authored 3 papers about 1 month ago

PM4Bench: A Parallel Multilingual Multi-Modal Multi-task Benchmark for Large Vision Language Model

Paper • 2503.18484 • Published Mar 24

Coding Triangle: How Does Large Language Model Understand Code?

Paper • 2507.06138 • Published Jul 8 • 20

Rethinking Verification for LLM Code Generation: From Generation to Testing

Paper • 2507.06920 • Published Jul 9 • 28

upvoted 2 papers about 1 month ago

Rethinking Verification for LLM Code Generation: From Generation to Testing

Paper • 2507.06920 • Published Jul 9 • 28

Coding Triangle: How Does Large Language Model Understand Code?

Paper • 2507.06138 • Published Jul 8 • 20

Songyang Zhang

AI & ML interests

Recent Activity

Organizations

zsytony's activity

Cannot be demployed with SGLang