Wenkai Yang's picture

2 7

Wenkai Yang PRO

Keven16

·

https://keven980716.github.io/

keven980716

AI & ML interests

None yet

Recent Activity

published a model 4 days ago

Keven16/Qwen2.5-32B-TOPS-Iter-DPO-Preview

published a model 4 days ago

Keven16/Qwen2.5-32B-TOPS-Iter-DPO

upvoted a paper 5 days ago

Agentic Reinforced Policy Optimization

View all activity

Organizations

None yet

commented 2 papers 3 months ago

DeepCritic: Deliberate Critique with Large Language Models

Paper • 2505.00662 • Published May 1 • 54 •

DeepCritic: Deliberate Critique with Large Language Models

Paper • 2505.00662 • Published May 1 • 54 •

commented a paper about 1 year ago

Super(ficial)-alignment: Strong Models May Deceive Weak Models in Weak-to-Strong Generalization

Paper • 2406.11431 • Published Jun 17, 2024 • 4 •