Anikait Singh

Asap7772

·

https://asap7772.github.io

AI & ML interests

Deep Learning, Reinforcement Learning, Robotics

Organizations

upvoted a paper 7 months ago

WebGym: Scaling Training Environments for Visual Web Agents with Realistic Tasks

Paper • 2601.02439 • Published Jan 5 • 18

upvoted a paper 8 months ago

Fara-7B: An Efficient Agentic Model for Computer Use

Paper • 2511.19663 • Published Nov 24, 2025 • 22

upvoted a paper 10 months ago

RLAD: Training LLMs to Discover Abstractions for Solving Reasoning Problems

Paper • 2510.02263 • Published Oct 2, 2025 • 9

upvoted a paper 12 months ago

Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving

Paper • 2507.23726 • Published Jul 31, 2025 • 116

upvoted 2 papers about 1 year ago

LitBench: A Benchmark and Dataset for Reliable Evaluation of Creative Writing

Paper • 2507.00769 • Published Jul 1, 2025 • 5

Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction

Paper • 2506.07976 • Published Jun 9, 2025 • 6

upvoted 3 papers over 1 year ago

Cognitive Behaviors that Enable Self-Improving Reasoners, or, Four Habits of Highly Effective STaRs

Paper • 2503.01307 • Published Mar 3, 2025 • 39

FSPO: Few-Shot Preference Optimization of Synthetic Preference Data in LLMs Elicits Effective Personalization to Real Users

Paper • 2502.19312 • Published Feb 26, 2025 • 7

Towards System 2 Reasoning in LLMs: Learning How to Think With Meta Chain-of-Though

Paper • 2501.04682 • Published Jan 8, 2025 • 99

upvoted a paper over 2 years ago

Teaching Large Language Models to Reason with Reinforcement Learning

Paper • 2403.04642 • Published Mar 7, 2024 • 48

upvoted a paper almost 3 years ago

Robotic Offline RL from Internet Videos via Value-Function Pre-Training

Paper • 2309.13041 • Published Sep 22, 2023 • 9