2 20 3

Haonan Wang

haonan3

https://charles-haonan-wang.me/

Haonan_Wang_

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification

upvoted a paper 8 days ago

Video-Based Reward Modeling for Computer-Use Agents

upvoted a paper 2 months ago

Your Group-Relative Advantage Is Biased

View all activity

Organizations

upvoted a paper 2 days ago

MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification

Paper • 2603.15726 • Published 4 days ago • 165

upvoted a paper 8 days ago

Video-Based Reward Modeling for Computer-Use Agents

Paper • 2603.10178 • Published 10 days ago • 41

upvoted a paper 2 months ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 158

upvoted 4 papers 4 months ago

OpenMMReasoner: Pushing the Frontiers for Multimodal Reasoning with an Open and General Recipe

Paper • 2511.16334 • Published Nov 20, 2025 • 94

Can World Simulators Reason? Gen-ViRe: A Generative Visual Reasoning Benchmark

Paper • 2511.13853 • Published Nov 17, 2025 • 37

MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling

Paper • 2511.11793 • Published Nov 14, 2025 • 193

Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published Nov 5, 2025 • 132

upvoted 3 papers 6 months ago

Muon Outperforms Adam in Tail-End Associative Memory Learning

Paper • 2509.26030 • Published Sep 30, 2025 • 20

From Harm to Help: Turning Reasoning In-Context Demos into Assets for Reasoning LMs

Paper • 2509.23196 • Published Sep 27, 2025 • 10

Variational Reasoning for Language Models

Paper • 2509.22637 • Published Sep 26, 2025 • 69

upvoted 3 papers 7 months ago

VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use

Paper • 2509.01055 • Published Sep 1, 2025 • 79

SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning

Paper • 2509.02479 • Published Sep 2, 2025 • 84

MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers

Paper • 2508.14704 • Published Aug 20, 2025 • 43

upvoted an article 9 months ago

Article

Decoding Strategies in Large Language Models

Oct 29, 2024

•

110

upvoted a paper 9 months ago

Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights

Paper • 2506.16406 • Published Jun 19, 2025 • 132

upvoted 2 papers 10 months ago

Fostering Video Reasoning via Next-Event Prediction

Paper • 2505.22457 • Published May 28, 2025 • 29

Lifelong Safety Alignment for Language Models

Paper • 2505.20259 • Published May 26, 2025 • 24

upvoted 2 papers 12 months ago

Understanding R1-Zero-Like Training: A Critical Perspective

Paper • 2503.20783 • Published Mar 26, 2025 • 59

SkyLadder: Better and Faster Pretraining via Context Window Scheduling

Paper • 2503.15450 • Published Mar 19, 2025 • 12

upvoted a paper over 1 year ago

When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training

Paper • 2411.13476 • Published Nov 20, 2024 • 16

Haonan Wang

AI & ML interests

Recent Activity

Organizations

haonan3's activity

Decoding Strategies in Large Language Models