Yuming Yang's picture

6 5 6

Yuming Yang

Umean

·

UmeanNever

AI & ML interests

NLP

Organizations

upvoted a paper 2 months ago

Analyzing the Effects of Supervised Fine-Tuning on Model Knowledge from Token and Parameter Levels

Paper • 2509.16596 • Published Sep 20 • 14

upvoted 2 papers 5 months ago

Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination

Paper • 2507.10532 • Published Jul 14 • 88

Pre-Trained Policy Discriminators are General Reward Models

Paper • 2507.05197 • Published Jul 7 • 39

upvoted a collection 5 months ago

POLAR

5 items • Updated Jul 9 • 13

upvoted a paper 6 months ago

Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric

Paper • 2502.17184 • Published Feb 24 • 1