Guanhua Huang's picture

1 3

Guanhua Huang

Carlanlarkk

AI & ML interests

None yet

Recent Activity

authored a paper 17 days ago

Low-probability Tokens Sustain Exploration in Reinforcement Learning with Verifiable Reward

upvoted a paper 17 days ago

Cogito, Ergo Ludo: An Agent that Learns to Play by Reasoning and Planning

upvoted a paper 17 days ago

Low-probability Tokens Sustain Exploration in Reinforcement Learning with Verifiable Reward

View all activity

Organizations

None yet

Papers 7

arxiv:2510.03222

arxiv:2509.19249

arxiv:2507.06829

arxiv:2507.04952

models 0

None public yet

datasets 0

None public yet