8 10

Yiran Xie

gaoziha

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

The Amazing Agent Race: Strong Tool Users, Weak Navigators

liked a model 7 days ago

tencent/HY-World-2.0

upvoted a paper 10 days ago

RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time

View all activity

Organizations

None yet

upvoted a paper 2 days ago

The Amazing Agent Race: Strong Tool Users, Weak Navigators

Paper • 2604.10261 • Published 9 days ago • 7

liked a model 7 days ago

tencent/HY-World-2.0

Image-to-3D • Updated 4 days ago • 2.85k • 606

upvoted a paper 10 days ago

RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time

Paper • 2604.11626 • Published 13 days ago • 100

liked a model 10 days ago

tencent/HY-Embodied-0.5

Image-Text-to-Text • 4B • Updated 12 days ago • 2.67k • 903

liked a dataset 12 days ago

daniilakk/nbchr_pdfs

Preview • Updated May 25, 2025 • 304k • 2

liked a dataset 13 days ago

nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8, 2025 • 3.91M • 2.87k • 656

liked a dataset 14 days ago

allenai/MADLAD-400

Updated Sep 9, 2024 • 9.16k • 168

upvoted a paper 14 days ago

Adam's Law: Textual Frequency Law on Large Language Models

Paper • 2604.02176 • Published 24 days ago • 489

upvoted a paper 15 days ago

Rethinking Generalization in Reasoning SFT: A Conditional Analysis on Optimization, Data, and Model Capability

Paper • 2604.06628 • Published 18 days ago • 321

upvoted a paper 16 days ago

An Efficient Heterogeneous Co-Design for Fine-Tuning on a Single GPU

Paper • 2603.16428 • Published Mar 17 • 51

upvoted a paper 17 days ago

Brainstacks: Cross-Domain Cognitive Capabilities via Frozen MoE-LoRA Stacks for Continual LLM Learning

Paper • 2604.01152 • Published 25 days ago • 5

liked a model 21 days ago

olusegunola/phi-1.5-distill-v2-Proposed_MLP_L2_Beta2.0

Updated 21 days ago • 1

liked 2 models 25 days ago

deqing/convergent-llama-300M-muon-isolate-8

Text Generation • 0.3B • Updated 25 days ago • 2.26k • 1

stuub/Ollama-Int-Overflow

73786976.3T • Updated 24 days ago • 1

upvoted a paper about 1 month ago

InCoder-32B: Code Foundation Model for Industrial Scenarios

Paper • 2603.16790 • Published Mar 17 • 308

liked 2 models about 2 months ago

Nanbeige/Nanbeige4.1-3B

Text Generation • 4B • Updated Mar 25 • 223k • • 1.1k

MiniMaxAI/MiniMax-M2.5

Text Generation • 229B • Updated Mar 10 • 929k • • 1.46k

upvoted a paper about 2 months ago

A Very Big Video Reasoning Suite

Paper • 2602.20159 • Published Feb 23 • 519

Yiran Xie

AI & ML interests

Recent Activity

Organizations

gaoziha's activity