Xiaoqing Li's picture

1

Xiaoqing Li

LLIXQ

LLIXQ

AI & ML interests

None yet

Organizations

None yet

authored 2 papers 8 months ago

HybridNorm: Towards Stable and Efficient Transformer Training via Hybrid Normalization

Paper • 2503.04598 • Published Mar 6 • 21

Scale-Distribution Decoupling: Enabling Stable and Effective Training of Large Language Models

Paper • 2502.15499 • Published Feb 21 • 15