Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Shiwon Jeong's picture

2 1

Shiwon Jeong

sebastianrcnt

AI & ML interests

None yet

Organizations

None yet

Collections 1

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published Feb 19 • 69
Small Models Struggle to Learn from Strong Reasoners

Paper • 2502.12143 • Published Feb 17 • 39
HeadInfer: Memory-Efficient LLM Inference by Head-wise Offloading

Paper • 2502.12574 • Published Feb 18 • 12
Large Language Diffusion Models

Paper • 2502.09992 • Published Feb 14 • 122

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published Feb 19 • 69
Small Models Struggle to Learn from Strong Reasoners

Paper • 2502.12143 • Published Feb 17 • 39
HeadInfer: Memory-Efficient LLM Inference by Head-wise Offloading

Paper • 2502.12574 • Published Feb 18 • 12
Large Language Diffusion Models

Paper • 2502.09992 • Published Feb 14 • 122

models 0

None public yet

datasets 0

None public yet

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs