Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections trending this week

Qwen/Qwen3-235B-A22B-Thinking-2507-FP8

Text Generation • 235B • Updated Jul 30 • 28.4k • 73
Qwen/Qwen3-235B-A22B-Thinking-2507

Text Generation • 235B • Updated Aug 17 • 38.5k • • 389
Qwen/Qwen3-235B-A22B-Instruct-2507-FP8

Text Generation • 235B • Updated Sep 17 • 483k • 139
Qwen/Qwen3-235B-A22B-Instruct-2507

Text Generation • 235B • Updated Sep 17 • 120k • • 738

Nemotron-Post-Training-v3

Collection of datasets used in the post-training phase of Nemotron Nano v3.

nvidia/Nemotron-3-Nano-RL-Training-Blend

Preview • Updated 10 days ago • 413 • 10
nvidia/Nemotron-Science-v1

Viewer • Updated 10 days ago • 226k • 1.09k • 13
nvidia/Nemotron-Instruction-Following-Chat-v1

Viewer • Updated 10 days ago • 288k • 1.68k • 67
nvidia/Nemotron-Math-Proofs-v1

Viewer • Updated 7 days ago • 925k • 1.02k • 57

perception-encoder-audio-visual

facebook/pe-av-small

0.8B • Updated 1 day ago • 412 • 11
facebook/pe-av-base

1B • Updated 1 day ago • 164 • 6
facebook/pe-av-large

2B • Updated 1 day ago • 614 • 32
facebook/pe-av-small-16-frame

0.8B • Updated 1 day ago • 85 • 3

about 23 hours ago

LLaDA2.0: Scaling Up Diffusion Language Models to 100B

Paper • 2512.15745 • Published 15 days ago • 75
inclusionAI/LLaDA2.0-flash

Text Generation • 103B • Updated 6 days ago • 428 • 58
inclusionAI/LLaDA2.0-mini

Text Generation • 16B • Updated 6 days ago • 5.15k • 48
inclusionAI/LLaDA2.0-flash-preview

Text Generation • 103B • Updated 6 days ago • 125 • 69

Gemma 3 Release

google/gemma-3-270m-it

Text Generation • 0.3B • Updated Aug 14 • 174k • 496
google/gemma-3-270m

Text Generation • 0.3B • Updated Aug 14 • 60.7k • 938
google/gemma-3-4b-it

Image-Text-to-Text • 4B • Updated Mar 21 • 871k • 1.06k
google/gemma-3-4b-pt

Image-Text-to-Text • 4B • Updated Mar 21 • 52.3k • 130

google/gemma-scope-2

Updated 6 days ago • 39
google/gemma-scope-2-270m-pt

Updated 5 days ago • 3
google/gemma-scope-2-270m-it

Updated 3 days ago • 6
google/gemma-scope-2-1b-pt

Updated 5 days ago • 4

Unsloth Dynamic 2.0 Quants

New 2.0 version of our Dynamic GGUF + Quants. Dynamic 2.0 achieves superior accuracy & SOTA quantization performance.

about 22 hours ago

unsloth/Nemotron-3-Nano-30B-A3B-GGUF

Text Generation • 32B • Updated 9 days ago • 67.7k • 155
unsloth/GLM-4.7-GGUF

Text Generation • 358B • Updated 2 days ago • 23.4k • 41
unsloth/Qwen-Image-Edit-2511-GGUF

Image-to-Image • 20B • Updated 1 day ago • 33.6k • 108
unsloth/Devstral-Small-2-24B-Instruct-2512-GGUF

24B • Updated 10 days ago • 125k • 61

Artifacts for the Molmo2 data release

allenai/Molmo2-Cap

Viewer • Updated 9 days ago • 108k • 243 • 7
allenai/Molmo2-CapEval

Viewer • Updated 9 days ago • 693 • 292 • 1
allenai/Molmo2-VideoCapQA

Viewer • Updated 9 days ago • 951k • 111 • 2
allenai/Molmo2-VideoSubtitleQA

Viewer • Updated 9 days ago • 469k • 99 • 1

Nemotron-Pre-Training-Datasets

Large scale pre-training datasets used in the Nemotron family of models.

nvidia/Nemotron-Pretraining-Dataset-sample

Viewer • Updated 3 days ago • 27.7k • 1.03k • 33
nvidia/Nemotron-CC-Code-v1

Viewer • Updated 3 days ago • 216M • 1.98k • 11
nvidia/Nemotron-CC-v2.1

Viewer • Updated 3 days ago • 3.8B • 17.8k • 29
nvidia/Nemotron-Pretraining-Code-v2

Viewer • Updated 3 days ago • 836M • 4.96k • 75

Nemotron-Cascade

Scaling Cascaded Reinforcement Learning for General-Purpose Reasoning Models

nvidia/Nemotron-Cascade-8B

Text Generation • 8B • Updated 6 days ago • 1.69k • 40
nvidia/Nemotron-Cascade-8B-Thinking

Text Generation • 8B • Updated 6 days ago • 1.13k • 25
nvidia/Nemotron-Cascade-14B-Thinking

Text Generation • 15B • Updated 6 days ago • 2.11k • 43
nvidia/Nemotron-Cascade-8B-Intermediate-ckpts

Text Generation • Updated 6 days ago • 6

Qwen/Qwen3-235B-A22B-Thinking-2507-FP8

Text Generation • 235B • Updated Jul 30 • 28.4k • 73
Qwen/Qwen3-235B-A22B-Thinking-2507

Text Generation • 235B • Updated Aug 17 • 38.5k • • 389
Qwen/Qwen3-235B-A22B-Instruct-2507-FP8

Text Generation • 235B • Updated Sep 17 • 483k • 139
Qwen/Qwen3-235B-A22B-Instruct-2507

Text Generation • 235B • Updated Sep 17 • 120k • • 738

google/gemma-scope-2

Updated 6 days ago • 39
google/gemma-scope-2-270m-pt

Updated 5 days ago • 3
google/gemma-scope-2-270m-it

Updated 3 days ago • 6
google/gemma-scope-2-1b-pt

Updated 5 days ago • 4

Nemotron-Post-Training-v3

Collection of datasets used in the post-training phase of Nemotron Nano v3.

nvidia/Nemotron-3-Nano-RL-Training-Blend

Preview • Updated 10 days ago • 413 • 10
nvidia/Nemotron-Science-v1

Viewer • Updated 10 days ago • 226k • 1.09k • 13
nvidia/Nemotron-Instruction-Following-Chat-v1

Viewer • Updated 10 days ago • 288k • 1.68k • 67
nvidia/Nemotron-Math-Proofs-v1

Viewer • Updated 7 days ago • 925k • 1.02k • 57

Unsloth Dynamic 2.0 Quants

New 2.0 version of our Dynamic GGUF + Quants. Dynamic 2.0 achieves superior accuracy & SOTA quantization performance.

about 22 hours ago

unsloth/Nemotron-3-Nano-30B-A3B-GGUF

Text Generation • 32B • Updated 9 days ago • 67.7k • 155
unsloth/GLM-4.7-GGUF

Text Generation • 358B • Updated 2 days ago • 23.4k • 41
unsloth/Qwen-Image-Edit-2511-GGUF

Image-to-Image • 20B • Updated 1 day ago • 33.6k • 108
unsloth/Devstral-Small-2-24B-Instruct-2512-GGUF

24B • Updated 10 days ago • 125k • 61

perception-encoder-audio-visual

facebook/pe-av-small

0.8B • Updated 1 day ago • 412 • 11
facebook/pe-av-base

1B • Updated 1 day ago • 164 • 6
facebook/pe-av-large

2B • Updated 1 day ago • 614 • 32
facebook/pe-av-small-16-frame

0.8B • Updated 1 day ago • 85 • 3

Artifacts for the Molmo2 data release

allenai/Molmo2-Cap

Viewer • Updated 9 days ago • 108k • 243 • 7
allenai/Molmo2-CapEval

Viewer • Updated 9 days ago • 693 • 292 • 1
allenai/Molmo2-VideoCapQA

Viewer • Updated 9 days ago • 951k • 111 • 2
allenai/Molmo2-VideoSubtitleQA

Viewer • Updated 9 days ago • 469k • 99 • 1

about 23 hours ago

LLaDA2.0: Scaling Up Diffusion Language Models to 100B

Paper • 2512.15745 • Published 15 days ago • 75
inclusionAI/LLaDA2.0-flash

Text Generation • 103B • Updated 6 days ago • 428 • 58
inclusionAI/LLaDA2.0-mini

Text Generation • 16B • Updated 6 days ago • 5.15k • 48
inclusionAI/LLaDA2.0-flash-preview

Text Generation • 103B • Updated 6 days ago • 125 • 69

Nemotron-Pre-Training-Datasets

Large scale pre-training datasets used in the Nemotron family of models.

nvidia/Nemotron-Pretraining-Dataset-sample

Viewer • Updated 3 days ago • 27.7k • 1.03k • 33
nvidia/Nemotron-CC-Code-v1

Viewer • Updated 3 days ago • 216M • 1.98k • 11
nvidia/Nemotron-CC-v2.1

Viewer • Updated 3 days ago • 3.8B • 17.8k • 29
nvidia/Nemotron-Pretraining-Code-v2

Viewer • Updated 3 days ago • 836M • 4.96k • 75

Gemma 3 Release

google/gemma-3-270m-it

Text Generation • 0.3B • Updated Aug 14 • 174k • 496
google/gemma-3-270m

Text Generation • 0.3B • Updated Aug 14 • 60.7k • 938
google/gemma-3-4b-it

Image-Text-to-Text • 4B • Updated Mar 21 • 871k • 1.06k
google/gemma-3-4b-pt

Image-Text-to-Text • 4B • Updated Mar 21 • 52.3k • 130

Nemotron-Cascade

Scaling Cascaded Reinforcement Learning for General-Purpose Reasoning Models

nvidia/Nemotron-Cascade-8B

Text Generation • 8B • Updated 6 days ago • 1.69k • 40
nvidia/Nemotron-Cascade-8B-Thinking

Text Generation • 8B • Updated 6 days ago • 1.13k • 25
nvidia/Nemotron-Cascade-14B-Thinking

Text Generation • 15B • Updated 6 days ago • 2.11k • 43
nvidia/Nemotron-Cascade-8B-Intermediate-ckpts

Text Generation • Updated 6 days ago • 6

Previous
1
2
3
4
...
17,128
Next

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs