Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

250

Base only

Active filters: sglang

Jiunsong/SuperGLM-5.2-abliterated-NVFP4

Text Generation • 381B • Updated 7 days ago • 2.59k • 52

nvidia/Cosmos3-Nano

16B • Updated 12 days ago • 239k • 313

bottlecapai/ThinkingCap-Qwen3.6-27B-FP8

Image-Text-to-Text • 28B • Updated 5 days ago • 22.6k • 25

nvidia/Cosmos3-Super

65B • Updated 12 days ago • 79.2k • 209

z-lab/Qwen3.6-35B-A3B-DFlash

Text Generation • 0.4B • Updated Jun 19 • 210k • 272

nvidia/Cosmos3-Super-Text2Image

Text-to-Image • 65B • Updated 12 days ago • 27k • 168

nvidia/Cosmos3-Super-Image2Video

Image-to-Video • 65B • Updated 12 days ago • 6.24k • 143

modal-labs/Inkling-NVFP4-DFlash

Text Generation • 3B • Updated 6 days ago • 1.07k • 3

ressl/MiniMax-M3-uncensored-NVFP4

Text Generation • 246B • Updated 6 days ago • 508 • 3

poolside/Laguna-M.1

Text Generation • 226B • Updated 8 days ago • 1.89k • 121

PhalaCloud/GLM-5.2-W4AFP8

Text Generation • 392B • Updated about 17 hours ago • 48.4k • 39

ewinregirgojr/MiniCPM5-1B-Agentic-Tooluse-Merged-FP16

Text Generation • 1B • Updated 12 days ago • 1.74k • 3

compute1/Agents-A1-GPTQ-INT4-Sym

Text Generation • 7B • Updated 11 days ago • 473 • 2

tugot17/LFM2.5-1.2B-Instruct-DSpark-5L

0.3B • Updated 11 days ago • 514 • 2

z-lab/Qwen3.5-35B-A3B-DFlash

Text Generation • 0.4B • Updated Jun 19 • 6.05k • 42

AxionML/Qwen3.5-9B-NVFP4

Image-Text-to-Text • 7B • Updated Mar 3 • 104k • 19

z-lab/Qwen3.5-9B-DFlash

Text Generation • 1B • Updated Jun 19 • 13.3k • 38

z-lab/Qwen3.5-27B-DFlash

Text Generation • 2B • Updated Jun 19 • 98.5k • 111

poolside/Laguna-M.1-NVFP4

Text Generation • 131B • Updated 8 days ago • 1.98k • 12

88plug/Qwen3.6-35B-A3B-W8A16

Image-Text-to-Text • 35B • Updated 7 days ago • 365 • 1

88plug/MiniCPM-o-4.5-W4A16

Image-Text-to-Text • 9B • Updated 7 days ago • 569 • 1

88plug/Qwen3-Omni-30B-W4A16

Text Generation • 35B • Updated 11 days ago • 2.61k • 1

Anbeeld/Qwen3.5-9B-DFlash-GGUF

Feature Extraction • 1B • Updated 3 days ago • 2.51k • 4

MarshallHD/LFM2.5-230M-NVFP4

Text Generation • 0.2B • Updated 24 days ago • 204 • 2

trymirai/weaver

Other • Updated 12 days ago • 8

tugot17/LFM2.5-8B-A1B-DSpark-2L

0.2B • Updated 8 days ago • 318 • 1

SurfaceData/llava-v1.6-mistral-7b-sglang

Image-Text-to-Text • 8B • Updated Mar 7, 2024 • 8 • 9

SurfaceData/llava-v1.6-vicuna-7b-sglang

Image-Text-to-Text • 7B • Updated Mar 7, 2024 • 8 • 1

tclf90/qwen2.5-72b-instruct-gptq-int4

Text Generation • 73B • Updated May 12, 2025 • 88 • 2

tclf90/qwen2.5-72b-instruct-gptq-int3

Text Generation • 69B • Updated May 12, 2025 • 154