MLX Speech Models

aufklarer 's Collections

MLX Speech Models

CoreML Speech Models

updated 1 day ago

Speech AI models for Apple Silicon via MLX. ASR, TTS, VAD, diarization, speaker embedding.

Upvote

aufklarer/Qwen3-ASR-0.6B-MLX-4bit

0.3B • Updated Apr 12 • 152k • 3
aufklarer/WeSpeaker-ResNet34-LM-MLX

Audio Classification • 6.63M • Updated Apr 12 • 145k • 2
aufklarer/PersonaPlex-7B-MLX-4bit

Audio-to-Audio • Updated Apr 12 • 97.3k • 33
aufklarer/Qwen3-ForcedAligner-0.6B-4bit

Audio Classification • 0.4B • Updated Apr 12 • 45.8k • 1
aufklarer/Pyannote-Segmentation-MLX

Voice Activity Detection • 1.49M • Updated Apr 12 • 6.75k
aufklarer/Qwen3-ASR-1.7B-MLX-8bit

0.8B • Updated Apr 12 • 4.46k • 3
aufklarer/Silero-VAD-v5-MLX

Voice Activity Detection • 309k • Updated Apr 12 • 4.05k • 3
aufklarer/Qwen3-ASR-0.6B-MLX-8bit

0.4B • Updated Apr 12 • 2.67k • 1
aufklarer/Qwen3-ASR-1.7B-MLX-4bit

Automatic Speech Recognition • 0.9B • Updated Apr 12 • 905 • 2
aufklarer/Qwen3-TTS-12Hz-0.6B-Base-MLX-4bit

0.4B • Updated Apr 12 • 405
aufklarer/CosyVoice3-0.5B-MLX-4bit

Text-to-Speech • Updated 24 days ago • 494
aufklarer/PersonaPlex-7B-MLX-8bit

Audio-to-Audio • Updated Apr 12 • 249 • 8
aufklarer/Qwen3-ForcedAligner-0.6B-8bit

Audio Classification • 0.5B • Updated Apr 12 • 84
aufklarer/Qwen3-ForcedAligner-0.6B-bf16

Audio Classification • 0.9B • Updated Apr 12 • 80
aufklarer/Qwen3-TTS-12Hz-1.7B-Base-MLX-8bit

0.8B • Updated Apr 12 • 73
aufklarer/Qwen3-TTS-12Hz-0.6B-CustomVoice-MLX-4bit

0.4B • Updated Apr 12 • 122
aufklarer/Qwen3-TTS-12Hz-1.7B-Base-MLX-4bit

0.6B • Updated Apr 12 • 134
aufklarer/Qwen3-TTS-12Hz-0.6B-Base-MLX-8bit

0.5B • Updated Apr 12 • 37
aufklarer/Omnilingual-ASR-CTC-7B-MLX-8bit

Automatic Speech Recognition • 2B • Updated Apr 12 • 28
aufklarer/Omnilingual-ASR-CTC-300M-MLX-4bit

Automatic Speech Recognition • 62.3M • Updated Apr 12 • 67
aufklarer/Omnilingual-ASR-CTC-3B-MLX-8bit

Automatic Speech Recognition • 0.9B • Updated Apr 12 • 19
aufklarer/Omnilingual-ASR-CTC-1B-MLX-8bit

Automatic Speech Recognition • 0.3B • Updated Apr 12 • 10
aufklarer/OpenUnmix-HQ-MLX

Audio-to-Audio • Updated Mar 25 • 94
aufklarer/Qwen3.5-0.8B-Chat-MLX

Text Generation • Updated 9 days ago • 313 • 1
aufklarer/Omnilingual-ASR-CTC-7B-MLX-4bit

Automatic Speech Recognition • 1B • Updated Apr 12 • 162
aufklarer/Omnilingual-ASR-CTC-3B-MLX-4bit

Automatic Speech Recognition • 0.5B • Updated Apr 12 • 10
aufklarer/Omnilingual-ASR-CTC-1B-MLX-4bit

Automatic Speech Recognition • 0.2B • Updated Apr 12 • 43
aufklarer/OpenUnmix-L-MLX

Audio-to-Audio • Updated Mar 25 • 9
aufklarer/Omnilingual-ASR-CTC-300M-MLX-8bit

Automatic Speech Recognition • 0.1B • Updated Apr 12 • 14
aufklarer/VibeVoice-Realtime-0.5B-MLX-INT4

Text-to-Speech • 0.4B • Updated Apr 25 • 57
aufklarer/VibeVoice-Realtime-0.5B-MLX-INT8

Text-to-Speech • 0.5B • Updated Apr 25 • 24
aufklarer/VibeVoice-1.5B-MLX-INT4

Text-to-Speech • 0.8B • Updated Apr 25 • 83
aufklarer/MADLAD400-3B-MT-MLX

Translation • Updated 9 days ago • 74

Note Many-to-many translation across 400+ languages (T5 v1.1, INT4/INT8).
aufklarer/CosyVoice3-0.5B-MLX-8bit

Text-to-Speech • Updated 24 days ago • 87

Note 8-bit LLM variant — bundled S3-Tokenizer-v3 for zero-shot voice cloning
aufklarer/Hibiki-Zero-3B-MLX-4bit

Updated 28 days ago • 40
aufklarer/Hibiki-Zero-3B-MLX-8bit

Updated 28 days ago • 16
aufklarer/VoxCPM2-MLX-bf16

Text-to-Speech • 2B • Updated 23 days ago • 199
aufklarer/VoxCPM2-MLX-int4

Text-to-Speech • 0.6B • Updated 23 days ago • 104
aufklarer/VoxCPM2-MLX-int8

Text-to-Speech • 0.8B • Updated 23 days ago • 123
aufklarer/MAGNeT-Small-30secs-MLX-4bit

Text-to-Audio • 80.6M • Updated 17 days ago • 127
aufklarer/MAGNeT-Small-30secs-MLX-8bit

Text-to-Audio • 0.1B • Updated 17 days ago • 49
aufklarer/MAGNeT-Medium-30secs-MLX-4bit

Text-to-Audio • 0.3B • Updated 17 days ago • 45
aufklarer/MAGNeT-Medium-30secs-MLX-8bit

Text-to-Audio • 0.5B • Updated 17 days ago • 44
aufklarer/Instruct-MusicGen-MLX-4bit

Text-to-Audio • 0.8B • Updated 16 days ago • 143
aufklarer/FlashSR-MLX-4bit

Audio-to-Audio • 0.1B • Updated 16 days ago • 56
aufklarer/FlashSR-MLX-8bit

Audio-to-Audio • 0.2B • Updated 16 days ago • 74
aufklarer/AudioSR-MLX-4bit

Audio-to-Audio • 0.1B • Updated 15 days ago • 68
aufklarer/AudioSR-MLX-8bit

Audio-to-Audio • 0.2B • Updated 15 days ago • 23
aufklarer/Magpie-TTS-Multilingual-357M-MLX-8bit

Text-to-Speech • Updated 9 days ago • 65
aufklarer/Magpie-TTS-Multilingual-357M-MLX-4bit

Text-to-Speech • Updated 9 days ago • 166
aufklarer/Stable-Audio-3-DiT-Medium-MLX-8bit

Text-to-Audio • Updated 9 days ago • 62
aufklarer/Stable-Audio-3-DiT-Small-Music-MLX-4bit

Text-to-Audio • Updated 9 days ago • 120 • 1
aufklarer/CosyVoice3-0.5B-MLX-bf16

Text-to-Speech • Updated 10 days ago • 62
aufklarer/Nemotron-3.5-ASR-Streaming-0.6B-MLX-bf16

Automatic Speech Recognition • 0.6B • Updated 1 day ago • 44 • 1
aufklarer/Nemotron-3.5-ASR-Streaming-0.6B-MLX-8bit

Automatic Speech Recognition • 0.2B • Updated 1 day ago • 46 • 1
aufklarer/Nemotron-3.5-ASR-Streaming-0.6B-MLX-4bit

Automatic Speech Recognition • 0.2B • Updated 1 day ago • 74 • 1

Upvote

Collection guide
Browse collections