TTS & Speech to Text - a samsam55 Collection

samsam55 's Collections

Run on CPU Optimizations

World View Creation (out painting 3D)

Visual Multi Modal LLM

TTS & Speech to Text

Misc

Agents

3D Models & Modeling

TTS & Speech to Text

updated 12 days ago

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Paper • 2510.03117 • Published 25 days ago • 11
ResembleAI/chatterbox

Text-to-Speech • Updated Sep 23 • 868k • • 1.24k
thewh1teagle/phonikud

0.3B • Updated Aug 24 • 149
UniMoE-Audio: Unified Speech and Music Generation with Dynamic-Capacity MoE

Paper • 2510.13344 • Published 13 days ago • 61