VALLE-X_JPVoiceCloner / requirements.txt
Mainlst
Hugging Face Space
32ecdb9
# --- Audio / signal processing ---
numpy==1.23.5 # pyopenjtalkと互換性のあるバージョンに固定
scipy
soundfile
torchaudio
# --- PyTorch 本体 & Vision ---
torch
torchvision
encodec
# --- トークン化/言語処理 ---
tokenizers
jieba
sudachipy
sudachidict_core
pypinyin
cn2an
langid
eng_to_ipa
unidecode
pyopenjtalk-prebuilt
openai-whisper
# --- 合成モデル依存/補助 ---
vocos
inflect
# --- Web UI ---
gradio>=4.44.1
nltk
# --- そのほかユーティリティ ---
wget
matplotlib