EPISODE · Jun 24, 2026 · 2 MIN
zhenye234/CoMoSpeech
from Kana & Mari’s SoundRepos · host Kana & Mari
CoMoSpeechという、テキストから音声・歌声を生成するための拡散モデル/Consistency Modelベースの音声合成リポジトリです。1ステップ生成による高速推論を目指しており、教師モデルの蒸留による学生モデル学習、推論、LJSpeechを用いた学習コードが含まれています。HiFi-GAN вокoder を使ってメルスペクトログラムから波形を生成します。
What this episode covers
CoMoSpeechという、テキストから音声・歌声を生成するための拡散モデル/Consistency Modelベースの音声合成リポジトリです。1ステップ生成による高速推論を目指しており、教師モデルの蒸留による学生モデル学習、推論、LJSpeechを用いた学習コードが含まれています。HiFi-GAN вокoder を使ってメルスペクトログラムから波形を生成します。
NOW PLAYING
zhenye234/CoMoSpeech
No transcript for this episode yet
Similar Episodes
Jul 22, 2025 ·55m
Jul 15, 2025 ·47m
Jul 8, 2025 ·61m
Jun 17, 2025 ·43m