ユーザ用ツール

サイト用ツール


音声合成

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
音声合成 [2021/05/27 17:43] – [音声合成] nabezo音声合成 [2023/04/17 07:41] (現在) nabezo
行 1: 行 1:
 ====== 音声合成 ====== ====== 音声合成 ======
 +{{tag>音声合成}}
 +[[jtalk]]
 +[[julius]]
 openjtalk openjtalk
 +[[sapi]]
 +[[SpeechSynthesizer]]
 ===== 参考 ===== ===== 参考 =====
 +音響モデルの自作
 https://blog.backspace.fm/%E3%81%82%E3%82%89%E3%82%86%E3%82%8B%E7%8F%BE%E5%AE%9F%E3%82%92%E3%81%99%E3%81%B9%E3%81%A6%E3%81%AD%E3%81%98%E6%9B%B2%E3%81%92%E3%81%A6%E9%9F%B3%E9%9F%BF%E3%83%A2%E3%83%87%E3%83%AB%E3%82%92%E8%87%AA%E4%BD%9C%E3%81%97%E3%81%9F%E3%81%84%E3%81%AE%E3%81%A7%E3%81%BE%E3%81%9A%E3%81%AF%E8%B3%87%E6%96%99%E9%9B%86%E3%82%81%E3%81%8B%E3%82%89-2f1a7721db5e https://blog.backspace.fm/%E3%81%82%E3%82%89%E3%82%86%E3%82%8B%E7%8F%BE%E5%AE%9F%E3%82%92%E3%81%99%E3%81%B9%E3%81%A6%E3%81%AD%E3%81%98%E6%9B%B2%E3%81%92%E3%81%A6%E9%9F%B3%E9%9F%BF%E3%83%A2%E3%83%87%E3%83%AB%E3%82%92%E8%87%AA%E4%BD%9C%E3%81%97%E3%81%9F%E3%81%84%E3%81%AE%E3%81%A7%E3%81%BE%E3%81%9A%E3%81%AF%E8%B3%87%E6%96%99%E9%9B%86%E3%82%81%E3%81%8B%E3%82%89-2f1a7721db5e
  
 HTSの話者適応学習のデモの動かし方 HTSの話者適応学習のデモの動かし方
 http://akihiro0105.blog55.fc2.com/blog-category-8.html http://akihiro0105.blog55.fc2.com/blog-category-8.html
 +
 +PowerShellで音声合成を試してみた
 +https://blog.serverworks.co.jp/powershell-to-speak-voice
  
 ===== HTS ===== ===== HTS =====
 +隠れマルコフモデルに基づく日本語音声合成ソフトウェア入門
 +https://www.jstage.jst.go.jp/article/isciesci/62/2/62_57/_pdf  \\
 +この資料をもとにしてみた
 +
 +日本人ALS患者のための日英バイリンガル音声合成システムの構築
 +http://splab.net/papers/2007/2007_22.pdf
 +
 +HTSの学習用データの作成
 +http://cube370.wiki.fc2.com/wiki/HTS%E3%81%AE%E5%AD%A6%E7%BF%92%E7%94%A8%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E4%BD%9C%E6%88%90
 +
 HTSによるHMM音声合成 HTSによるHMM音声合成
 http://speechresearch.fiw-web.net/108.html http://speechresearch.fiw-web.net/108.html
行 22: 行 41:
 初心者が行う話者適応モデル作成1  初心者が行う話者適応モデル作成1 
 https://ragolun.exblog.jp/23144146/ https://ragolun.exblog.jp/23144146/
- 
-隠れマルコフモデルに基づく日本語音声合成ソフトウェア入門 
-https://www.jstage.jst.go.jp/article/isciesci/62/2/62_57/_pdf 
-  コマンドが乗っている 
-   
  
 OpenJTalk用の音響モデルを作成中 OpenJTalk用の音響モデルを作成中
 http://www.vsrx.work/article/469787685.html http://www.vsrx.work/article/469787685.html
 +
 +==== 環境作成 ubuntu20.04====
 +ubuntu20.04でのインストール方法  \\
 +ダウンロードしておく
 +  tar jxvf ./downloadfile/HTS-2.3_for_HTK-3.4.1.tar.bz2
 +  tar jxvf ./downloadfile/HTS-demo_NIT-ATR503-M001.tar.bz2
 +  tar zxvf ./downloadfile/hts_engine_API-1.10.tar.gz
 +  tar zxvf ./downloadfile/SPTK-3.9.tar.gz
 +  tar zxvf ./downloadfile/HTK-3.4.1.tar.gz
 +  
 +  cd hts_engine_API-1.10
 +  ./configure --prefix=/usr/local
 +  make
 +  sudo make install
 +  cd ..
 +  
 +  cd htk
 +  patch -d . -p1 < ../HTS-2.3_for_HTK-3.4.1.patch
 +  ./configure --prefix=/usr/local
 +  make all
 +  sudo make install
 +  cd ..
 +  
 +  cd SPTK-3.9
 +  ./configure --prefix=/usr/local
 +  make
 +  sudo make install
 +  cd ..
 +  
 +  cd ./HTS-demo_NIT-ATR503-M001/
 +  ./configure --with-sptk-search-path=/usr/local/bin 
 +            --with-hts-search-path=/usr/local/bin   
 +            --with-hts-engine-search-path=/usr/local/bin
 +  make
 +最後のmakeでエラーがでたので、HTS_demo_NIT-ATR503-M001/script/Training.plを54行目requreの直前に
 +  use lib '.';
 +を追加して再度make
 +
 +
 +
 +
  
 ===== Merlin ===== ===== Merlin =====
音声合成.1622105023.txt.gz · 最終更新: 2021/05/27 17:43 by nabezo