『徳島大学 教育・研究者情報データベース (EDB)』---[学外] /
ID: Pass:

登録内容 (EID=373077)

EID=373077EID:373077, Map:0, LastModified:2020年12月29日(火) 13:50:00, Operator:[西村 良太], Avail:TRUE, Censor:0, Owner:[西村 良太], Read:継承, Write:継承, Delete:継承.
種別 (必須): 国内講演発表 [継承]
言語 (必須): 日本語 [継承]
招待 (推奨):
審査 (推奨):
カテゴリ (推奨): 研究 [継承]
共著種別 (推奨): 単独著作 (徳島大学内の単一の研究グループ(研究室等)内の研究 (単著も含む)) [継承]
学究種別 (推奨): 博士前期課程学生による研究報告 [継承]
組織 (推奨): 1.徳島大学 [継承]
著者 (必須): 1. (英) taiga yamazaki (日) 山崎 大河 (読) やまざき たいが
役割 (任意): 第1著者(主著者) [継承]
貢献度 (任意): 50 [継承]
学籍番号 (推奨): **** [ユーザ]
[継承]
2.西村 良太 ([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.知能情報コース.情報工学講座]/[徳島大学.先端技術科学教育部.システム創生工学専攻.知能情報システム工学コース.基礎情報工学講座])
役割 (任意): 共著 [継承]
貢献度 (任意): 25 [継承]
学籍番号 (推奨):
[継承]
3.北岡 教英
役割 (任意): 共著 [継承]
貢献度 (任意): 25 [継承]
学籍番号 (推奨):
[継承]
題名 (必須): (英) Construction of End-to-End Japanese Speech Synthesis System with Emotional Expression  (日) 感情表現が可能なEnd-to-End日本語音声合成システムの構築   [継承]
副題 (任意):
要約 (任意): (英) In this research, we develop a Japanese speech synthesis system that can express emotions using a deep learning-based method.In this study, we construct a Japanese speech synthesizer that can express emotions using a method based on deep learning. Using Tacotron2 as a reference, we aim to build a speech synthesizer with expressive power close to that of human voice. The final training data is the voice of Ms. Tomonatsu Toto from the statistical corpus of voice actors (10 minutes each of normal, happy, and angry speech). However, since this dataset alone is not enough to train Tacotron2, we solved the problem by training a model on a large-scale corpus (LJ Speech) and adding additional training to this model. In addition, we express emotion by assigning an emotion label to each character in the input text. The model constructed by this method can express not only one emotion for an entire text, but also can change the emotion in the middle of the text.  (日) 本研究では,深層学習に基づいた手法で感情表現が可 能な日本語音声合成システムを構築する. Tacotron2 を参考にし, 人間の音声に近い表現力のある音声合成 器を構築することを目的とする. 声優統計コーパスの 藤東知夏氏の音声 (通常・喜び・怒りの感情で読まれ た音声が各10分) を最終的な学習データとする. しか し, このデータセットだけではTacotron2 の学習デー タとしては少ないので, 大規模コーパス (LJ Speech) でモデルを学習しておき, このモデルに追加学習をす ることで問題解決を行った. また, 入力テキストに対 して一文字ごとに感情のラベルを付与することで感 情表現を行う. この方法により構築されたモデルでは 一つのテキスト全体に対して一つの感情を表現でき るだけではなく, テキストの途中で感情を変えること ができる.   [継承]
キーワード (推奨):
発行所 (推奨):
誌名 (必須): 日本音響学会研究発表会講演論文集 ([日本音響学会])
ISSN (任意):
[継承]
(必須): 2-P2-12 [継承]
(必須): [継承]
(必須): 859 862 [継承]
都市 (必須):
年月日 (必須): 西暦 2020年 9月 9日 (令和 2年 9月 9日) [継承]
URL (任意):
DOI (任意):
PMID (任意):
CRID (任意):
WOS (任意):
Scopus (任意):
評価値 (任意):
被引用数 (任意):
指導教員 (推奨):
備考 (任意):

標準的な表示

和文冊子 ● 山崎 大河, 西村 良太, 北岡 教英 : 感情表現が可能なEnd-to-End日本語音声合成システムの構築, 日本音響学会研究発表会講演論文集, Vol.2-P2-12, 859-862, 2020年9月.
欧文冊子 ● yamazaki taiga, Ryota Nishimura and Norihide Kitaoka : Construction of End-to-End Japanese Speech Synthesis System with Emotional Expression, 日本音響学会研究発表会講演論文集, Vol.2-P2-12, 859-862, Sep. 2020.

関連情報

Number of session users = 2, LA = 0.74, Max(EID) = 415385, Max(EOID) = 1122356.